Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen zu finden sind. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.
Ich möchte die folgenden Daten in zwei Spalten teilen, latitude und longitude und setzen Sie sie in einen Datenframe ein.
0 (45.349586099999996, -75.81031967988278)
1 (-37.77922725, 175.2010323246593)
2 (-42.9945669, 170.7100413)
3 (-39.2711067, 17....
3 Juni 2021 im 02:48
Ich würde gerne wissen, wie Zeilen in einem Pandas-Dataframe aufbewahrt werden, in dem mehr als drei seiner Säulen Werte von mehr als 0,8 haben, ein Beispiel:
companyInfo = pd.DataFrame()
companyInfo['col1'] = [0,0,0,0,0]
companyInfo['col2'] = [0,0.9,0,0,0]
companyInfo['col3'] = [0,0,0.85,0,0]
compa....
Ich möchte die .Query-Methode verwenden, um eine Spalte in einem Datenframe mit einer Variablen zu filtern, aber es funktioniert nicht mit einer Variablen, nur einer Zeichenfolge. Jeder weiß, wie er mit einer Variablen arbeiten kann? Vielen Dank.
import pandas as pd
var="A"
source = {'COL1': ['....
Ich verwende den folgenden Code
import pandas as pd
pd.to_datetime(sf['date'][1:4], format('%m-%d-%Y'))
Das dataframe ist wie folgt:
sf['date'][1:4]
1 6-1-2021
2 6-11-2021
3 6-12-2021
4 8-1-2021
Name: date, dtype: object
Ich erhalte folgenden Fehler:
File "C:\Program Files\Python38\lib....
3 Juni 2021 im 01:16
Ich habe das heute bemerkt und wollte fragen, weil ich etwas verwirrt bin.
Lasst uns sagen, wir haben zwei df's
df = pd.DataFrame(np.random.randint(0,9,size=(5,3)),columns = list('ABC'))
A B C
0 3 1 6
1 2 4 0
2 8 8 0
3 8 6 7
4 4 5 0
df2 = pd.DataFrame(np.random....
3 Juni 2021 im 01:13
Wie kann ich alle Zeilen in einem Datenframe mit Werten in der Nähe von Nummern, die ich eingeben, ausgeben?
import pandas as pd
data = {'A':[1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
'B':[11, 12, 13, 14, 15, 16, 17, 18, 19, 20]}
df = pd.DataFrame(data, columns=['A', 'B'])
So eine Funktion wie near....
Ich habe also einen ursprünglichen Datensatz: original_data_set
Dass ich aus einer CSV-Datei einlest und dann nach Feld trennen:
Wie so, loan_df = re_df.loc[re_df.field == 'loan_amount'] home_df = re_df.loc[re_df.field == 'home_value']}
Welche Renditen Darlehen home_vals
Ich möchte über das Wertef....
Ich habe einen Datenrahmen df:
year ID category
1 1 0
2 1 1
3 1 1
4 1 0
1 2 0
2 2 0
3 2 1
4 2 0
Ich möchte eine neue Säule erstellen, z.
year ID category new_category
1 1 ....
Ich habe eine Datenrahmenspalte, die so aussieht:
df['out_column']
0 Out 0: 0.024 Out 1: 0.005
1 Out 0: 0.024 Out 1: 0.009
2 Out 0: 0.024 Out 1: 0.009
3 Out 0: 0.024 Out 1: 0.01
4 Out 0: 0.024 Out 1: 0.011
5 Out 0: 0.017 Out 1: 0.018
6....
Ich habe zwei Arrays. Darunter ist eine Vorschau von jedem angezeigt:
[0.25 0.5 0.75 ... 0. 0. 0.25]
[0.51725357 0.51725357 0.51725357 ... 0.56406901 0.51725357 0.51725357]
Sie können feststellen, dass das zweite Array Werte hat, die sich oft wiederholen. Was ich tun möchte, ist, zwei neue Arr....
Ich habe den folgenden Datenrahmen
Charge_type Amount Quantity
Credit 2.5 3
Credit 3.24 2
Debit 5.98 6
Ich brauche den folgenden Ausgang, wenn lohnt_type ein "Kredit" ist, dann multiplizieren Sie "Menge '* -1 und' Menge '* -1, um das folgende Ergebnis zu erhalten:
Char....
Ich habe einen Pandas-DatasRame mit mehreren Spalten, einschließlich 'Text', 'Start', 'Tend', und ich möchte eine neue Spalte erstellen, die einen Teilstring von 'Text' basierend auf dem Start 'und' Tend 'erstellt.
text start tend subtext
'Sample text' 2 ....
Wenn ich ein tiefes Lernmodell für den automatischen Quellcode-Kommentar erstellen kann. Ich habe den obigen Fehler bekommen. Ich habe das Transformator-Modell für das Erstellen des Modells verwendet. Kann mir jemand eine Lösung geben?....
2 Juni 2021 im 22:17
Ich habe eine Excel-Datei und ich habe Listen aus den Säulen erstellt. Das Problem ist, dass die Reihen der Säulen nicht gleich sind. Daher habe ich mehrere 'Nan'-Werte an den Enden der Listen. Ich habe versucht, sie mit Dropna () -Methode zu löschen, aber es gibt immer noch die 'Nan'-Werte. Hier is....
Ich erstellung ein Datensatz von exportierten WhatsApp-Chats. Um die Daten zu manipulieren, muss ich jede Zeile des Chat-Protokolls in date, time, sender, sender, message (Säulen) aufteilen.
import pandas as pd
import re
column_names = ["date", "time", "sender", "message"]
data = pd.read_table("dat....
2 Juni 2021 im 21:34
Gibt es einen einfachen Weg, um Reihen in eine andere Zeile zu ordnen?
Ich möchte das unbekannte Land zwischen allen anderen Ländern aufteilen. In diesem Beispiel 2 Länder. For a given date, UK = UK + (UK*Unknown)/sum(UK + US)
E.g. UK = 1 + (1*5)/(1+7) = 1 + 5/8 = 1.625
df
date country....
2 Juni 2021 im 19:33
Neu bei Python und Pandas, lernt das Lernen, wie man mit einigen Daten umgehen kann, ohne den für den Schleifenansatz zu verwenden.
Ich habe einen Datenframe, der 3 Spalten enthält:
Datum Preis Erhöhen, ansteigen
Wie kann ich den Preisanstieg vom vorherigen Tag bis heute berechnen (ohne für Schleife....
Bei der Verwendung von Apply () -Methode auf dem StackOverflow-Datensatz erhielt ich einen Fehler. Ich habe versucht, die Länge jeder Antwort in der Säule "Hobbyist" zu finden. Der verwendete Code, den ich verwendete, war:
result = pd. read_csv ("survey_results_public.csv")
result ["HOBBYIST"]. appl....
2 Juni 2021 im 18:59
Ich habe zwei Datenrahmen, die so aussehen:
#df1
id | count | mindate
x 3 01/01/2020
y 4 01/02/2019
z 5 01/03/2019
#df2
id | date
x 01/01/2019
x 01/02/2019
x 01/01/2020
y 01/02/2018
y ....
Ich versuche, zwei Datenframes basierend auf einer Spalte zusammenzuführen. Idealerweise möchte ich Startwith () verwenden, da sie nicht immer genaue Übereinstimmungen sind.
Df1:
id symbol
0 123 CCH
1 456 IAC1
2 789 MTCH1
3 987 CVLG
Df2
id ....
Ich versuche, eine Themenanalyse durchzuführen, und ich muss eine Spalte in Dataframe zusammenbrechen, die aus Listen besteht, in eine Liste von Wörtern.
Also hier ist eine Annäherung an das, was meine Daten aussehen:
import pandas as pd
d = {'Case': ["[wait, information, employer]","[case, assign, ....
Ich habe zwei Datenframes mit mehreren Säulen.
Ich möchte DF1 ['ID'] und DF2 ['ID'] vergleichen und ein neues DF mit einer anderen Spalte zurückgeben, die den Übereinstimmungswert aufweist. Beispiel:
df1
**id** **Name**
1 1 Paul
2 2 Jean
3 3 Alicia
4 4 Jennifer
df2
....
Ich habe ein paar Fragen zu JSON in Pandas! Ich habe die in einem Datenframe geladenen Daten erhalten und kann mit dem untenstehenden Abfragecode effektiv suchen. Drei Fragen, die ich habe:
Wie kann ich die einzelnen Stücke von 'Coord' bekommen (d. H. 'Coord.lon') Wie legige ich bestimmte Spalten in....
Ich versuche, eine Dataframe-Serie zu explodieren, die die Liste der Liste behält, um einen anderen Index zu erstellen.
df = pd.DataFrame({'A': [[255, 255, 255], [0, 0, 0], [255, 255, 255]], 'B': [[255, 255, 255], [0, 0, 0], [255, 255, 255]]})
print(df)
A B
0 [255, 255....
Ich habe ein Datensatz mit Artikeln von {pubmed. Dataframe sieht so aus:
df = pd.DataFrame({"section_names":[["introduction","methods","section1","another section","discussion"],
["introduction","methods","discussion","other section","one more section","conclusion"]]....