SQLDF ist ein R-Paket zum Ausführen von SQL-Anweisungen in R-Datenrahmen.
Ich arbeite an einfachen Daten wie folgt:
teacher student
12 409
43 403
12 415
12 409
67 311
19 201
Ich versuche, die Einträge abzurufen, in denen lehrer = 12 und student = 409 ist. Ich verwende den folgenden Befehl:
library(sqldf)
sqldf('SELECT *
....
Aus irgendeinem Grund kehre ich nur eine Zeile zurück, wenn es auf SQL Server geht, bin ich die richtige Anzahl von Zeilen zurück. Sqldf:
CustomerCodingChangesT <- sqldf("
SELECT c.CustID as ID
, c.ReverseSupplier as Supplier
, c.ReverseCustomerCode as Code
....
Ich versuche, SQL-Abfrage mit SQLDF und Data.table zu implementieren. Ich muss dies separat mit diesen 2 verschiedenen Bibliotheken tun. Leider kann ich nicht das gleiche Ergebnis mit Data.table erstellen.
library(sqldf)
library(data.table)
Id <- c(1,2,3,4)
HasPet <- c(0,0,1,1)
Age ....
26 Apr. 2021 im 13:11
Ich habe also ungefähr 500 TXT-Datendateien, die alle 8 Spalten enthalten. Jede Datendatei hat in jeder Spalte dieselbe Anzahl von Werten (Zeilen). Wenn Sie die Datendatei1 und die Datendatei2 vergleichen, haben sie meistens eine unterschiedliche Anzahl von Zeilen, aber einige dieser Zeilenwerte s....
Ich möchte ein erstes Datum finden, das größer als das angegebene Datum in einer Spalte ist. z.B:
Pnp, Date1 Date2
A100,1/1/2020,1/1/2020
A100,1/1/2020,1/7/2020
A100,1/1/2020,1/1/2021
A100,1/1/2020,1/7/2021
Beispielausgabe:
Pnp,Date1,Date2,Date3,New Column
A100,1/1/2020,1/1/2020, 1/7/20....
Gibt es in R eine Möglichkeit, mit dem Paket sqldf alle Spalten außer einer auszuwählen?....
Ich möchte in der Lage sein, die Eingabe unter keywordN durch tiab LIKE '%keywordN%' zu ersetzen, um die Schlüsselworteingabe in eine SQL-Zeichenfolge in R übersetzen zu können. Schlüsselwörter sind Wörter oder Wortkombinationen, zum Beispiel: { {X2}}
input = "((keyword1) OR (keyword2) AND (keyword3....
Ich versuche, einen Datensatz in R zu laden, der USERID und Date enthält. Ich versuche, das MIN (DATE) für die Benutzer-ID mit sqldf abzurufen, habe aber anscheinend ein Problem mit dem Ergebnis.
Ich habe die Datumsspalte mit posixct konvertiert und den Spaltentyp überprüft, und es wurde doppelt ang....
Ich möchte eine einzelne Datenspalte summieren, die von einer sqldf-Funktion in R ausgegeben wurde.
Ich habe eine CSV. Datei, die Gruppierungen von Websites mit einer eindeutigen ID und den zugehörigen Bereichen enthält. Beispielsweise:
occurrenceID sarea
{0255531B-904F-....
Ich habe einen Datenrahmen wie unten:
ColA ColB
djdn- 3
dn-dn 5
ndmc- 8
nd-nd-md 9
Erwartete Ausgabe:
ColA ColB New_Col
djdn- 3 djdn
dn-dn 5 dn-dn
ndmc- 8 ndmc
nd-nd-md 9 nd-nd-md
Mit sqldf möchte ich ....
Ich möchte Werte einer Variablen ersetzen.
Das ist mein dB:
head(mydb)
ID V1 V2 V3 V4
1 value value 0 0
2 value value 0 0
3 value value 0 0
4 value value 0 0
5 value value 0 0
6 value value 0 0
V3 und V4 haben 0 für alle Beobac....
Mein Datenrahmen enthält einige Variablen, die fehlende Werte als Zeichenfolgen wie "NA" enthalten. Was ist der effizienteste Weg, um alle Spalten in einem Datenrahmen, die diese enthalten, zu analysieren und in echte NAs zu konvertieren, die von Funktionen wie is.na() abgefangen werden?
Ich benutze....
Ich habe einen Datenrahmen mit einem "DATE" -Feld. Beispiel: "24-10-2015"
Die Variable hat das Datumsformat.
Wenn ich sqldf verwende, z. B.: select min(DATE), MAX (DATE) from table ..., ist die Ausgabe eine Zahl wie 16623.
Versucht FORMAT und CONVERT , aber sie funktionieren nicht in sqldf.
Irg....
Ich habe ein Dataset mit zwei Spalten (Zeichen) - Text, Quelle. Ich möchte ein Dataset so erstellen, dass ein bestimmter Wert in der Textspalte weniger als fünfmal vorhanden ist. Ich verwende den folgenden Code, aber er tritt nur zum ersten Mal auf. Stattdessen benötige ich alle Beobachtungen, die d....
Ich versuche, die Recheneffizienz des folgenden Prozesses zu erhöhen. Ich habe ein Spielzeugbeispiel mit Daten zur Überprüfung erstellt. Die erste Methode läuft in der Hälfte der Zeit der zweiten Methode.
Wie kann ich die Laufzeit in der ersten Methode verbessern?
library(sqldf)
id = c(1,1,1,1,2,2,2....