Aiuto nella programmazione, risposte alle domande / r / R Un modo efficiente per creare nuovi frame di dati da righe univoche tra due frame di dati: r, dataframe, compare

R Modo efficiente per creare nuovi frame di dati da righe univoche tra due frame di dati: r, dataframe, compare

Ho bisogno di creare un nuovo frame di dati due frame di dati esistenti in cui il nuovo frame di dati è ogni riga dal primo frame di dati che non è nel secondo frame di dati. Ho trovato del codice Qui usando la funzione di fusione che mi ha permesso di farlo in questo modo. Fondamentalmente, se l'unione risultante ha un risultato, la riga si trova nel frame dati e non la aggiungo alla mia nuova:

for (j in 1:nrow(my.df)) {
if(nrow(merge(my.df[j,],sample.df))==0) {
test.df <- rbind(test.df,my.df[j,])
}
}

Il problema è che il ciclo for è molto lento. Esiste un modo più efficiente per costruire un data frame dati i vincoli che ho?

my.df

A B class
1 2 x
2 3 y
3 4 z

sample.df

A B class
1 2 x

test.df dovrebbe assomigliare

A B class
2 3 y
3 4 z

risposte:

2 per risposta № 1

utilizzando library(dplyr) possiamo usare anti_join():

anti_join(my.df, sample.df)
# Joining, by = c("A", "B", "class")
#   A B class
# 1 3 4     z
# 2 2 3     y

Come menzionato da @Gregor, puoi anche convertire i tuoi data.frames in data.tables con library(data.table) per avere un po 'di velocità in più

domande correlate

Aggiungi una colonna al Data Frame in Apache Spark 1.3 - scala, apache-spark, dataframe

Utilizzando R, trova il numero di righe su più dataframes e crea un elenco di valori - r

Funzione per creare un nuovo dataframe dai sottoinsiemi di dati - r, for-loop, dataframe, sottoinsieme

Perché questo non sostituisce correttamente le colonne? df1 [i, b] <- df2 [i, b] [duplicato] - r

Creazione di frame di dati da ciascuna riga di un elemento di elenco: r, list, dataframe

Filtra le righe dei datafram memorizzati in un elenco e crea un nuovo elenco - r, elenco, dataframe, filtro

utilizzando un ciclo for per creare un elenco di frame di dati in R - r, list, for-loop, dataframe, unique

Aggrega un data.frame senza una funzione - r, dataframe, riepilogo

Unisci 2 frame di dati concatenando vettoriale - r, ordinamento, dataframe, unione, ordine

legare molte cornici di dati aggiungendo una colonna con il loro id [duplicato] - r, dataframe

Ricerca di un secondo frame di dati basato su un valore in un altro [duplicato] - r, dataframe

Ignorando le NA in un dataframe quando si trovano righe univoche - r, unique, na

Seleziona righe di dati in dataframe che contengono un elemento che non viene ripetuto (è univoco) [duplicato] - r, dataframe, univoco

Come aggiungere una colonna a un dataframe con valori di un altro in base a più condizioni - r

R - rimozione di righe dal frame di dati in base a una colonna in un altro frame di dati [duplicato] - r, dataframe, unione

confronta i nomi delle colonne e crea una nuova tabella - r, corrisponde

L'unione dei frame di dati in termini di righe e colonne in R - r, unione, ripetizione, na

Ordine di righe in DataFrame dopo l'aggregazione: python, apache-spark, pyspark, spark-dataframe

panda: unire diversi dataframes - python, panda

Il modo migliore per confrontare il dataframe di Pandas con il file csv - python, panda, csv, dataframe, confronto