Aiuto nella programmazione, risposte alle domande / r / Ignorando le NA in un dataframe quando si trovano righe univoche - r, unique, na

Ignorando le NA in un dataframe quando si trovano righe univoche - r, unique, na

Ho un dataframe con 20 colonne e circa 200righe e vorrei trovare le righe univoche. Il problema è che in quasi tutte le righe sono mescolate alcune NA: in realtà mancano i dati e vorrei che le NA fossero trattate come una "wildcard", non usata per abbinarle ad altre NA.

Le seguenti due righe devono essere riconosciute come una corrispondenza (cioè non univoca)

T, S, NA, Z
NA, S, G, Z

Ho provato l'argomento incomparabile per la funzione unica, ma non sembra essere implementato. Molte grazie.

risposte:

0 per risposta № 1

Metti questo in un ciclo doppio per:

all(na.omit(x[1,] == x[2,]))

Sostituire 1 e 2 con i e j per scorrere tutti i confronti che è necessario controllare.

0 per risposta № 2

Potresti provare

val <-  apply(df, 1, function(x) {paste(na.omit(x), collapse="")})
df[!duplicated(val),]
#    V1 V2   V3 V4
#1    T  S <NA>  Z
#2 <NA>  S    G  Z
#3    S  G    Z  T

dati

 df <- structure(list(V1 = c("T", NA, "S", "S", "S"), V2 = c("S", "S",
"G", NA, "G"), V3 = c(NA, "G", "Z", "Z", NA), V4 = c("Z", "Z",
"T", "G", "Z")), .Names = c("V1", "V2", "V3", "V4"), row.names = c(NA,
-5L), class = "data.frame")

domande correlate

Costruire ricorsivamente un elenco di dataframes (in R) - l'opzione loop only? - r, lista, dataframe

in R: trova le osservazioni con combinazioni univoche su colonne, indipendentemente dal loro ordine [duplicato] - r, dataframe, unico, combinazioni

Aggrega un data.frame senza una funzione - r, dataframe, riepilogo

Seleziona righe di dati in dataframe che contengono un elemento che non viene ripetuto (è univoco) [duplicato] - r, dataframe, univoco

R, seleziona la prima riga del dataframe per ogni coppia unica, ignorando l'ordine - r

Converti sottoinsiemi di una colonna in nuove file dataframe in R [duplicato] - r, dataframe

Subsetting di un dataframe - r

ottenere valori univoci nella colonna col1 di dataframe di Pandas per cui Col2 colonna ha valori nulli - python, panda, dataframe

Come ottenere tutte le parole univoche su un dataframe: python, panda, nlp

Il modo migliore per eliminare colonne con un solo valore da pandas dataframe - python, panda

Dataframe da dict di elenchi di lunghezza variabile - python, panda

creando una query sql usando una colonna DataFrame - python, sql, panda

panda dataframe rimuove colonna costante - python, panda, dataframe

I pda sostituiscono in modo condizionale il valore se> 1 valori univoci per le altre colonne: python, python-3.x, panda

Come contare combinazioni uniche di variabili in un Dataframe di Pandas: python, database, panda, group-by

Creazione di nuovi dataframe panda estraendo colonne da altri dataframes - ValueError - python, python-2.7, panda, dataframe

Rimozione di righe univoche in Python [duplicato] - python, panda

Consolidare le righe duplicate di un array: python, array, numpy

I panda selezionano valori univoci da column-python-3.x, panda

Trova per chiave univoca in xsd? - .net, xsd