Ayuda en la programación, respuestas a preguntas / r / Eliminar filas semi duplicadas en R - r

Eliminar filas semi duplicadas en R - r

Tengo el siguiente data.frame.

a <- c(rep("A", 3), rep("B", 3), rep("C",2), "D")
b <- c(NA,1,2,4,1,NA,2,NA,NA)
c <- c(1,1,2,4,1,1,2,2,2)
d <- c(1,2,3,4,5,6,7,8,9)
df <-data.frame(a,b,c,d)


a  b c d
1 A NA 1 1
2 A  1 1 2
3 A  2 2 3
4 B  4 4 4
5 B  1 1 5
6 B NA 1 6
7 C  2 2 7
8 C NA 2 8
9 D NA 2 9

Quiero eliminar las filas duplicadas (basadas en las columnas A y C) para que la fila con los valores en la columna B se guarden. En este ejemplo, las filas 1, 6 y 8 se eliminan.

Respuestas

1 para la respuesta № 1

Una forma de hacer esto es order por "a", "b" y el vector lógico basado en "b" para que todos los elementos "NA" sean los últimos para cada grupo de "a" y "b". Luego, aplica el duplicated y mantener solo los elementos no duplicados

df1 <- df[order(df$a, df$b, is.na(df$b)),]
df2 <- df1[!duplicated(df1[c("a", "c")]),]
df2
#  a  b c d
#2 A  1 1 2
#3 A  2 2 3
#5 B  1 1 5
#4 B  4 4 4
#7 C  2 2 7
#9 D NA 2 9

setdiff(seq_len(nrow(df)), row.names(df2) )
#[1] 1 6 8

1 para la respuesta № 2

Primero cree dos conjuntos de datos, uno con duplicados en la columna a y otro sin duplicados en la columna a usando la función siguiente:

x = df[df$a %in% names(which(table(df$a) > 1)), ]
x1 = df[df$a %in% names(which(table(df$a) ==1)), ]

Ahora usa la función na.omit en el conjunto de datos x para eliminar las filas con NA y luego rbind x y x1 para el conjunto de datos final.

rbind(na.omit(x),x1)

Responder:

   a  b c d

2  A  1 1 2

3  A  2 2 3

4  B  4 4 4

5  B  1 1 5

7  C  2 2 7

9  D NA 2 9

0 para la respuesta № 3

Puedes usar dplyr para hacer esto.

df %>% distinct(a, c,  .keep_all = TRUE)

Hay otras opciones en dplyr, mira esta pregunta para más detalles: Eliminar filas duplicadas utilizando dplyr

preguntas relacionadas

Los diagramas altos de Yii dibujan un semicírculo: yii, gráficos, diagramas altos, gráfico circular

eliminar el duplicado de la tabla de datos y anexar el valor vb.net - vb.net

Eliminar datos duplicados de la columna datagridview vb.net - vb.net, datagridview, datagridviewcolumn

Eliminar filas con valores duplicados [duplicado] - sql, sql-server

¿Se considera que una semi unión es una unión izquierda o derecha? - sql

VBA Insertar filas con contenido y editar filas previas y precedentes - sql-server, excel, vba

Eliminar filas en la matriz R donde todos los datos son NA [duplicado] - r

página web: elementos semitransparentes -> PNG - png, extracto, página web, transparente

eliminar filas duplicadas en una sola columna dada en mysql sin ningún ids [duplicado] - mysql

Problemas para combinar las secuencias de comandos awk: linux, bash, awk

Agregar fila duplicada después de eliminar filas del duplicado - jquery

¿Cuál es el propósito de comenzar semi colon al comienzo de JavaScript? [duplicado] - javascript, jquery

Cómo hacer fondo semitransparente [duplicado] - html, css, html5, css3

Eliminar filas duplicadas más allá del segundo en Excel, basado en una sola columna: excel, duplicates, delete-row

Cómo eliminar duplicados en una sola columna en Excel 2010 - excel, excel-formula, excel-2010

¿Cómo duplico las filas según el contenido de la celda (la celda contiene datos separados por punto y coma)? Excel, excel-vba, excel-formula, extra, vba

Marcar filas duplicadas en DataTable - c #

Eliminar filas duplicadas y contar en C # DataTable - c #, linq, datatable, datarow

¿Por qué el valor de i sigue siendo 5 [duplicado] - c, macros, c-preprocesador

Biblioteca de diseño de Android 22.2.0 barra de estado primaria transparente semi transparente con el contenido detrás de la barra de estado [duplicado] - android, androiddesignsupport, android-statusbar