/ / sprawdź, czy dany temat znajduje się w innych kolumnach i czy duplikaty w każdej kolumnie są w r - r, duplikaty, pełne

sprawdź, czy dany temat znajduje się w innych kolumnach i duplikatach w każdej kolumnie w r - r, duplikatach, kompletnych

Oto dane: Przykład 1: kompletny

complete <- c("A", "B", "C","J", "C1", "L", "J2", "D", "M", "N")
lst1 <- c(NA, NA, NA, "A", "N", NA,"A", "C", "D", NA )
lst2 <- c(NA, NA, NA,"A", "L", NA, "C1", "J2", "J2", "B")
datf <- data.frame (complete, lst1, lst2, stringsAsFactors = FALSE)

Przykład 2: niekompletny i zduplikowany

complete <- c("A", "B", "C","J", "C1", "L", "C", "D", "M", "N")
lst1 <- c(NA, NA, NA, "A", "N", NA,"A", "C", "D1", NA )
lst2 <- c(NA, NA, NA,"A", "L", NA, "C1", "J2", "J2", "B2")
datf2 <- data.frame (complete, lst1, lst2, stringsAsFactors = FALSE)

Chcę sprawdzić : (1) jeżeli elementy lst1 i lst2 są przynajmniej obecne przynajmniej raz w całości. Jeśli nie jest obecny, to komunikat stop powie, że to „?” jest obecny w lst1 lub lst2 (cokolwiek poprawnego), ale nie jest kompletny. Moja próba: na przykład 1

if (datf$lst1 %in%  datf$complete | datf$lst2 %in%  datf$complete) {
stop ("the subject in lst1 or lst2 must be complete list ")} else {
cat("I am fine")
}

I am fineWarning message:
In if (datf$lst1 %in% datf$complete | datf$lst2 %in% datf$complete) { :
the condition has length > 1 and only the first element will be used

Dlaczego pojawia się ten komunikat o błędzie i jak go usunąć?

  Example 2:
if (datf2$lst1 %in%  datf2$complete | datf2$lst2 %in%  datf2$complete) {
stop ("the subject in lst1 or lst2 must be complete list ")} else {
cat("I am fine")
}
Although there is potential errors the error message is same:
I am fineWarning message:
In if (datf2$lst1 %in% datf2$complete | datf2$lst2 %in% datf2$complete) { :
the condition has length > 1 and only the first element will be used

Istnieje również sposób na podanie nazw, które nie pasują jako część komunikatu o błędzie.

(2) Jeśli którykolwiek z członków jest opublikowany.

Edytować:

Expected answer:
Example1 <-  all members of lst1 and lst2 are also member of complete

expacted message here is "I am fine"

Example2 <-
B2, J2, is member of lst2 but not complete, D1 is member of lst1 but not complete.
complete have two C, so C is duplicated.
The function will stop and print a message

"B2 and J2 are member of lst1, but not in complete
D1  is member of lst2, but not in complete,
check completeness"
"C is duplicated in complete"

Odpowiedzi:

1 dla odpowiedzi № 1
> datf$lst1 %in% datf$complete | datf$lst2 %in% datf$complete
[1] FALSE FALSE FALSE  TRUE  TRUE FALSE  TRUE  TRUE  TRUE  TRUE

od ?"if" argumentem if jest wektor logiczny o długości jeden, który nie jest NA.

> na.omit(datf2$lst1)[!na.omit(datf2$lst1)%in%datf2$complete]
[1] "D1"
> na.omit(datf2$lst2)[!na.omit(datf2$lst2)%in%datf2$complete]
[1] "J2" "J2" "B2"

> datf2$complete[duplicated(datf2$complete)]
[1] "C"

powyższe powinno pomóc ci skomponować funkcję do robienia tego, co proponujesz.