Pomoc w programowaniu, odpowiedzi na pytania / r / Utwórz funkcję do filtrowania i podsumowywania za pomocą R - r, filtruj, grupuj według, dplyr, podsumuj

Stwórz funkcję filtrowania i podsumowywania za pomocą R - r, filtra, grupowania, dplyr, podsumowania

Mam te dwie tabele;

   <A>                       <B>
a1    a2                     b1
ABC   CAFE                   AB
ABD   DRINK                  BF
ABF   CAFE                   ..
ABFF  DRINK
..     ..

Chciałbym poznać tabelę podsumowującą zawierającą B do a1 w tabeli A w ten sposób;

library(dplyr)
library(stringr)

A1 <- A %>%
filter(str_detect(a1, "AB")) %>%
group_by(a2) %>%
summarize(n())

A2 <- A %>%
filter(str_detect(a1, "BF")) %>%
group_by(a2) %>%
summarize(n())

Powinienem jednak wykonać kod kilka razy, aby funkcja mogła wprowadzić tabelę B w funkcji str_detect ... Jak wykonać tę funkcję?

Odpowiedzi:

1 dla odpowiedzi № 1

Tutaj zaprojektowałem funkcję o nazwie count_fun, który ma cztery argumenty. dat jest jak ramka danych A, Scol to kolumna z ciągami znaków, Gcol to kolumna grupująca, oraz String to ciąg testowy. Widzieć https://cran.r-project.org/web/packages/dplyr/vignettes/programming.html aby dowiedzieć się, jak zaprojektować funkcję za pomocą dplyr.

library(dplyr)
library(stringr)

count_fun <- function(dat, Scol, Gcol, String){

Scol <- enquo(Scol)
Gcol <- enquo(Gcol)

dat2 <- dat %>%
filter(str_detect(!!Scol, String)) %>%
group_by(!!Gcol) %>%
summarize(n())
return(dat2)
}

count_fun(A, a1, a2, "AB")
# # A tibble: 2 x 2
#   a2    `n()`
#   <chr> <int>
# 1 CAFE      2
# 2 DRINK     2

count_fun(A, a1, a2, "BF")
# # A tibble: 2 x 2
#   a2    `n()`
#   <chr> <int>
# 1 CAFE      1
# 2 DRINK     1

Możemy wtedy złożyć wniosek count_fun za pomocą lapply aby zapętlić wszystkie elementy B.

lapply(B$b1, function(x){
count_fun(A, a1, a2, x)
})

# [[1]]
# # A tibble: 2 x 2
#   a2    `n()`
#   <chr> <int>
# 1 CAFE      2
# 2 DRINK     2
#
# [[2]]
# # A tibble: 2 x 2
#   a2    `n()`
#   <chr> <int>
# 1 CAFE      1
# 2 DRINK     1

DANE

A <- read.table(text = "a1    a2
ABC   CAFE
ABD   DRINK
ABF   CAFE
ABFF  DRINK
",
header = TRUE, stringsAsFactors = FALSE)

B <- data.frame(b1 = c("AB", "BF"), stringsAsFactors = FALSE)

1 dla odpowiedzi nr 2

Myślę, że to rozwiązało twój problem:

 lapply(B$b1,function(x)A%>%filter(str_detect(a1, x)) %>% group_by(a2) %>% summarize(n()))

Powiązane pytania

Warunkowe podsumowanie grup w dplyr na podstawie daty - r, dplyr, podsumowanie

dplyr logika filtru używająca zarówno 'jak i' lub '- r, dplyr

Kilka (podstawowych) pytań od wprowadzenia datacamp do dplyr - r, dplyr

porównaj wartość zagregowaną w różnych grupach - r, dplyr

Wyjaśnij ungroup () w dplyr - r, dplyr

przekazywanie nazw kolumn jako łańcuchów do group_by i podsumowywanie w dplyr - r, dplyr, summary, rlang, quosure

Dplyr tally / count przez wiele filtrów - r, dplyr

Sumowanie wierszy po pierwszym wystąpieniu określonej liczby - r, dplyr

Grupowanie dat według współczynnika za pomocą R - r

dplyr: przekazywanie nazwy kolumny w celu podsumowania funkcji wewnętrznej - r, ramka danych, dplyr

Dlaczego podsumowania lub mutacji nie działają z group_by, gdy ładuję `plyr` po` dplyr`? - r, dplyr, plyr, r-faq

Podsumuj według grupy, na przykład proc sql [duplicate] - r

Dplyr podsumuj za pomocą której.max i dane za pomocą NA - r, dplyr, podsumuj

Jak pomnożyć zmienną łańcuchową n-razy przez wartość innej zmiennej, wewnątrz funkcji podsumowania group_by? - r, group-by, dplyr, podsumuj

Dlaczego group_by i group_by_ dają różne odpowiedzi, gdy podsumowują je dwie zmienne? - r, dplyr

dplyr podsumuj ciągiem - r, dplyr

suma / dane zagregowane na podstawie dat, R - r, data

Własne odniesienie podczas indeksowania do wektora - r

jak liczyć powtórzenia pierwszej wartości z dplyr - r, dplyr

Suma kolumny wynikająca z funkcji podsumowania w języku DAX - dax