/ / R stop i agregacja - r, agregacja

R stop i agregacja - r, agregacja

Mam dane tego typu:

    sample   X   Y   Z
A
B
A
C
...

Gdzie istnieje wiele pomiarów A, B i C, a każdy pomiar jest charakteryzowany przez niektóre parametry x, y, z itp.

Chcę uzyskać średnie i średnie wartości x, y, z dla każdej próbki lubię to

    sample   variable   Avg      SE
A         x       mean(x)   ...
A         y       mean(y)   ...
A         z       mean(z)   ...
...

Odpowiedzi:

0 dla odpowiedzi № 1

Jak o użyciu dplyr? Możesz rozdzielić dane według dowolnej grupy, a następnie wyświetlić podsumowanie wyników.

mydf <- data.frame(sample = sample(LETTERS[1:4], size = 100, replace = TRUE),
variable = runif(100))

library(dplyr)
mydf %.% group_by(sample) %.%
summarize(mean = mean(variable),
sd = sd(variable),
se = mean(variable) + (sd/sqrt(n())))

Source: local data frame [4 x 4]

sample      mean        sd        se
1      A 0.4666366 0.2705698 0.5218665
2      B 0.4128302 0.2710152 0.4615059
3      C 0.5055496 0.2569661 0.5616242
4      D 0.5132356 0.2795494 0.5702984