Mam dane tego typu:
sample X Y Z
A
B
A
C
...
Gdzie istnieje wiele pomiarów A, B i C, a każdy pomiar jest charakteryzowany przez niektóre parametry x, y, z itp.
Chcę uzyskać średnie i średnie wartości x, y, z dla każdej próbki lubię to
sample variable Avg SE
A x mean(x) ...
A y mean(y) ...
A z mean(z) ...
...
Odpowiedzi:
0 dla odpowiedzi № 1Jak o użyciu dplyr
? Możesz rozdzielić dane według dowolnej grupy, a następnie wyświetlić podsumowanie wyników.
mydf <- data.frame(sample = sample(LETTERS[1:4], size = 100, replace = TRUE),
variable = runif(100))
library(dplyr)
mydf %.% group_by(sample) %.%
summarize(mean = mean(variable),
sd = sd(variable),
se = mean(variable) + (sd/sqrt(n())))
Source: local data frame [4 x 4]
sample mean sd se
1 A 0.4666366 0.2705698 0.5218665
2 B 0.4128302 0.2710152 0.4615059
3 C 0.5055496 0.2569661 0.5616242
4 D 0.5132356 0.2795494 0.5702984