Industry x median
1 5 median of x for industry 1
2 3 median of x for industry 2
1 2
2 5
3 10 median of x for industry 3
3 9
3 8
4 3
1 2
1 5
2 7
Я хочу створити новий стовпець median
що дорівнює медіані x
для конкретної галузі вона належить. Наприклад, медіана першого ряду - медіана числа x
належить промисловості 1, а другий рядок - медіана x
належить промисловості 2.
Відповіді:
1 для відповіді № 1Враховуючи, що ваш файл даних викликається your_df
ви можете використовувати dplyr
:
library(dplyr)
your_df %>% group_by(Industry) %>% mutate(median=median(x)) -> your_df_with_median
Тут ви групуєте за Industry
і обчислити медіан для кожної групи. Функція mutate()
збереже кількість рядків у вашому кадрі даних.
Примітка: Ви можете встановити dplyr
з install.packages("dplyr")