Допомога у програмуванні, відповіді на питання / р / R: Розплав і Dcast - r, розплав, dcast

R: розплав та Dcast - r, танути, dcast

У мене є такий набір даних:

CASE_ID = c("C1","C1", "C2","C2", "C2", "C3", "C4")
PERSON_ID = c(1,0,7,8,1,20,7)
PERSON_DIVISION = c("Zone 1", "NA", "Zone 1", "Zone 3", "Zone 1", "Zone 5", "Zone 1")
df <- data.frame(CASE_ID, PERSON_ID, PERSON_DIVISION)
df

Це призводить до:

CASE_ID PERSON_ID PERSON_DIVISION
1      C1         1          Zone 1
2      C1         0              NA
3      C2         7          Zone 1
4      C2         8          Zone 3
5      C2         1          Zone 1
6      C3        20          Zone 5
7      C4         7          Zone 1

І я хочу перетворити його на:

CASE_ID P1_ID  P2_ID  P3_ID  P1_Division  P2_Division   P3_Division
1       1       0     NA        Zone 1      NA           NA
2       7       8     1         Zone 1      Zone 3      Zone 1
3       20      NA    NA        Zone 5      NA          NA
4       7       NA    NA        Zone 1      NA          NA

Моїм підходом до теперішнього часу було розтоплювання даних і скринінг Dcast:

e <- melt(df)

dcast(e, CASE_ID  ~ PERSON_DIVISION + variable)

Але я не отримую бажаного результату, замість цього отримую:

CASE_ID NA_PERSON_ID Zone 1_PERSON_ID Zone 3_PERSON_ID Zone 5_PERSON_ID
1      C1            1                1                0                0
2      C2            0                2                1                0
3      C3            0                0                0                1
4      C4            0                1                0                0

Відповіді:

1 для відповіді № 1

Тут є два питання:

Ваші дані вже у довгому форматі, але у вас є два стовпців значення. Останні версії data.table підтримка декількох значень значення в dcast().
У кожній групі потрібні унікальні ідентифікатори рядків. Інакше dcast() спробує об'єднати дублікати (використовуючи length() за замовчуванням, який пояснює отриманий вивід.

Будь ласка, спробуй

library(data.table)   # version 1.10.4 used here
# coerce to data.table, add unique row numbers for each group
setDT(df)[, rn := rowid(CASE_ID)]
# dcast with multiple value vars
dcast(df, CASE_ID ~ rn, value.var = list("PERSON_ID", "PERSON_DIVISION"))
#   CASE_ID PERSON_ID_1 PERSON_ID_2 PERSON_ID_3 PERSON_DIVISION_1 PERSON_DIVISION_2 PERSON_DIVISION_3
#1:      C1           1           0          NA            Zone 1                NA                NA
#2:      C2           7           8           1            Zone 1            Zone 3            Zone 1
#3:      C3          20          NA          NA            Zone 5                NA                NA
#4:      C4           7          NA          NA            Zone 1                NA                NA

Це може бути написано більш лаконічно як один лайнер:

dcast(setDT(df), CASE_ID ~ rowid(CASE_ID), value.var = list("PERSON_ID", "PERSON_DIVISION"))

Схожі запитання

Як я можу змінити дані. Таблицю (довго в широкому форматі), не виконуючи функцію, подібну до суми чи означає? - r, data.table, переформатувати, переформатувати2, splitstackshape

Зробити фіктивні змінні з декількох стовпців і створити новий кадр даних (дублікат) - r, dataframe, dummy-variable

Користувацькі імена змін в R reshape2 - r, reshape2

Кількість вартісних подій, згрупованих за GroupID в R - r, сукупність

Переформатувати кілька значень одночасно - r, кадр даних, змінити формат, переформатувати2, вибрати

R: Як розплавити дані в R, де значення рядка стають мітками стовпців? - r, переформатувати, розплавити

Розтоплення масиву в data.frame, але перетворення одного виду на стовпці - r, reshape2

Як групувати за стовпцем? - r, агрегація

R: Створення довгого набору даних, коли рядки є змінними, а стовпці - роки - r, reshape2, melt

Дані таблиці заголовків стовпців dcast - r, data.table, заголовок, dcast

Правильне використання dcast.table.table у функції - r, data.table

змінити дані (таблицю) в R [closed] - r, переформатувати

Як назвати кожну змінну, використовуючи розплав - r, reshape2, танути

Індивідуальна агрегаційна функція з більш ніж 1 входом в dcast-r, reshape2

Кількість записів, що не належать до НС, за стовпцями, згрупованими - r, data.table

Як отримати цю dcast'able довгу таблицю в R? - r, структури даних

Проста функція не працює для `dcast` - reshape2 - r, переформатувати

R: змінити дані, назви категорії в стовпець - r, переформатувати

rowise табуляція в data.table - r, data.table

Як додати структуру Melt Framework для зручної структури URL-адрес? - php, плавильний каркас