Pomoc pri programovaní, odpovede na otázky / r / R: Roztavenie a rozomieľanie, topenie, dcast

R: Melt a Dcast - r, taviť sa, dcast

Mám súbor údajov takto:

CASE_ID = c("C1","C1", "C2","C2", "C2", "C3", "C4")
PERSON_ID = c(1,0,7,8,1,20,7)
PERSON_DIVISION = c("Zone 1", "NA", "Zone 1", "Zone 3", "Zone 1", "Zone 5", "Zone 1")
df <- data.frame(CASE_ID, PERSON_ID, PERSON_DIVISION)
df

Výsledkom je:

CASE_ID PERSON_ID PERSON_DIVISION
1      C1         1          Zone 1
2      C1         0              NA
3      C2         7          Zone 1
4      C2         8          Zone 3
5      C2         1          Zone 1
6      C3        20          Zone 5
7      C4         7          Zone 1

A chcem to zmeniť:

CASE_ID P1_ID  P2_ID  P3_ID  P1_Division  P2_Division   P3_Division
1       1       0     NA        Zone 1      NA           NA
2       7       8     1         Zone 1      Zone 3      Zone 1
3       20      NA    NA        Zone 5      NA          NA
4       7       NA    NA        Zone 1      NA          NA

Môj prístup zatiaľ bol roztopiť dáta a laters Dcast:

e <- melt(df)

dcast(e, CASE_ID  ~ PERSON_DIVISION + variable)

Ale nedostanem požadovaný výstup, ale namiesto toho dostanem:

CASE_ID NA_PERSON_ID Zone 1_PERSON_ID Zone 3_PERSON_ID Zone 5_PERSON_ID
1      C1            1                1                0                0
2      C2            0                2                1                0
3      C3            0                0                0                1
4      C4            0                1                0                0

odpovede:

1 pre odpoveď č. 1

Tu sú dva problémy:

Vaše údaje sú už v dlhom formáte, ale máte dva hodnoty stĺpcov. Najnovšie verzie data.table podporuje viaceré hodnoty vars v dcast().
Potrebujete jedinečné identifikátory riadkov v rámci každej skupiny. Inak, dcast() sa pokúsi zhromaždiť duplicity (pomocou length() ktorý v predvolenom nastavení vysvetľuje výstup, ktorý ste dostali).

Prosím skús

library(data.table)   # version 1.10.4 used here
# coerce to data.table, add unique row numbers for each group
setDT(df)[, rn := rowid(CASE_ID)]
# dcast with multiple value vars
dcast(df, CASE_ID ~ rn, value.var = list("PERSON_ID", "PERSON_DIVISION"))
#   CASE_ID PERSON_ID_1 PERSON_ID_2 PERSON_ID_3 PERSON_DIVISION_1 PERSON_DIVISION_2 PERSON_DIVISION_3
#1:      C1           1           0          NA            Zone 1                NA                NA
#2:      C2           7           8           1            Zone 1            Zone 3            Zone 1
#3:      C3          20          NA          NA            Zone 5                NA                NA
#4:      C4           7          NA          NA            Zone 1                NA                NA

To môže byť napísané stručne ako jeden-liner:

dcast(setDT(df), CASE_ID ~ rowid(CASE_ID), value.var = list("PERSON_ID", "PERSON_DIVISION"))

Súvisiace otázky

Ako môžem zmeniť tvar dát (dlhý do širokého) bez toho, aby som robil funkciu ako sumu alebo znamenajú? - r, data.table, remake, reshape2, splitstackshape

Vytvorte fiktívne premenné z viacerých stĺpcov a vytvorte nový dátový rámec [duplicate] - r, dataframe, dummy-variable

názvy vlastných premenných v R reshape2 - r, reshape2

Počet výskytov hodnôt zoskupených podľa ID skupiny v R - r, agregát

Zmeniť viacero hodnôt naraz - r, dataframe, reshape, reshape2, tidyr

R: Ako roztopiť dáta v R, kde sú riadkové hodnoty stĺpcové štítky? - r, pretvoriť, topiť

Tavte pole do dataframe, ale konvertujte jednu dimenziu do stĺpcov - r, reshape2

Ako zoskupiť podľa stĺpca? - r, agregácia

R: Vytvorenie dlhej množiny údajov, keď sú riadky premenné a stĺpce sú roky - r, reshape2, tavenie

Tabuľka s údajmi nadpisy stĺpcov dcast - r, data.table, heading, dcast

Správne používanie dcast.table.table vo funkcii - r, data.table

preformátujte údaje (tabuľka) v R [zatvorené] - r, preformátujte

Ako pomenovať každú premennú pomocou tavby - r, reshape2, topiť

Vlastná agregačná funkcia s viac ako 1 vstupom v dcast - r, reshape2

Počet záznamov, ktoré nie sú NA, podľa stĺpca, zoskupené - r, data.table

Ako získať túto dcast'able dlhú tabuľku v R? - r, dátové štruktúry

Jednoduchá funkcia nefunguje pre `dcast` - reshape2 - r, zmena tvaru

R: preformulovať dáta, názov kategórie a stĺpca - r, pretvoriť

tabuľka v tabuľke dát.table - r, data.table

Ako môžem pridať štruktúru URL adresy URL priateľskej pre Melt Framework? - php, tavná štruktúra