somam células em matriz de acordo com diferentes níveis hierárquicos - r, matriz, soma

Estou usando o R para criar um mapa de calor a partir de interações binárias. A matriz parece seguir

    9   401 562 68  71  569 700
9   0   1   0   0   0   0    1
401 0   0   1   0   0   na   1
562 0   1   0   1   1   0    1
68  1   1   0   0   0   0    1
71  1   na  0   0   na  0    1
569 1   1   0   1   0   0    0
700 0   0   0    0   0  0    0

Além disso, tenho metadados correspondentes aos meus IDs

    compart group family  category
9    Ex     Prt   A       Ps
401  Ex     Prt   A       Ps
562  Ex     Prt   B       Rh
68   In     Prt   C       En
71   In     Act   D       Stp
569  In     Act   D       Stp
700  Ex     Act   E       Aqua

Eu gostaria de somar células em diferentes níveis, ex aqui de acordo com a família. A mesa parece então

  A B C D E
A 1 1 0 0 1
B 1 0 0 na 1
C 2 0 0 0  1
D 3 0 1 0  0
E 0 0 0 0  0

E também gostaria de fazê-lo no nível do compartimento e assim por diante.

Estou à procura de soluções que me evitem para fazê-lo manualmente e ir para horas de trabalho.


Sua melhor aposta é achatar ou "esticar" a matriz. Tente o seguinte


## Let IDs be the metadata data.frame
DT_ids <- as.data.table(Ids, keep.rownames=TRUE)
# DT_ids[, rn := as.numeric(rn)]
setkey(DT_ids, rn)

## Let M be the interactions matrix
## Reshape the interactions data into a tall data.table
DT_interactions <- M %>%
as.data.table(keep.rownames=TRUE) %>%
melt(id.vars = "rn", value.name="interaction")
## Clean up the column names
setnames(DT_interactions, c("rn", "variable"),  c("rn.rows", "rn.cols"))

## Add in two copies of the meta data
## one for "rows" of M and one for "cols" of M
DT_interactions[, paste0(names(DT_ids), ".rows") :=  DT_ids[.(rn.rows)]]
DT_interactions[, paste0(names(DT_ids), ".cols") :=  DT_ids[.(rn.cols)]]

## Set the key of DT_interactions
setkey(DT_interactions, rn.rows, rn.cols)

DT_interactions[, sum(interaction), by=c("family.rows", "family.cols")]

Eu iria envolver essa última parte em uma função legal

sumByMeta <- function(..., na.rm=TRUE) {
byCols_simple <- list(...) %>% unlist
byCols <- byCols_simple %>%
lapply(paste0, c(".rows", ".cols")) %>%

L <- length(byCols)
formula <- paste( byCols[1:(L/2)], byCols[(L/2 + 1) : L]
, sep=ifelse(L > 2, " + ", "~"), collapse=" ~ ")

DT_interactions[, sum(interaction, na.rm=na.rm), by=byCols] %>%
dcast.data.table(formula=as.formula(formula), value.var="V1") %>%
setnames(old=seq_along(byCols_simple), new=byCols_simple) %>% {.}

## EG:

#      family A B C D E
#   1:      A 1 1 0 0 2
#   2:      B 1 0 1 1 1
#   3:      C 2 0 0 0 1
#   4:      D 3 0 1 0 1
#   5:      E 0 0 0 0 0

## Try running these
sumByMeta("family", "group")
sumByMeta("family", "group", "compart")
sumByMeta("family",          "compart")