Aiuto nella programmazione, risposte alle domande / r / Combinando alcune righe duplicate e sommando una delle loro colonne - r, funzione, somma, dataframe, plyr

Combinando alcune righe duplicate e sommando una delle loro colonne - r, funzione, somma, dataframe, plyr

Ho questo dataframe:

> names(events)
[1] "EID"    "X"      "Y"      "trip"   "tow"    "catch"  "effort" "depth"
[9] "season"

Dove alcuni dei miei ID univoci "EID" appaiono più di una volta in 162 casi.

> length(events$EID)-length(unique(events$EID))
[1] 162

Vorrei combinare ogni EID replicare insieme e riassumere la loro "presa". Ho provato alcune cose con il pacchetto plyr ... ma non riesco a trovare un comando piuttosto semplice.

Ogni suggerimento e 'ben accetto! Grazie mille!

risposte:

3 per risposta № 1

Ecco un esempio che dovrebbe iniziare:

library(plyr)

n = 100

# Simulate data
set.seed(12345)
EID   = factor(sample(10, n, replace=T))
catch = runif(n)
data  = data.frame(EID, catch)

# Sum catch by EID
ddply(data, "EID", function(x) data.frame(catch.sum = sum(x$catch)))

> ddply(data, "EID", function(x) data.frame(catch.sum = sum(x$catch)))
EID catch.sum
1    1  6.041294
2    2  4.889522
3    3  2.466826
4    4  9.633270
5    5  5.673484
6    6  3.389666
7    7  6.572664
8    8  8.646577
9    9  4.056461
10  10  5.933441

domande correlate

Sommare il valore quando ID colonna è uguale a SQLite - sql, sqlite

Media per livello di fattore per le ultime tre righe - r, plyr

R, trova le righe duplicate, indipendentemente dall'ordine - r, dati duplicati

Dividi la cella multilinea in un dataframe R basato su Wikitable e mantieni la colonna 'categoria' - r, dataframe, plyr, multilinea

Unisci righe dataframe per colonna chiave - r, dplyr

Plyr basato su which.min for hole data.frame con colwise non funzionante - r, plyr

trasferire le voci delle righe in colonne e le voci delle colonne in righe - r

Seleziona righe di dati in dataframe che contengono un elemento che non viene ripetuto (è univoco) [duplicato] - r, dataframe, univoco

Crea un numero sequenziale (contatore) per le righe all'interno di ciascun gruppo di un dataframe [duplicato] - r, dataframe

Rimozione delle osservazioni dei sondaggi precedenti per lo stesso studente nella stessa settimana - r

Subsetting di un dataframe - r

Usando plyr :: mapvalues con dplyr - r, dataframe, plyr, dplyr

Iterating over multiIndex dataframe - python, panda, dataframe, multiindice

Come sommare e significare un DataFrame per creare un altro DataFrame - python, panda, dataframe

Iterate su un DataFrame di panda, usando groupby, e selezionate i valori in base alla condizione off in ogni gruppo: python, panda, for-loop, dataframe

Combina più dataframes in uno che somma i loro valori in base all'indice: python, panda, somma

Usa la somma di più colonne di panda per mappare una funzione - funzione, panda, dataframe

Riepilogo delle righe in Excel se le righe contengono stringhe identiche - excel, funzione

Riepilogo del risultato della formula applicata alle righe: eccellente

Utilizzo di Groupby con Duplicato: duplicati, multiple colonne, panda-groupby, multiindice