参加者、電話で使用していたアプリ、各セッションの期間をリストした表があります。次のようになります。
panelist_id app_name duration
1 550302 Messages 10 secs
3 550302 Google 2 secs
5 550302 com.google.android.partnersetup 20 secs
7 550302 Google 8 secs
9 550302 Google 30 secs
11 550302 Dialer 8 secs
上記を表にして、参加者がアプリに費やした合計時間を調べたいと思います。うまくいけば、このようになります:
55302 550303 55304
1 Messages 1040 1000 458
3 Google 900 580 345
5 Dialer 800 150 340
7 Facebook 513 1549 418
アプリの数は5000を超え、100人のユーザーがいるため、列名と行名を手動で挿入することはオプションではありません。
周波数表を作成することでこれを達成しようとしましたが、それでも「私は遠くまで行けませんでした」。
質問を投稿するのは今回が初めてなので、間違いや謝罪をおaびします!
回答:
回答№1は0使用 dplyr あなたはこのようなものを書くことができます:
library(dplyr)
data %>% group_by(app_name, panelist_id) %>% summarize(total_duration = sum(duration))