/ / R simulazioni e regressione nei topi () - r, simulazione, regressione, dati mancanti, topi r

Simulazioni R e regressione nei topi () - r, simulazione, regressione, dati mancanti, r-mouse

Sto usando il pacchetto mouse in R per fare imputazione multipla e sto cercando di capire l'algoritmo dietro di esso.

Dalla sua documentazione http://www.jstatsoft.org/v45/i03/paper, si dice che sia usato l'algoritmo MICE. Da quanto ho capito, esegue MCMC usando Gibbs Sampler, dove simula i parametri BETA che definiscono la distribuzione condizionale di Y (variabile con valore mancante) dato Y- (tutte le altre variabili senza Y). Con il BETA simulato, viene definita la distribuzione condizionale corrispondente. Quindi disegna i valori dalla distribuzione condizionale e sostituisce quelli mancanti con esso. Ripete la procedura su tutte le variabili con valori mancanti.

Tuttavia, ciò che non capisco è che, dovesi verifica la regressione? Nella funzione mice (), dobbiamo specificare il parametro "method". Ad esempio, "logreg" per le variabili distribuite binomiali e "polyreg" per la variabile fattore con più di 2 livelli. Se l'imputazione viene eseguita da MCMC, perché dovremmo specificare una regressione?

Alcuni documenti indicano che l'algoritmo MICEesegue la regressione in modo iterativo su tutte le variabili con pattern mancante. In ogni momento, una variabile mancante è la variabile rispondente e tutte le altre sono variabili esplicative. Quindi i valori adattati vengono utilizzati per sostituire i mancanti e passare alla variabile successiva con i mancanti. La regressione successiva includerà i dati imputati dell'ultima regressione. Questo è lo stesso schema del campionatore Gibbs ma sembra che non ci sia simulazione. I dettagli sono qui http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3074241/

Qualcuno potrebbe aiutarmi a capire cosa succede realmente nei topi in R?

risposte:

2 per risposta № 1

Per ogni variabile con dati mancanti (Y1, ..., Yj, ...Yk), l'algoritmo MICE adatta un modello statistico che condiziona Yj su tutte le altre variabili (Yj-, o un suo sottoinsieme). Il tipo di modello statistico è indicato da method. Questa è la "regressione". Il modello montato viene utilizzato per disegnare sostituzioni per le parti mancanti di Yj, dato Yj-. Successivamente, l'algoritmo procede con la variabile successiva che contiene valori mancanti.

Una volta riempite tutte le variabili, l'algoritmo ricomincia.

Si noti che, quando si adattano i modelli, l'algoritmo MICE regredisce osservata porzioni di Yj sull'osservato e porzioni imputate di Yj-. In altre parole, ad ogni iterazione, i modelli di regressione si condizionano su un diverso insieme di valori predittori (da qui la necessità di più di una iterazione). Questo è leggermente diverso dalle altre implementazioni di MI.

Si noti inoltre che l'algoritmo MICE non è formalmente un campionatore di Gibbs (vedere la discussione ben scritta di Carpenter e Kenward, 2013).