Pomoc w programowaniu, odpowiedzi na pytania / r / R symulacje i regresja u myszy () - r, symulacja, regresja, brak danych, r-myszy

Symulacje R i regresja u myszy () - r, symulacja, regresja, brakujące dane, r-myszy

Używam pakietu myszy w R do wielokrotnego przypisywania i próbuję zrozumieć algorytm za nim.

Z jego dokumentacji http://www.jstatsoft.org/v45/i03/paper, mówi się, że algorytm MICE jest używany. Z mojego zrozumienia, wykonuje MCMC za pomocą Gibbs Samplera, gdzie symuluje parametry BETA, które definiują warunkowy rozkład Y (zmiennej z brakującą wartością) dla Y- (wszystkie inne zmienne bez Y). W przypadku symulowanej wersji BETA zdefiniowany jest odpowiedni rozkład warunkowy. Następnie rysuje wartości z rozkładu warunkowego i zastępuje go brakującymi. Powtarza procedurę dla wszystkich zmiennych z brakującymi wartościami.

Jednak nie rozumiem tego, gdzieczy regresja się dzieje? W funkcji mice () musimy określić parametr „method”. Na przykład „logreg” dla zmiennych dwumianowych i „polyreg” dla zmiennej czynnikowej o więcej niż 2 poziomach. Jeśli MCMC przypisuje przypisanie, dlaczego mielibyśmy określić regresję?

Niektóre dokumenty wskazują, że algorytm MICEuruchamia regresję iteracyjnie dla wszystkich zmiennych z brakującym wzorcem. Za każdym razem jedną zmienną, której brakuje, jest zmienna respondenta, a wszystkie pozostałe są zmiennymi objaśniającymi. Następnie dopasowane wartości są używane do zastąpienia brakujących i przejścia do następnej zmiennej z brakującymi. Następna regresja będzie obejmować dane przypisane z ostatniej regresji. Jest to ten sam schemat co sampler Gibbsa, ale wydaje się, że nie ma symulacji. Szczegóły są tutaj http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3074241/

Czy ktoś mógłby mi pomóc zrozumieć, co tak naprawdę dzieje się u myszy w R?

Odpowiedzi:

2 dla odpowiedzi № 1

Dla każdej zmiennej z brakującymi danymi (Y1, ..., Yj, ...Yk), algorytm MICE pasuje do modelu statystycznego warunkującego Yj na wszystkich innych zmiennych (Yj- lub podzbiór term). Na typ modelu statystycznego wskazuje method. To jest „regresja”. Dopasowany model służy do rysowania zamienników dla brakujących części Yj, biorąc pod uwagę Yj-. Następnie algorytm przechodzi do następnej zmiennej, która zawiera brakujące wartości.

Po wypełnieniu wszystkich zmiennych algorytm rozpoczyna się od nowa.

Zauważ, że podczas dopasowywania modeli algorytm MICE regresuje zauważony części Yj na obserwowanym i przypisane części Yj-. Innymi słowy, przy każdej iteracji modele regresji warunkują inny zestaw wartości predykcyjnych (stąd potrzeba zwykle więcej niż jednej iteracji). Różni się to nieco od innych wdrożeń MI.

Zauważ też, że algorytm MICE nie jest formalnie samplerem Gibbsa (patrz bardzo dobrze napisana dyskusja Carpentera i Kenwarda, 2013).