Pomoc w programowaniu, odpowiedzi na pytania / Pyton / Make graphviz z sklearn RandomForestClassifier (nie z indywidualnego clf.estimators_) - python, scikit-learn, graphviz, random-forest, drzewko decyzyjne

Utwórz graphviz ze sklearn RandomForestClassifier (nie z poszczególnych clf.estimators_) - python, nauka-scikit, graphviz, random-forest, drzewo decyzyjne

Pyton. Sklearn. RandomForestClassifier. Po dopasowaniu RandomForestClassifier, czy tworzy jakieś pojedyncze „najlepsze” „uśrednione” drzewo konsensusu, które można wykorzystać do utworzenia graphviz?

Tak, spojrzałem na dokumentację. Nie, nic o tym nie mówi RandomForestClassifier nie ma tree_ atrybut. Możesz jednak pozyskać pojedyncze drzewa w lesie clf.estimators_ więc wiem, że mógłbym zrobić graphviz z jednego z nich. Tam jest przykład tego tutaj. Mógłbym nawet zdobyć wszystkie drzewa i znaleźć drzewo z najwyższym wynikiem w lesie i wybrać to ... ale to nie jest to, o co pytam.

Chcę zrobić grafikę z „uśrednionego” wyniku losowego klasyfikatora lasu. czy to możliwe? Czy też ostatni klasyfikator wykorzystuje leżące poniżej drzewa do tworzenia wyników i prognoz?

Odpowiedzi:

3 dla odpowiedzi № 1

ZA RandomForest jest metodą zespołową, która wykorzystuje uśrednianie do prognozowania, tj. wszystkie dopasowane subklasyfikatory są używane, zwykle (ale nie zawsze) w zespole głosującym większościowo, aby dojść do ostatecznej prognozy. Dotyczy to zwykle wszystkich metod zespołowych. Tak jak Vivek Kumar wskazuje w komentarzach, że prognozy nie sąkoniecznie zawsze czysta większość głosów, ale może być także ważoną większością, a nawet jakąś inną egzotyczną formą łączenia indywidualnych przewidywań (badania nad metodami zespołowymi są w toku, choć nieco zepchnięte na dalszy plan).

Nie ma przeciętnego drzewa, które można by wykreślić,tylko kikuty decyzyjne, które zostały wyszkolone z losowych podprób całego zestawu danych i prognozy, które wytwarza każdy z nich. To same przewidywania, które są uśredniane, a nie drzewa / pniaki.

Tylko dla kompletności, od artykuł wikipedia: (podkreślenie moje)

Losowe lasy lub losowe lasy decyzyjne1[2] to metoda uczenia zespołowego dla klasyfikacji, regresji i innych zadań, które działają poprzez konstruowanie wielu drzew decyzyjnych w czasie szkolenia i wyprowadzanie klasy, która jest tryb klas (klasyfikacja) lub oznaczać przewidywanie (regresja) poszczególnych drzew.

tryb jest najczęstszą wartością, innymi słowy przewidywanie większości.