/ / Crea graphviz da sklearn RandomForestClassifier (non da singoli clf.estimators_) - python, scikit-learn, graphviz, foresta casuale, albero decisionale

Crea graphviz da sklearn RandomForestClassifier (non dai singoli clf.estimators_) - python, scikit-learn, graphviz, foresta casuale, albero decisionale

Pitone. Sklearn. RandomForestClassifier. Dopo il montaggio RandomForestClassifier, produce una sorta di singolo "migliore" "mediato" albero di consenso che potrebbe essere utilizzato per creare un graphviz?

Sì, ho guardato la documentazione. No, non dice nulla al riguardo RandomForestClassifier non ha un tree_ attributo. Tuttavia, puoi ottenere i singoli alberi nella foresta clf.estimators_ quindi so che potrei fare un graphviz da uno di quelli. C'è un esempio di questo qui. Potrei anche segnare tutti gli alberi e trovare l'albero con il punteggio più alto tra la foresta e scegliere quello ... ma non è quello che sto chiedendo.

Voglio fare un graphviz dal risultato del classificatore di foresta casuale finale "mediato". È possibile? Oppure, il classificatore finale usa gli alberi sottostanti per produrre punteggi e previsioni?

risposte:

3 per risposta № 1

UN RandomForest è un metodo di ensemble che usa la media per fare la previsione, cioè tutti i subparatori adattati sono usati, tipicamente (ma non sempre) in un gruppo di voto a maggioranza, per arrivare alla previsione finale. Questo è solitamente vero per tutti i metodi di ensemble. Come Vivek Kumar sottolinea nei commenti, la previsione non lo ènecessariamente sempre un voto a maggioranza pura, ma può anche essere una maggioranza ponderata o addirittura qualche altra forma esotica di combinazione delle previsioni individuali (la ricerca sui metodi dell'insieme è in corso, sebbene in qualche modo messa da parte dall'apprendimento profondo).

Non esiste un albero medio che possa essere rappresentato graficamente,solo i ceppi decisionali che sono stati addestrati da sub-campioni casuali dell'intero set di dati e le previsioni che ciascuno di questi produce. Sono le previsioni stesse che sono mediate, non gli alberi / ceppi.


Solo per completezza, dal articolo di Wikipedia: (sottolineatura mia)

Foreste casuali o foreste decisionali casuali1[2] sono un metodo di apprendimento dell'insieme per la classificazione, la regressione e altri compiti, che operano costruendo una moltitudine di alberi decisionali al momento dell'allenamento ed emettendo la classe che è il modalità delle classi (classificazione) o significare previsione (regressione) dei singoli alberi.

modalità essendo il valore più comune, in altre parole la previsione di maggioranza.