/ / Зробити графік з sklearn RandomForestClassifier (не з окремих clf.estimators_) - python, scikit-learn, graphviz, випадковий ліс, дерево рішень

Зробіть графік із sklearn RandomForestClassifier (не з окремих clf.estimators_) - python, scikit-learn, graphviz, random-forest, tree-рішення

Python. Sklearn. RandomForestClassifier. Після установки RandomForestClassifier, чи виробляє він якийсь єдиний "кращий" "усереднений" консенсус-дерево, яке можна використовувати для створення графіза?

Так, я подивився на документацію. Ні, нічого про це не говорить RandomForestClassifier не має tree_ атрибут. Тим не менш, ви можете отримати окремі дерева в лісі clf.estimators_ тому я знаю, що з одного з них я можу зробити графік. Є Приклад цього тут. Я міг би навіть забити всі дерева і знайти дерево з найвищою оцінкою серед лісу і вибрати той ... але це не те, що я прошу.

Я хочу зробити graphviz з "усередненого" остаточного результату випадкового лісового класифікатора. Це можливо? Або, чи використовує останній класифікатор базових дерев для отримання результатів і прогнозів?

Відповіді:

3 для відповіді № 1

А. RandomForest є методом ансамблю, який використовує усереднення для прогнозування, тобто використовуються всі вкладені підкласифікатори, зазвичай (але не завжди) в ансамблі більшості, щоб прийти до остаточного прогнозу. Це звичайно справедливо для всіх методів ансамблю. Як Vivek Kumar Вказує в коментарях, прогноз не єобов'язково завжди чистий більшість голосів, але також може бути зваженою більшістю або дійсно іншою екзотичною формою поєднання індивідуальних прогнозів (дослідження методів ансамблю продовжується, хоча дещо осторонь глибокого навчання).

Не існує середнього дерева, яке можна було б намалювати,тільки рішення пнів, які були підготовлені з випадкових підпроб від усього набору даних і прогнозів, що кожен з них виробляє. Це самі прогнози, які усереднюються, а не дерева / пні.


Просто для повноти, від вікіпедія статті: (акцент мій)

Випадкові ліси або випадкові ліси1[2] є методом навчання ансамблю для класифікації, регресії та інших завдань, які діють шляхом побудови безлічі дерев рішень під час навчання і виведення класу, який є режим класи (класифікація) або означає прогнозування (регресія) окремих дерев.

режим це найпоширеніша цінність, тобто більшість прогнозів.