Ich habe einen zufälligen Wald in Wasser mit r gemacht. Es hat Bäume und Blätter.
Ich möchte wissen, wie viele Blätter. Ich vergleiche gerne meine Gesamtzahl der Zeilen mit den Blättern.
Ich habe 200 Bäume, 8 Schichten tief, benötige 5 Reihen pro Terminalblatt. Durchquere ich viele meiner Daten? Ich habe 20.000 Zeilen.
Gibt es eine saubere Möglichkeit, die Anzahl der Blätter im H2O RandomForest zu zählen?
Antworten:
2 für die Antwort № 1Sie werden froh sein zu wissen, dass H2O diese Informationen speichert! Zum Beispiel (dies ist für den Iris-Datensatz)
m <- h2o.randomForest(1:4, 5, data)
Beim Drucken m
Aha:
number_of_trees model_size_in_bytes min_depth max_depth mean_depth min_leaves max_leaves mean_leaves
150 20217 1 9 3.72667 21 15 6.17333
Es gibt also 926 Blätter (6.17333 * 150
).
Um es mit Code zu bekommen:
ms = m@model$model_summary
ms$number_of_trees * ms$mean_leaves