/ / Gesamtblattzahl in H2O - R, Random-Forest, H2O

Gesamtanzahl der Blätter in H2O - r, Random-Forest, H2O

Ich habe einen zufälligen Wald in Wasser mit r gemacht. Es hat Bäume und Blätter.

Ich möchte wissen, wie viele Blätter. Ich vergleiche gerne meine Gesamtzahl der Zeilen mit den Blättern.

Ich habe 200 Bäume, 8 Schichten tief, benötige 5 Reihen pro Terminalblatt. Durchquere ich viele meiner Daten? Ich habe 20.000 Zeilen.

Gibt es eine saubere Möglichkeit, die Anzahl der Blätter im H2O RandomForest zu zählen?

Antworten:

2 für die Antwort № 1

Sie werden froh sein zu wissen, dass H2O diese Informationen speichert! Zum Beispiel (dies ist für den Iris-Datensatz)

m <- h2o.randomForest(1:4, 5, data)

Beim Drucken m Aha:

number_of_trees model_size_in_bytes min_depth max_depth mean_depth min_leaves  max_leaves mean_leaves
150               20217         1         9    3.72667          21         15     6.17333

Es gibt also 926 Blätter (6.17333 * 150).

Um es mit Code zu bekommen:

ms = m@model$model_summary
ms$number_of_trees * ms$mean_leaves