/ / Entscheidungsbaum und neuronales Netzwerk für Datensatz - maschinelles Lernen, neuronales Netzwerk, Datensatz, Weka, Entscheidungsbaum

Entscheidungsbaum und neuronales Netzwerk für Datensatz - maschinelles Lernen, neuronales Netzwerk, Datensatz, Weka, Entscheidungsbaum

Ich schaue mir die Vor- und Nachteile ansowohl ein Entscheidungsbaum als auch ein neuronales Netzwerk für einen Datensatz. Ich habe im Internet versucht, Antworten zu finden, aber alles, was ich zu finden scheint, sind die Vor- und Nachteile von jedem im Gesamtbild. Im Grunde versuche ich herauszufinden, warum ein Entscheidungsbaum und ein neuronales Netzwerk gut dafür sind ein bestimmter Datensatz Ich gehe davon aus, wenn der Datensatz groß oder klein ist, Ausreißer und fehlende Daten würden sich darauf auswirken, ob die Verwendung von Entscheidungsbäumen oder neuronalen Netzen genau oder weniger genau ist. Vielen Dank im Voraus

Antworten:

0 für die Antwort № 1

So denke ich über die Wahl des maschinellen Lernmodells:

1) Neuronale Netze sind die flexibelsten, die gut oder schlecht sein können. Für Aufgaben, bei denen Sie Millionen von Trainingsbeispielen haben, wird ein neuronales Netz im Allgemeinen am besten funktionieren.

2) Wenn Sie wenige Trainingsbeispiele haben (wie, vielleicht10 oder weniger Trainingsbeispiele pro Dimension Ihres Merkmalsvektors), dann besteht für ein neuronales Netz das Risiko einer Überanpassung. Ein Modell mit weniger Flexibilität, wie Entscheidungsbaum oder naive Bayes, könnte einen besseren Job machen. In diesen Fällen können Sie dennoch ein neuronales Netz verwenden, wenn Sie die Metaparameter sorgfältig einstellen, um die Überanpassung zu reduzieren.

3) Wenn Sie wenige Trainingsbeispiele haben, UND dieDas zugrundeliegende Phänomen, das Sie zu modellieren versuchen, ist zu kompliziert, um mit einfachen Entscheidungsgrenzen zu modellieren, dann wird keines der generischen Modelle gut funktionieren. Allerdings wenn Sie das Phänomen a priori kennen (zB wenn Sie die Form der Physik kennen Gleichung, die es beschreibt) dann können Sie Ihr eigenes benutzerdefiniertes Modell erstellen und seine unbekannten Parameter mit Gradientenabstieg trainieren.

Andrew Ng "s kostenlosen Maschinenkurs ist eine gute Quelle, die über einige der Daumenregeln und Intuition über Überanpassung und Wahl des Modells spricht.