/ / C4.5 Алгоритъмът на дървото за решение не подобрява точността - машинно обучение, weka, j48, c4.5

C4.5 Дърво за решения алгоритъмът не подобрява точността - машинно обучение, weka, j48, c4.5

Пуснах С4.5 Алгоритъм на подрязване в Weka, като се използва 10-кратна кръстосана проверка. Забелязах, че необрязаното дърво има по-висока точност на изпитване от подрязаното. Не можах да разбера причината защо резитбата на дървото не подобри точността на тестване?

Отговори:

1 за отговор № 1

Подрязването намалява размера на дървото на решениятакоето (като цяло) намалява точността на тренировката, но подобрява точността на тестовите (невиждани) данни. Подрязването помага да се смекчи прекомерното приспособяване, където бихте постигнали перфектна точност на данните за тренировките, но моделът (т.е. дървото на решенията) се проваля винаги, когато види невиждани данни.

Така че подрязването трябва да подобри точността на тестване. От вашия въпрос е трудно да се каже защо подрязването не подобрява точността на тестване.

Можете обаче да проверите вашата точност на тренировка. Просто проверете дали резитбата намалява точността на тренировката или не. Ако не, тогава проблемът е някъде другаде. Вероятно тогава трябва да помислите за броя функции или размера на набора от данни!