Пуснах С4.5 Алгоритъм на подрязване в Weka, като се използва 10-кратна кръстосана проверка. Забелязах, че необрязаното дърво има по-висока точност на изпитване от подрязаното. Не можах да разбера причината защо резитбата на дървото не подобри точността на тестване?
Отговори:
1 за отговор № 1Подрязването намалява размера на дървото на решениятакоето (като цяло) намалява точността на тренировката, но подобрява точността на тестовите (невиждани) данни. Подрязването помага да се смекчи прекомерното приспособяване, където бихте постигнали перфектна точност на данните за тренировките, но моделът (т.е. дървото на решенията) се проваля винаги, когато види невиждани данни.
Така че подрязването трябва да подобри точността на тестване. От вашия въпрос е трудно да се каже защо подрязването не подобрява точността на тестване.
Можете обаче да проверите вашата точност на тренировка. Просто проверете дали резитбата намалява точността на тренировката или не. Ако не, тогава проблемът е някъде другаде. Вероятно тогава трябва да помислите за броя функции или размера на набора от данни!