Направих класификатора KNN в Java иИмам странен резултат. Ако направя анализ на настроенията на пример за набор от данни, Amazon Books Review имам 55% точност. От 100 тестов документ 55 правилно се класифицира като отрицателен или положителен преглед и 45 неправилно. Но ако използвам KNN за категоризиране на категории например камера или книги тогава имам 95% точност.
Има някакво обяснение, че кодът ми е грешен? Някаква идея?
Отговори:
3 за отговор № 1@ Кристофър Пфол е прав. Те са различни подходи с една ключова разлика за вас. Анализът на настроенията (въз основа на проста чанта на думите) е много по-сложно, отколкото класификацията на категориите във вашия случай.
Btw, само едно изясняване, 55% не е точност, тоест точност. (Повече информация: http://en.wikipedia.org/wiki/Accuracy_and_precision#In_binary_classification)