Zaimplementowałem klasyfikator KNN w java iMam dziwny wynik. Jeśli wykonuję analizę sentymentów na przykładowym zestawie książek Amazon, otrzymałem 55% precyzji. Z 100 dokumentów testowych 55 poprawnie sklasyfikowanych jako negatywne lub pozytywne opinie i 45 nieprawidłowo. Ale jeśli użyję KNN do przykładowej kamery lub książek kategorii, to dostaję 95% precyzji.
Są pewne wyjaśnienia, że mój kod jest błędny? Dowolny pomysł?
Odpowiedzi:
3 dla odpowiedzi № 1@ Christopher Pfohl ma rację. Są to różne podejścia z jedną kluczową różnicą dla Ciebie. Analiza uczuć (oparta na prostym worku słów) jest ogólnie bardziej skomplikowana niż klasyfikacja kategorii w twoim przypadku.
Przy okazji, tylko jedno wyjaśnienie, 55% to nie precyzja, to jest dokładność. (Więcej informacji: http://en.wikipedia.org/wiki/Accuracy_and_precision#In_binary_classification)