/ / Wie viele Samples sind in einer Klasse optimal, wenn Sie den nächsten Nachbarn verwenden? - C ++, Algorithmus, Mustervergleich, nächster Nachbar

Wie viele Stichproben sind optimal in einer Klasse mit dem k-nächsten Nachbarn? - C ++, Algorithmus, Mustervergleich, nächster Nachbar

Ich habe den k-nächsten Algorithmus in meinem System implementiert. Es besteht aus 26 Klassen mit jeweils 100 Proben. In meinem Fall war K = 7 und es war vollkommen versuchend, das beste Ergebnis zu erzielen.

Ich weiß, dass K weise gewählt werden sollte, um es zu reduzierendas Geräusch bei der Klassifizierung. Aber wie sieht es mit der Anzahl der Proben aus? Gibt es eine allgemeine Regel wie "Je mehr Proben, desto besser das Ergebnis"? Kommt es auf etwas an?

Vielen Dank für Ihre Antworten.

Antworten:

0 für die Antwort № 1

Sie könnten versuchen, zu prüfen, was darunter liegtEin Mechanismus generiert Ihre Daten oder das Hintergrundwissen, das Sie über das Problem haben, das Ihnen eine Vorstellung von der relativen Größe des Rauschens und der tatsächlichen zugrunde liegenden Variation vermitteln kann. Z.B. Vorhersagen der Lieblingssportmannschaft vom Standort aus Ich würde mehr Veränderung erwarten als die Lieblingssportart vorhersagen, also kleinere K verwenden. Ich kenne jedoch nicht viele allgemeine Richtlinien, außer die Kreuzvalidierung zu verwenden.