Bitte führen Sie mich, wie man Ähnlichkeit von messen kannTextdaten für Clustering, für numerische Daten können wir mit euklidischen Distanzmaßen oder anderen Entfernungsmaßen messen. Bei den Daten handelt es sich um Schlüsselwörter, die für die Suche auf Websites verwendet werden, und bei dem zweiten Datensatz handelt es sich um die Sammlung von Snippets, die bei einer Suche zurückgegeben werden. die Ähnlichkeit sollte auch ähnlich sein.
Antworten:
0 für die Antwort № 1Lesen Sie über Tf-IDF und Kosinusähnlichkeit.