Підкажіть, будь ласка, як виміряти схожістьтекстові дані для кластеризації, для числових даних ми можемо виміряти евклідовою мірою відстані або будь-якою іншою мірою відстані. Дані - це ключові слова, які використовуються для пошуку, зібрані з веб-сайту, а другий набір даних - це набір фрагментів, повернутих під час деяких пошукових запитів. подібність має бути подібною і за значенням.
Відповіді:
0 для відповіді № 1Читайте про схожість tf – idf та косинуса.