/ / Для перевірки подібності між текстовими даними - кластерний аналіз, схожість, міра

Для перевірки подібності між текстовими даними - кластерний аналіз, подібність, міра

Підкажіть, будь ласка, як виміряти схожістьтекстові дані для кластеризації, для числових даних ми можемо виміряти евклідовою мірою відстані або будь-якою іншою мірою відстані. Дані - це ключові слова, які використовуються для пошуку, зібрані з веб-сайту, а другий набір даних - це набір фрагментів, повернутих під час деяких пошукових запитів. подібність має бути подібною і за значенням.

Відповіді:

0 для відповіді № 1

Читайте про схожість tf – idf та косинуса.