/ / Kontrola podobnosti medzi textovými údajmi - analýza klastrov, podobnosť, miera

Kontrola podobnosti medzi textovými údajmi - analýza klastrov, podobnosť, miera

Prosím, povedzte mi, ako merať podobnosťtextové údaje pre klastrovanie, pre číselné dáta môžeme merať pomocou euklidovskej vzdialenosti alebo akéhokoľvek iného merania vzdialenosti. Údaje sú kľúčové slová používané pri vyhľadávaní zhromaždených z webových stránok a druhá množina údajov je kolekcia úryvkov vrátených pri niektorom vyhľadávaní. podobnosť by mala byť podobná aj v zmysle.

odpovede:

0 pre odpoveď č. 1

Prečítajte si o podobnosti tf-idf a cosine.