Prosím, povedzte mi, ako merať podobnosťtextové údaje pre klastrovanie, pre číselné dáta môžeme merať pomocou euklidovskej vzdialenosti alebo akéhokoľvek iného merania vzdialenosti. Údaje sú kľúčové slová používané pri vyhľadávaní zhromaždených z webových stránok a druhá množina údajov je kolekcia úryvkov vrátených pri niektorom vyhľadávaní. podobnosť by mala byť podobná aj v zmysle.
odpovede:
0 pre odpoveď č. 1Prečítajte si o podobnosti tf-idf a cosine.