/ / klastrová analýza? označenie klastra - strojové učenie, klasifikácia, klastrová analýza, dolovanie dát

analýza klastrov? označenie klastra - strojové učenie, klasifikácia, klastrová analýza, dolovanie dát

Som veľmi zmätený nasledujúcimi dvoma problémami: Mám 15-dimensional dataset, ktorý by mal byť použitý na zhlukovanie množstva typov útokov obsiahnutých v množine údajov.

1. Teraz som už zoskupil svoj súbor údajov do 5 klastrov (5 útokov). Vie niekto, ako môžem poukázať, ktorý cluster je ten útok? (ako označiť klastre nielen ako "klastr 1, klastra 2 ...")

2. Pri klasifikácii pod dohľadom máme súbor s tréningovými údajmi a testovacím súborom a testovanie sa vykonáva s klasifikátorom, ktorý bol zostavený z množiny tréningových údajov. Moja otázka je, môže sa rovnaký prístup použiť aj na zhlukovanie. Rovnako ako budovanie modelu s algoritmom zoskupovania a potom automaticky klasifikovať novú inštanciu do konkrétneho klastra? Je to dosiahnuteľné?

odpovede:

5 pre odpoveď č. 1

Ako by mala byť nesledujúca metóda schopná identifikovať pomenované útoky?

Ľudské priradené meno nie je v údajoch!

Pre niektoré algoritmy zoskupovania môžete priradiť novéautomaticky, ale vo všeobecnosti nemôžete (nie bez poznania modelu, ktorý používa zoskupenie). V najhoršom prípade by nové pozorovanie mohlo byť napr. zlúčiť dva zhluky do jedného. Čo budeš robiť potom?

Ak chceš klasifikácia, použitie klasifikácia, nie zoskupovanie.

Klastrovanie má veľmi odlišnú myseľ. Ak sa k nej pristupujete z hľadiska klasifikácie, nebudete to skutočne chápať. Klastrovanie používate na hľadanie niečoho nevedno v údajoch, klasifikácia na zovšeobecnenie niečoho známy k novým údajom.

Ak je to potrebné, môžete tiež naučiť klasifikátor na vašom klastri. Ale nedávajte to slepotu, najprv sa uistite, že klastre sú skutočne niečím užitočné veľa jednoduchšie prísť s úplne bezvýznamným výsledkom zhlukovania ako s dobrým zhlukovaním. Školenie klasifikátora o bezcenných klastroch neprinesie zmysluplný výstup.