Snažím sa identifikovať fonémy v hlasoch pomocou tréningovej databázy známych.
Zaujímalo by ma, či existuje spôsob, ako identifikovať spoločné znaky mojej tréningovej vzorky a použiť ju na klasifikáciu nového.
Zdá sa, že existujú dve cesty:
- Dajte procesu surové / normalizované údaje a vráti podobné
- Extrahujte určité metriky, ako je pitch, formants, atď. A porovnajte s tréningovou sadou
Môj záujem je prvý! Akékoľvek odporúčania týkajúce sa strojového učenia alebo regresných metód / algoritmov?
odpovede:
0 pre odpoveď č. 1Vzhľadom k tomu, že ste označili Python, veľmi odporúčam hľadanie scikit naučiť, vynikajúcu knižnicu Python pre strojUčenie. Ich doklady sú veľmi dôkladné a mali by vám dať dobrý kurz v algoritmoch Machine Learning a implementácii (vrátane klasifikácie, regresie, zhlukovania atď.).
0 pre odpoveď č. 2
Vaše body 1 a 2 nie sú veľmi odlišné: 1) je výsledok klasifikačného problému 2) je funkcia, ktorú dáte pre klasifikáciu. Potrebujete dobrý klasifikátor (SVM, rozhodovacie stromy, hierarchické klasifikátory atď.) A dobrú sadu funkcií (pitch, formants etc., ktoré ste spomenuli).