/ / Identification des caractéristiques du signal - Python, audio, apprentissage automatique, traitement du signal

Identification des caractéristiques du signal - Python, audio, apprentissage automatique, traitement du signal

J'essaie d'identifier des phonèmes dans des voix à l'aide d'une base de données de formation de personnes connues.

Je me demande s’il existe un moyen d’identifier les caractéristiques communes de mon échantillon de formation et de les utiliser pour en classifier un nouveau.

Il semble y avoir deux chemins:

  1. Donnez au processus des données brutes / normalisées et il renverra des données similaires
  2. Extraire certaines métriques telles que le pitch, les formants, etc. et les comparer au set d'entraînement

Mon intérêt est le premier! Des recommandations sur les méthodes / algorithmes d'apprentissage automatique ou de régression

Réponses:

0 pour la réponse № 1

Puisque vous avez étiqueté Python, je vous recommande vivement de vous pencher sur scikit-learn, une excellente bibliothèque Python pour MachineApprentissage. Leurs documents sont très complets et devraient vous donner un bon cours intensif en algorithmes d’apprentissage automatique et en implémentation (classification, régression, mise en cluster, etc.)


0 pour la réponse № 2

Vos points 1 et 2 ne sont pas très différents: 1) est le résultat final d'un problème de classification 2) est la fonctionnalité que vous donnez pour la classification. Vous avez besoin d'un bon classificateur (SVM, arbres de décision, classificateurs hiérarchiques, etc.) et d'un bon ensemble de fonctionnalités (hauteur, formatants, etc., que vous avez mentionnés).