Ich habe mit IBM Watsons Rede-zu-Text-Demo bei gespielt https://speech-to-text-demo.mybluemix.net/. Ich habe eine Audiodatei mit 2 Lautsprechern hochgeladen. Watson gab transkribierten Text ohne Sprecheridentifikation zurück. Es gibt keinen Hinweis darauf, welches Wort von welchem Sprecher gesprochen wurde. Unterstützt IBM Watson "Speaker Diarization" / "Speaker Recognition"?
Antworten:
4 für die Antwort № 1Wir arbeiten an Sprecher-Diarisierung. Noch keine ETA, aber hoffentlich wird es bald kommen. Wie heute behandelt der Dienst das Audio so, als ob es derselbe Sprecher wäre
1 für die Antwort № 2
Nein, leider nicht.