Hilfe bei der Programmierung, Antworten auf Fragen / Spracherkennung / Unterstützt IBM Watson "Speaker Diarization" / "Speaker Recognition"? - Spracherkennung, IBM Cloud, Sprache-zu-Text, IBM Watson

Unterstützt IBM Watson "Speaker Diarization" / "Speaker Recognition"? - Spracherkennung, ibm-Wolke, Sprache-zu-Text, ibm-watson

Ich habe mit IBM Watsons Rede-zu-Text-Demo bei gespielt https://speech-to-text-demo.mybluemix.net/. Ich habe eine Audiodatei mit 2 Lautsprechern hochgeladen. Watson gab transkribierten Text ohne Sprecheridentifikation zurück. Es gibt keinen Hinweis darauf, welches Wort von welchem Sprecher gesprochen wurde. Unterstützt IBM Watson "Speaker Diarization" / "Speaker Recognition"?

Antworten:

4 für die Antwort № 1

Wir arbeiten an Sprecher-Diarisierung. Noch keine ETA, aber hoffentlich wird es bald kommen. Wie heute behandelt der Dienst das Audio so, als ob es derselbe Sprecher wäre

1 für die Antwort № 2

Nein, leider nicht.

Verwandte Fragen

Vb-Skript für Sprache zu Text (Spracherkennung)? - VBScript

Gibt es im IBM Speech Recognition Service eine Möglichkeit, die URL der Datei anstelle der Datei selbst zu senden - Speech-to-Text, ibm-watson

Geringe Genauigkeit der Sprachausgabe von Watson mit benutzerdefiniertem Modell - Spracherkennung, IBM-Watson, Watson

Kann ich bei i-vector-Experimenten dieselben Daten verwenden, um UBM und T-Matrix zu trainieren? - Spracherkennung

Wie route / pipe Ausgabe von Watson Text zu Sprache zu lokalen Lautsprecher vs Terminal - Raspberry-Pi, Watson-Konversation, Watson-Iot

Watson Speech to Text API für die Unterstützung der niederländischen Sprache mit Node.js - node.js, Sprache-zu-Text, ibm-watson

Deep-Learning-Software für die Sprechererkennung - Neuronales Netzwerk, Deep-Learning, Spracherkennung

Android Lautsprechererkennung - Java, Android

Watson Text to Speech funktioniert nicht in Chrome - Java, Google-Chrome, Text-zu-Sprache, ibm-Watson

Spracherkennung in Java mit Freets - Java, Spracherkennung, Freetts

Gibt es eine Möglichkeit, die Effizienz der Sprache-zu-Text-Engine von IBM Watson zu erhöhen, um verschiedene Frequenzen zu verstehen? - Java, ibm-Wolke, Sprache-zu-Text, ibm-watson

IBM Watson für die Onkologie API - ibm-watson

Erkennt IBM Watson rede to text api verschiedene Akzente? - ibm-cloud, Sprache-zu-Text, ibm-watson

Wie man bluemix text to speech Dienste mit Knoten einbinden kann - ibm-cloud, text-to-rede, ibm-watson

Node-Red / Konversationsdienst - ibm-cloud, ibm-watson, node-red, watson-conversation

Wie fügt man dem Unity-Projekt die Spracherkennung hinzu? [geschlossen] - c #, unity3d, Spracherkennung, erweiterte Realität, vuforia

Spracherkennung mit HMM oder MFCC - c #, c ++, Spracherkennung, mfcc

Gibt es textunabhängige Funktionen im Stimmendruck - künstliche Intelligenz, Signalverarbeitung, Spracherkennung

Hinzufügen von kontinuierlicher Spracherkennung zu meiner Android-App - Android, Spracherkennung

Watson Speech Android SDK zeigt INSTALL_FAILED_NO_MATCHING_ABI - Android, Sprache-zu-Text, ibm-watson