/ / Google-speech-api que transcribe números hablados incorrectamente - reconocimiento de voz, google-speech-api

Google-speech-api transcribe números hablados incorrectamente - reconocimiento de voz, google-speech-api

Comencé a usar la API de google speech para transcribir audio.

El audio que se transcribe contiene muchos números hablados uno tras otro.

P.ej. 273 298

Pero la transcripción vuelve 270-3298.

Mi conjetura es que lo está interpretando como una especie de número de teléfono.

Lo que quiero es una salida sin analizar, por ejemplo. "dos setenta tres dos noventa ocho" con los que puedo lidiar y analizar por mi cuenta.

¿Hay una configuración o soporte para este tipo de cosas?

Gracias

Respuestas

1 para la respuesta № 1

Intenta pasar un contexto de habla con algunos consejos de frases. Cómo usarlo está documentado aquí: https://cloud.google.com/speech/docs/basics#phrase-hints

Dale los números detallados que quieres que sean reconocidos.

"speech_context": {
"phrases":["zero", "one", "two", ... "nine", "ten", "eleven", ... "twenty", "thirty,..., "ninety"]
}

Esto no está garantizado para funcionar, pero puede ayudar.


0 para la respuesta № 2

Para el registro, he intentado la solución de Curtbert arribay no funciona, desafortunadamente. Hace poco publiqué otra pregunta para ver si alguien ha encontrado una manera de vencer este comportamiento, ya que me impide implementar un servicio de transcripción que había planeado.