Ciao :) Ho creato un bot di Facebook Messenger con webhook sul mio server per gestire i messaggi.
recentemente ho aggiunto una funzionalità interessante: riconoscimento vocale.
ma, ricevo l'allegato audio di Facebook come url to file mp4, nessuno dei familiari linguaggi di discorso 2 (Google speech, Watson ecc.) supporta mp4 quindi devo convertirlo in FLAC e in seguito posso ottenere la trascrizione.
mi è costato circa 6-8 secondi a 5 secondi audio ..
C'è qualche api di testo Speech 2 che supporta mp4? o in alternativa un modo per ottenere l'audio FLAC da Facebook?
Grazie!
risposte:
1 per risposta № 1Amazon Lex supporta fino a 15 secondi di input vocale per la conversione in testo. https://aws.amazon.com/lex/faqs/