Привіт :) Я побудував бога Facebook messenger з webhook до мого сервера, щоб обробляти повідомлення.
нещодавно я додав цікаву функцію - розпізнавання голосу.
але, я отримую вкладені файли у форматі Facebook як URL mp4 файл, жоден з знайомих тексту 2-го мовлення API (мова Google, Watson і т.д.) підтримує mp4, тому я повинен перетворити його на FLAC, а потім я можу отримати транскрипт.
це коштувало мені близько 6-8 секунд до 5 сек.
Існує будь-який текст речі 2 API, які підтримують MP4? або альтернативно будь-який спосіб отримати FLAC аудіо з Facebook?
Дякую!
Відповіді:
1 для відповіді № 1Amazon Lex підтримує до 15 секунд введення мовлення для перетворення тексту. https://aws.amazon.com/lex/faqs/