Аз съм нов за разпознаване на реч, андроид и азимам случай, в който трябва да изградя приложение за Android, което отнема команди (ограничен набор от команди, по-малко от 100) от потребители и изпълнява някаква логика. Аз отидох малко и открих, че може да се направи следното
- Използвайте google cloud speech api
- Използвайте вградената реч на Android за способност за текстообработка (Различава ли се от Google Api-Cloud speech speech? Ако е така, как?). Също така какви са предимствата и недостатъците на използването на офлайн режим на андроид реч към текста?
- Използвайте библиотеки за разпознаване на реч с отворен код като Kaldi, CMU Sphinx (изглеждаше, че се нуждаят от много усилия за събиране и обучение на данните)
Може ли някой да ми предложи кой от горните би могъл най-добре да отговарят на моя случай употреба? Имам ограничен набор команди и скоростта има най-голямо значение за мен.
Аз наистина съм объркан и по този начин поставям този въпрос. Благодаря предварително.
Отговори:
1 за отговор № 1Използвайте google cloud speech api
Много е скъпо, тъй като трябва да платите за всяка заявка.
Използвайте вградената реч на Android за способност за текстообработка (Различава ли се от Google Api-Cloud speech speech? Ако е така, как?). Също така какви са предимствата и недостатъците на използването на офлайн режим на андроид реч към текста?
Вграденият API е добре да използвате. Тя е различна от API за облаци и е безплатна. Той не работи офлайн прозрачно за потребителя обаче. Лошата страна е бавна и не можете да конфигурирате речника. Така че той ще декодира всички думи вместо някакъв конкретен набор от команди и често ще обърка необходимите команди с други думи в шума.
Използвайте библиотеки за разпознаване на реч с отворен код като Kaldi, CMU Sphinx (изглеждаше, че се нуждаят от много усилия за събиране и обучение на данните)
Правилното развитие винаги е усилие.