Pomoc w programowaniu, odpowiedzi na pytania / Android / Dodawanie ciągłego rozpoznawania mowy do mojej aplikacji na Androida - Android, rozpoznawanie mowy

Dodanie rozpoznawania mowy ciągłej do mojej aplikacji na Androida - Android, rozpoznawanie mowy

Chcę dodać interfejs głosowy do mojej aplikacji na Androida. Dwa wymagania:

Muszę tylko rozpoznać z małego słownikasłów w dowolnym momencie - w zasadzie każdy klikalny element na ekranie, a większość klikalnych elementów ma już na nich tekst, więc dosłownie brzmiałoby „powiedz to, co widzisz”.
Ciągłe rozpoznawanie głosu, gdy aplikacja jest widoczna, chociaż mógłbym żyć z koniecznością powiedzenia „Ok app” przed wystąpieniem, które ma być wykonane.

Jaki jest optymalny sposób na wdrożenie tego?

Dzięki NickB

Odpowiedzi:

0 dla odpowiedzi № 1

Jeśli chcesz czegoś offline, spojrzałbym na PocketSphinx (https://cmusphinx.github.io/wiki/tutorialandroid/). Użyłem go do rozpoznawania słów obudzonych offline. Wydaje się, że jest to błędne, ponieważ bardziej akceptuje to, co mówisz, niż mniej.

W celu ciągłego słuchania możesz zajrzeć na oprogramowanie Speech to Text firmy IBM Watson (https://github.com/watson-developer-cloud/android-sdk), czyli chmura bazująca na mowie na tekst.

Udało mi się to połączyć, używając PocketSphinx do wykrywania słów budzących, a następnie Watson, aby uzyskać dobre wyniki mowy na tekst.

Powiązane pytania

Skrypt Vb dla Mowy do tekstu (rozpoznawanie mowy)? - vbscript

Czy istnieje sposób w usłudze rozpoznawania mowy firmy IBM do wysyłania adresu URL pliku zamiast samego pliku - mowa-do-tekstu, ibm-watson

Który język programowania ma najbardziej dojrzałe API rozpoznawania mowy? - rozpoznawanie mowy

Głębokie oprogramowanie do nauki rozpoznawania głośników - sieć neuronowa, głębokie uczenie się, rozpoznawanie głosu

MS SAPI sdk odpowiednik na OSX - macos, rozpoznawanie mowy, sapi, fonetyka

Rozpoznawanie głosu w java za pomocą freets - java, rozpoznawanie głosu, freetts

Jak korzystać z innej usługi rozpoznawania mowy na moim urządzeniu Nexus 5? - Java, Android, rozpoznawanie mowy, mowa-tekst, nexus-5

Jak dodać rozpoznawanie mowy Google w aplikacji [zamknięte] - iphone, ios, rozpoznawanie mowy

co zrobić w przypadku aplikacji głosowej dla ios? - ios, rozpoznawanie mowy, zamiana tekstu na mowę, rozpoznawanie głosu, zamiana mowy na tekst

rozpoznawanie mowy za pomocą HMM lub MFCC - c #, c ++, rozpoznawanie mowy, mfcc

Audio fingerprinting w Androidzie - android, arduino, audio-fingerprinting

Jak mogę korzystać z Google Cloud speech API z Androida? - Android, rozpoznawanie mowy, mowa-do-tekstu, google-speech-api

Jak przetworzyć rozpoznawanie mowy Google w tle? (Aplikacja nie jest aktywna) - Android, usługa, mowa-do-tekstu

Wejście audio w emulatorze Androida - Android, rozpoznawanie głosu

Jaka jest różnica między Chrome TTS, Google TTS, Cloud Speech API i Android TTS? - Android, google-chrome-extension, zamiana tekstu na mowę, google-text-to-speech, google-cloud-speech

Android SpeechRecognizer: stopListening () vs. cancel () - android, rozpoznawanie mowy, rozpoznawanie głosu

Propozycja wyboru mowy do tekstu apis - android, rozpoznawanie mowy, mowa-do-tekstu, mowa, google-speech-api

Usługa rozpoznawania mowy w systemie Android - Android, rozpoznawanie mowy, mowa-tekst

Rozpoznawanie mowy: hindi czy gujarti? - Android, rozpoznawanie mowy

Android 2.2.1 Nexus jeden: problem z rozpoznawaniem głosu - Android, rozpoznawanie mowy, rozpoznawanie głosu, android-2.2-froyo