Chcę dodać interfejs głosowy do mojej aplikacji na Androida. Dwa wymagania:
Muszę tylko rozpoznać z małego słownikasłów w dowolnym momencie - w zasadzie każdy klikalny element na ekranie, a większość klikalnych elementów ma już na nich tekst, więc dosłownie brzmiałoby „powiedz to, co widzisz”.
Ciągłe rozpoznawanie głosu, gdy aplikacja jest widoczna, chociaż mógłbym żyć z koniecznością powiedzenia „Ok app” przed wystąpieniem, które ma być wykonane.
Jaki jest optymalny sposób na wdrożenie tego?
Dzięki NickB
Odpowiedzi:
0 dla odpowiedzi № 1Jeśli chcesz czegoś offline, spojrzałbym na PocketSphinx (https://cmusphinx.github.io/wiki/tutorialandroid/). Użyłem go do rozpoznawania słów obudzonych offline. Wydaje się, że jest to błędne, ponieważ bardziej akceptuje to, co mówisz, niż mniej.
W celu ciągłego słuchania możesz zajrzeć na oprogramowanie Speech to Text firmy IBM Watson (https://github.com/watson-developer-cloud/android-sdk), czyli chmura bazująca na mowie na tekst.
Udało mi się to połączyć, używając PocketSphinx do wykrywania słów budzących, a następnie Watson, aby uzyskać dobre wyniki mowy na tekst.