Pomoc w programowaniu, odpowiedzi na pytania / Tekst na mowę / Tworzenie pakietu TTS - zamiana tekstu na mowę

Tworzenie pakietu TTS - zamiana tekstu na mowę

Jak mogę utworzyć pakiety głosowe TTS?

Mam małą aplikację konwertującą tekst na mowę,teraz używam wbudowanych w tts pakietów microsoft, aby zrobić tekst, ale chcę uzyskać profesjonalnego artystę głosu, aby stworzyć nowy tekst do mówienia. pakiet głosowy (TTS)

Odpowiedzi:

5 dla odpowiedzi № 1

Tworzenie nowego głosu dla mechanizmu konwersji tekstu na mowęto złożony proces. To nie tylko kwestia nagrania głosu przez artystę głosu i po prostu stworzenia z niego głosu. Jest wiele pracy (podzielenie audio na fonemy, budowanie danych głosowych, budowanie słownika, poprawianie reguł łączenia i syntezy dźwięku).

Dla silnika głosowego takiego jak MicrosoftSilnik Text-to-Speech stoi również przed problemem polegającym na tym, że format głosu jest zastrzeżony i nie można tworzyć nowych głosów w tym formacie. Jesteś także ograniczony możliwościami silnika.

Twój najlepszy zakład w tej chwili to:

przejście na używanie tekstu na mowę eSpeaksilnik i używanie espeakedit do tworzenia własnego głosu (kontakt z deweloperem w celu uzyskania pomocy) - ten silnik używa metody syntezy, która brzmi podobnie do głosu Microsoftu i głosu, którego używa Stephen Hawking, ale są one bardzo jasne i wymowa jest ogólnie bardzo dobra;
przy użyciu innego mechanizmu przetwarzania tekstu na mowę, takiego jak Cepstral, który używa nagrań głosowych (te wydają się brzmieć bardziej jak człowiek, ale odkryłem, że prozodia nie jest zbyt dobra, rujnując wynikowy dźwięk);
korzystanie z usługi Cepstral w celu stworzenia głosu specyficznego dla Twoich potrzeb (co prawdopodobnie będzie kosztowne).

Patrzę na wykorzystanie danych dźwiękowych z librivox.org do generowania głosów z tekstu na mowę. Jest to prawdopodobnie 3-4 lata dalej, zanim będę miał coś bliskiego funkcjonalności.