/ / क्या Google TTS को बाहरी लाइब्रेरी के रूप में उपयोग करने का कोई तरीका है? - एंड्रॉयड, गूगल-पाठ से भाषण

वहाँ बाहरी पुस्तकालय के रूप में गूगल टीटीएस का उपयोग करने के लिए एक तरीका है?-एंड्रॉयड, गूगल पाठ से भाषण

मैं हूँ Google TTS लाइब्रेरी का उपयोग करना Android एप्लिकेशन में ... Everythnig पूरी तरह से काम करता है ... लेकिन समस्या कुछ Android डिवाइस में पिको टीटीएस की है। इसके अलावा, जिस भाषा का मैं उपयोग करता हूं उसे डाउनलोड किया जाना चाहिए ...

तो मेरा सवाल है, क्या एंड्रॉइड Google टीटीएस इंजन को बाहरी पुस्तकालय के रूप में उपयोग करने का एक तरीका है, क्या समर्थन पुस्तकालय है? ... क्या यह ओपन सोर्स प्रोजेक्ट है?

यदि है, तो वह कैसे करें?

मैं यह सवाल पूछ रहा हूँ, क्योंकि कुछ उपकरण केवल पिको टीटीएस का समर्थन करते हैं ... इसलिए बाहरी पुस्तकालय समस्या का समाधान करेंगे ...

उत्तर:

उत्तर № 1 के लिए 1

यह एक पुराना सवाल है। अंतिम हालिया समाधान, और सबसे प्रभावी है

curl "https://translate.google.com/translate_tts?ie=utf-8&q=hello&tl=en&tk=995126.592330&client=t" -H "user-agent: stagefright/1.2 (Linux;Android 5.0)" -H "referer: https://translate.google.com/" > google_tts.mp3

और यह काफी हद तक चर्चा में है यहाँ.

यह समाधान (जो भविष्य में टूट सकता है), अजगर पुस्तकालय में लागू किया गया है gTTS, कि आपी को एक उपयोगी तरीके से लपेटता है, जिससे आप भाषा, पाठ और फ़ाइल को आसानी से लिख सकते हैं:

>> from gtts import gTTS
>> from tempfile import TemporaryFile
>> tts = gTTS(text="Hello", lang="en")
>> f = TemporaryFile()
>> tts.write_to_fp(f)
>> f.close()

ध्यान दें। यदि हम इसके विपरीत मानते हैं: भाषण टू टेक्स्ट, हाल ही में Google ने जारी किया है क्लाउड स्पीच एपीआई जो मशीन लर्निंग का उपयोग करता है, यह अधिक भाषाओं का समर्थन करता है, और यह भाषण मान्यता के लिए आधिकारिक एपीआई है।

वैसे, आज बहुत सारे अन्य प्लेटफ़ॉर्म ऐसा कर रहे हैं, और शायद बेहतर है कि टीटीएस वेब सेवा। Microsoft ने ए भाषण एपीआई उनके नए संज्ञानात्मक प्रणालियों के हिस्से के रूप में, और यह 5000 प्रश्नों / माह तक मुफ्त है। आईबीएम वाट्सन टेक्स्ट टू स्पीच एपीआई बेहद शक्तिशाली है और हाल ही में पेश किया गया है अभिव्यंजक संश्लेषण यह है कि आवाज में भावनाओं को कैसे संश्लेषित किया जाए। इन सभी क्लाउड एप का उपयोग करता है https://www.w3.org/TR/speech-synthesis/ मार्कअप लैंग्वेज के रूप में स्पीच को टेक्स्ट डिफाइन करने के लिए, यह सिंपल अनलिस्टेड टेक्स्ट को यूज करने की तुलना में कहीं ज्यादा एक्सप्रेसिव है।