मुक्त AI पाठ्य ते वक्तव्यName
33+ ओपन सोर्स मॉडेल, 273+ आवाज, 33+ भाषा. खाते आवश्यक नाही.
आवाज AI साठी तुम्हाला हवे ते सर्वName
30+ उपकरणे ओपन-सोर्स AI मॉडेल्सद्वारे चालविली जातात
33+ AI आवाज मॉडेलName
एका प्लॅटफॉर्मवर खुले स्रोत TTS मॉडेलचे सर्वात व्यापक संग्रह
Kokoro मोकळे
कोकोरो हे 82 दशलक्ष पैरामीटर पाठ्य- ते- वक्तव्य मॉडेल आहे जे त्याच्या वजन वर्गापेक्षा जास्त आहे. त्याचे लहान आकार असले तरी, ते उल्लेखनीय नैसर्गिक आणि अभिव्यक्तीशील वक्तव्य निर्माण करते. कोकोरो अनेक भाषांना समर्थन देते ज्यात इंग्रजी, जपानी, चिनी व कोरियाई यांचा समावेश आहे ज्यात विविध अभिव्यक्तीशील आवाज आहेत. ते अत्यंत जलद चालते - जीपीयूवरील वास्तविक वेळेपेक्षा सुमारे 100 पट जलद ऑडिओ निर्माण करते.
सर्वोत्तम: कमीत कमी विलंबतासह उच्च दर्जाचे TTS, स्ट्रीमिंग अनुप्रयोगName
मोफत प्रयत्न करा
Piper मोकळे
Piper हे Rhasspy द्वारे विकसित केले गेलेले एक हलके पाठ्य-भाष्य इंजिन आहे जे VITS आणि larynx आर्किटेक्चर वापरते. ते पूर्णपणे CPU वर चालते, जे ते अत्यंत उपकरणांसाठी, घरातील स्वयंचलितीकरणासाठी आणि ऑफलाइन TTS आवश्यक असलेल्या अनुप्रयोगांसाठी आदर्श बनवते. 30+ भाषांमधील 100 पेक्षा जास्त आवाजांसह, Piper ने Raspberry Pi4वरही वास्तविक वेळेत नैसर्गिक-ध्वनी ध्वनी प्रदान केला आहे.
सर्वोत्तम: जलद पूर्वदृश्य, प्रवेशीयता, व अंतर्भूतीत अनुप्रयोगName
मोफत प्रयत्न करा
VITS मोकळे
VITS (विविधता निष्कर्षासह विरोधाभास शिकणे अंत- ते- अंत पाठ- ते- भाषणासाठी) एक समांतर अंत- ते- अंत TTS पद्धत आहे जी सध्याच्या दोन- टप्प्या मॉडेलपेक्षा अधिक नैसर्गिक आवाज ध्वनी निर्माण करते. ते वैविध्यपूर्ण निष्कर्षासह सामान्यीकरण प्रवाह आणि विरोधाभास प्रशिक्षण प्रक्रियासह वाढविलेले स्वीकारते, नैसर्गिकतेमध्ये उल्लेखनीय सुधारणा प्राप्त करते.
सर्वोत्तम: नैसर्गिक शब्दरचना सह सर्वसाधारण पाठ्य- ते- वक्तव्यName
मोफत प्रयत्न करा
MeloTTS मोकळे
MyShell. ai द्वारे MeloTTS एक बहुभाषिक TTS लायब्ररी आहे जी इंग्रजी (अमेरिकन, ब्रिटिश, भारतीय, ऑस्ट्रेलियन), स्पॅनिश, फ्रेंच, चिनी, जपानी, आणि कोरियाई समर्थन करीता आहे. हे अतिशय जलद आहे, फक्त CPU वर जवळजवळ वास्तविक वेळ गतीने पाठ्य प्रक्रिया करते. MeloTTS उत्पादन वापर करीता डिझाइन केले गेले आहे व CPU व GPU दोन्ही निरीक्षण करीता समर्थन पुरवते.
सर्वोत्तम: वेगवान, बहुभाषिक TTS आवश्यक असलेले उत्पादन अनुप्रयोगName
मोफत प्रयत्न करा
Kani TTS 2 मोकळे
Kani-TTS-2 by NineNineSix हे एक अतिशय हलके 400M पैरामीटर मॉडेल आहे जे Nvidia NanoCodec सह LiquidAI LFM2 बॅकबोनवर बनविले गेले आहे. ते फक्त3GB VRAM मध्ये चालते आणि ~2 सेकंदांमध्ये 10 सेकंद भाषण (RTF 0.2) प्राप्त करते. स्पीकर एम्बेडिंग्सद्वारे शून्य-शॉट आवाज क्लोनिंगला समर्थन देते.
सर्वोत्तम: कमी VRAM हायपरवॉलेटवर जलद इंग्रजी निर्मिती, जलद पूर्वदृश्य
मोफत प्रयत्न करा
OuteTTS मोकळे
OuteTTS मूलभूत वास्तुकला संरक्षित करत असताना पाठ्य-भाषण क्षमतांसह मोठ्या भाषा मॉडेल्स विस्तारित करते. ते lama. cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, आणि Transformers. js द्वारे ब्राउझर इन्फरन्ससह अनेक बॅकएंडला समर्थन देते. JSON म्हणून संचयित स्पीकर प्रोफाइलद्वारे शून्य-शॉट आवाज क्लोनिंगची वैशिष्ट्ये.
सर्वोत्तम: किनारा वितरण, ब्राऊजर-आधारित TTS, कमी-स्त्रोत वातावरण
मोफत प्रयत्न करा
Pocket TTS मोकळे
पोकेमॉन गो (Moji चे निर्माता) द्वारे पोकेमॉन TTS एक संकुचित 100M पैरामीटर पाठ्य- ते- वक्तव्य मॉडेल आहे जे त्याच्या वजनाच्या वर जातो. ते CPU वर कार्यक्षमरित्या चालते, एकल ऑडिओ नमूने पासून शून्य- शॉट आवाज क्लोनिंग समर्थन करते, आणि नैसर्गिक- आवाजाचा आवाज निर्माण करते. लहान मॉडेल आकार हे अत्यंत वापरासाठी आणि कमी स्त्रोत वातावरणासाठी आदर्श बनवितो.
सर्वोत्तम: हलके वितरण, फक्त CPU वातावरण, जलद आवाज क्लोनिंग
मोफत प्रयत्न करा
Kitten TTS मोकळे
Kitten TTS by KittenML हे ONNX वर बांधलेले अतिशय हलके पाठ्य- ते- वक्तव्य मॉडेल आहे. 15M ते 80M पैरामीटर (डिस्कवर 25- 80 MB) पासून भिन्नतेसह, GPU ची आवश्यकता नसून CPU वर उच्च दर्जाचे वक्तव्य संश्लेषण पुरविते. 8 अंतर्भूतीत आवाज, समायोज्य वक्तव्य वेग, आणि संख्या, चलन, व एककांसाठी अंतर्भूतीत पाठ्य पूर्वप्रक्रिया. किनारा वितरण व कमी- लेटेन्सी अनुप्रयोग करीता आदर्श.
सर्वोत्तम: जलद हलके TTS, किनारा वितरण, कमी- लेटेन्सी अनुप्रयोगName
मोफत प्रयत्न करा
Ming-Omni TTS मोकळे
Ming-omni-tts-0.5B by inclusionAI is a compact omni-modal speech model built on the BailingMM dense backbone with a Patch-by-Patch flow-matching audio decoder. Delivers 44.1kHz output (near CD quality), supports zero-shot voice cloning from a 3+ second reference, and includes built-in emotion / dialect / BGM control via JSON instructions. Excellent stability — 0.83% WER on Chinese benchmarks.
सर्वोत्तम: मराठी भाषा साहित्य संमेलन, पुणे मराठी भाषा साहित्य संमेलन, पुणे मराठी भाषा साहित्य संमेलन, पुणे
मोफत प्रयत्न करा
MOSS-TTS Nano मोकळे
100M MOSS-TTS-Nano-100M MOSS-TTS कुटुंबातील OpenMOSS चा कॉम्पॅक्ट 100M-परामर्श व्हेरिएंट आहे, डिले-ट्रान्सफॉर्मर आर्किटेक्चर शेअर करते.
सर्वोत्तम: मुक्त- स्तर TTS, उच्च- प्रमाण उत्पादन, कमी- विलंब संवाद वापर
मोफत प्रयत्न करा
Bark मुलभूत
मराठी चित्रपटसृष्टीतील संगीत दिग्दर्शक, संगीत दिग्दर्शक, संगीत दिग्दर्शक आणि संगीत दिग्दर्शक.
डेव्हलपर: Suno · परवाना: MIT
प्रयत्न करा
Bark Small मुलभूत
याचा वापर हायड्रोजनच्या वापरापेक्षा कमी खर्चिक व कमी हानिकारक आहे.
डेव्हलपर: Suno · परवाना: MIT
प्रयत्न करा
CosyVoice 2 मुलभूत
ॲरिस्टॉटलच्या मते मानवी जीवन हे एक अत्यंत असामान्य आणि अलौकिक असे जीवन आहे.
डेव्हलपर: Alibaba (Tongyi Lab) · परवाना: Apache 2.0
प्रयत्न करा
Dia TTS मुलभूत
अनेक भाषांत भाषांतरित झालेले हे पुस्तक मराठी भाषेतील अनेक भाषांत अनुवादित झाले आहे.
डेव्हलपर: Nari Labs · परवाना: Apache 2.0
प्रयत्न करा
Parler TTS मुलभूत
मराठी भाषेत लिंगभाव हा शब्द वापरला जातो आणि लिंगभाव हा शब्द मराठी भाषेत वापरला जातो.
डेव्हलपर: Hugging Face · परवाना: Apache 2.0
प्रयत्न करा
IndexTTS-2 मुलभूत
याचा अर्थ हायड्रोजनचे अणू एकमेकांशी अतिशय घट्ट आणि अतिशय स्थिर आहेत.
डेव्हलपर: Index Team · परवाना: Bilibili Model License
प्रयत्न करा
Spark TTS मुलभूत
मराठी भाषेतील शब्दांची यादी मराठी भाषेतील शब्दांची यादी मराठी भाषेतील शब्दांची यादी मराठी शब्दांची यादी
डेव्हलपर: SparkAudio · परवाना: CC BY-NC-SA 4.0
प्रयत्न करा
GPT-SoVITS मुलभूत
नंतरच्या काळात ॲपलने ॲपल टीव्ही प्लस हा टीव्ही बाजारात आणला ज्यात ५.
डेव्हलपर: RVC-Boss · परवाना: MIT
प्रयत्न करा
Orpheus मुलभूत
100 पेक्षा जास्त तासांच्या अभ्यासक्रमासाठी 100 हून अधिक भाषांचे ज्ञान आवश्यक आहे.
डेव्हलपर: Canopy Labs · परवाना: Llama 3.2 Community
प्रयत्न करा
Qwen3 TTS मुलभूत
ॲपलच्या अनेक उपकंपन्यांनी या ॲपची निर्मिती केली आहे.
डेव्हलपर: Alibaba (Qwen) · परवाना: Apache 2.0
प्रयत्न करा
VieNeu-TTS-v2 मुलभूत
व्हियेतनामी + इंग्रजी कोड- स्विचिंग TTS7पूर्वनिर्धारित आवाज व शून्य- शॉट आवाज क्लोनिंग सह. फक्त CPU, GPU आवश्यक नाही.
डेव्हलपर: Phạm Nguyễn Ngọc Bảo · परवाना: Apache 2.0
प्रयत्न करा
Chatterbox Turbo मुलभूत
यामध्ये अनुसूचित जातीचे लोक ० असून अनुसूचित जमातीचे ० लोक आहेत.
डेव्हलपर: Resemble AI · परवाना: MIT
प्रयत्न करा
VoxCPM मुलभूत
44.1 kHz ऑडिओ संदर्भ-जाणते अनुच्छेद एकसमानतेसह Tokenizer-मुक्त TTS तयार करते.
डेव्हलपर: OpenBMB · परवाना: Apache 2.0
प्रयत्न करा
VibeVoice मुलभूत
मायक्रोसॉफ्ट मॉडेल पॉडकास्ट आणि ऑडिओबुक सारख्या लांब स्वरूपाच्या बहु-स्पीकर सामग्रीसाठी.
डेव्हलपर: Microsoft · परवाना: MIT
प्रयत्न करा
CosyVoice3 मुलभूत
नंतरच्या पिढीतील बहुभाषिक TTS, bi-streaming, emotional control आणि zero-shot voice cloning सोबत.
डेव्हलपर: Alibaba (FunAudioLLM) · परवाना: Apache 2.0
प्रयत्न करा
NAMAA Saudi TTS मुलभूत
पहिला खुला सौदी- अरबी TTS. चॅटरबॉक्स- गुणवत्तेचे आवाज क्लोनसह स्वदेशी सौदी बोलीभाषा. Name
डेव्हलपर: NAMAA Space · परवाना: MIT
प्रयत्न करा
Darwin TTS मुलभूत
गूगल क्रोम ३.१ पासून गूगल क्रोम ३.२ पर्यंतच्या सर्व आवृत्त्या गूगल क्रोमच्या अधिकृत संकेतस्थळावर उपलब्ध आहेत.
डेव्हलपर: FINAL-Bench · परवाना: Apache 2.0
प्रयत्न करा
MOSS-TTSD मुलभूत
’अभिव्यक्ती’चे संपादकीय विभागात काम करताना त्यांनी अनेक मराठी चित्रपटांना संगीत दिले व सुमारे ६० चित्रपटांना संगीत दिले.
डेव्हलपर: OpenMOSS · परवाना: Apache 2.0
प्रयत्न करा
CosyVoice 2
ॲरिस्टॉटलच्या मते मानवी जीवन हे एक अत्यंत असामान्य आणि अलौकिक असे जीवन आहे.
भाषा: en, zh, ja, ko, fr, de, it, es
आवाज प्रतिकृत करा
IndexTTS-2
याचा अर्थ हायड्रोजनचे अणू एकमेकांशी अतिशय घट्ट आणि अतिशय स्थिर आहेत.
भाषा: en, zh
आवाज प्रतिकृत करा
Spark TTS
मराठी भाषेतील शब्दांची यादी मराठी भाषेतील शब्दांची यादी मराठी भाषेतील शब्दांची यादी मराठी शब्दांची यादी
भाषा: en, zh
आवाज प्रतिकृत करा
GPT-SoVITS
नंतरच्या काळात ॲपलने ॲपल टीव्ही प्लस हा टीव्ही बाजारात आणला ज्यात ५.
भाषा: en, zh, ja, ko
आवाज प्रतिकृत करा
Chatterbox
ॲरिस्टॉटलच्या मते, तत्त्वज्ञान हे तत्त्वज्ञानाच्या संकल्पनेतून व्यक्त होऊन तत्त्वज्ञानाच्या माध्यमातून व्यक्त होते.
भाषा: en
आवाज प्रतिकृत करा
Tortoise TTS
अनेक मराठी लेखकांनी मराठी साहित्यात लिंगभावाच्या प्रश्नावर लेखन केले आहे.
भाषा: en
आवाज प्रतिकृत करा
OpenVoice
त्यांतील काही तत्त्वे पुढीलप्रमाणे :- लिंगभाव, लिंगभावभावना, लिंगभावभावना आणि लिंगभावभावना.
भाषा: en, zh, ja, ko, fr, es
आवाज प्रतिकृत करा
VieNeu-TTS-v2
व्हियेतनामी + इंग्रजी कोड- स्विचिंग TTS7पूर्वनिर्धारित आवाज व शून्य- शॉट आवाज क्लोनिंग सह. फक्त CPU, GPU आवश्यक नाही.
भाषा: vi, en
आवाज प्रतिकृत करा
Chatterbox Turbo
यामध्ये अनुसूचित जातीचे लोक ० असून अनुसूचित जमातीचे ० लोक आहेत.
भाषा: en
आवाज प्रतिकृत करा
VoxCPM
44.1 kHz ऑडिओ संदर्भ-जाणते अनुच्छेद एकसमानतेसह Tokenizer-मुक्त TTS तयार करते.
भाषा: en, zh
आवाज प्रतिकृत करा
Pocket TTS
100 मीटर धावण्याच्या शर्यतीत 100 मीटर धावण्याचा एकेरी प्रकार स्पर्धेत समाविष्ट आहे.
भाषा: en, fr
आवाज प्रतिकृत करा
CosyVoice3
नंतरच्या पिढीतील बहुभाषिक TTS, bi-streaming, emotional control आणि zero-shot voice cloning सोबत.
भाषा: en, zh, ja, ko, de, es, fr, it, ru
आवाज प्रतिकृत करा
NAMAA Saudi TTS
पहिला खुला सौदी- अरबी TTS. चॅटरबॉक्स- गुणवत्तेचे आवाज क्लोनसह स्वदेशी सौदी बोलीभाषा. Name
भाषा: ar
आवाज प्रतिकृत करा
Darwin TTS
गूगल क्रोम ३.१ पासून गूगल क्रोम ३.२ पर्यंतच्या सर्व आवृत्त्या गूगल क्रोमच्या अधिकृत संकेतस्थळावर उपलब्ध आहेत.
भाषा: en, ko, ja, zh
आवाज प्रतिकृत करा
MOSS-TTSD
’अभिव्यक्ती’चे संपादकीय विभागात काम करताना त्यांनी अनेक मराठी चित्रपटांना संगीत दिले व सुमारे ६० चित्रपटांना संगीत दिले.
भाषा: en, zh
आवाज प्रतिकृत करा
Ming-Omni TTS
०.५ बी ओएमएम (Omni-Modal) भाषण मॉडेल इंकल्यूजनएआय पासून उच्च विश्वासार्हता ४४.
भाषा: en, zh
आवाज प्रतिकृत करा
MOSS-TTS Nano
100M MOSS-TTS व्हेरिएंट - तेच आर्किटेक्चर, 80x लहान, मुक्त स्तर लॅटिनिटी.
भाषा: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
आवाज प्रतिकृत कराडेव्हलपर- प्रथम API
OpenAI-सुसंगत REST API. एक अंतबिंदू, 22+ मॉडेल. वास्तविक वेळ अनुप्रयोगांसाठी स्ट्रीमिंग समर्थन.
- OpenAI- सुसंगत स्वरूप
- वास्तविक वेळ अनुप्रयोग करीता TTS स्ट्रीमिंग
- मोठे कार्य करीता बॅच प्रक्रिया
- वेबहॉक सूचना
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
सोपे, पारदर्शक दर
मुक्तपणे सुरू करा. वाढू द्या.
मोकळे
१५,००० अक्षरे + ५०००/दिवस
- कोकोरोसह ७ मोफत नमुने
- 5,000 अक्षरे प्रति निर्मिती
- API प्रवेश समाविष्टीत आहे
प्रारंभकर्ता
500 क्रेडिट/महिने
- सर्व 22+ मॉडेल
- 100,000 अक्षरे प्रति निर्मिती
- आवाज क्लोनिंग
प्रो
2,000 क्रेडिट/महिने
- स्टार्टअप अंतर्गत सर्वकाही
- API प्रवेश
- प्राधान्यता प्रक्रिया
व्यवसाय
10,000 क्रेडिट/महिने
- प्रो मध्ये सर्वकाही
- मोठे API
- प्राधान्यता कतार
वारंवार विचारले जाणारे प्रश्न
आपण काय सुधारू शकतो? तुमचा प्रतिसाद आम्हाला समस्या सोडवण्यात मदत करतो.
AI आवाज वापरणे आजच सुरू करा
TTS.ai वापरून निर्माता, डेव्हलपर आणि व्यवसायांना सामील व्हा