स्वतन्त्र एआई पाठ वाचकComment
31+ खुला स्रोत नमूनाहरू, 231+ आवाजहरू, 34+ भाषाहरू । खाता आवश्यक छैन ।
तपाईँलाई आवाज एआईको लागि आवश्यक सबै कुरा
30+ खुला स्रोत एआई मोडेल द्वारा संचालित उपकरणहरू
31+ AI आवाज नमूना
एक प्लेटफर्ममा खुला स्रोत TTS नमूनाहरूको सबैभन्दा व्यापक संग्रह
Kokoro Free
कोकोरो एक 82 मिलियन मापदण्ड पाठ-देखि-भाषण मोडेल छ कि यसको वजन वर्ग माथि राम्रो संग Punches. यसको सानो आकार बावजुद, यो उल्लेखनीय प्राकृतिक र अभिव्यक्तिशील भाषण उत्पादन. कोकोरो अंग्रेजी सहित बहु भाषाहरू समर्थन, जापानी, चिनियाँ, र कोरियाली अभिव्यक्तिपूर्ण आवाज को एक किसिम संग. यो अविश्वसनीय रूपमा छिटो चल्छ - GPU मा वास्तविक समय भन्दा लगभग 100x छिटो अडियो उत्पन्न.
यसका लागि उत्तम: न्यूनतम लाटेन्सी, स्ट्रिमिङ अनुप्रयोगहरूसँग उच्च गुणस्तर TTS
नि: शुल्क प्रयास गर्नुहोस्
Piper Free
पाइपर एक हल्का पाठ-देखि-भाषण इन्जिन Rhasspy द्वारा विकसित छ जुन VITS र larynx वास्तुकला प्रयोग गर्दछ। यो सीपीयूमा पूर्ण रूपमा चल्छ, किनारा उपकरणहरू, घर स्वचालन र अफलाइन TTS आवश्यक अनुप्रयोगहरूको लागि आदर्श बनाउँछ। 100+ भाषाहरूमा 100+ आवाजहरूसँग, पाइपरले एक रास्पबेरी पाइ4मा पनि वास्तविक समय गतिमा प्राकृतिक-सुन्ने भाषण प्रदान गर्दछ।
यसका लागि उत्तम: छिटो पूर्वावलोकन, पहुँचता, र सम्मिलित अनुप्रयोगहरू
नि: शुल्क प्रयास गर्नुहोस्
VITS Free
VITS (अन्त-सम्म-अन्त पाठ-देखि-भाषण लागि adversarial सिक्ने संग भिन्नता निष्कर्ष) एक समानान्तर अन्त-सम्म-अन्त TTS विधि छ कि वर्तमान दुई-चरण मोडेल भन्दा बढी प्राकृतिक ध्वनि अडियो उत्पन्न गर्दछ। यो सामान्यीकरण प्रवाह र एक adversarial प्रशिक्षण प्रक्रिया संग बढेको भिन्नता निष्कर्ष अपनाउँछ, प्राकृतिकता मा एक महत्वपूर्ण सुधार हासिल।
यसका लागि उत्तम: प्राकृतिक शब्दसँग सामान्य- उद्देश्य पाठ-बाट-वाचन
नि: शुल्क प्रयास गर्नुहोस्
MeloTTS Free
MyShell.ai द्वारा MeloTTS अंग्रेजी समर्थन एक बहुभाषी TTS लाइब्रेरी छ (अमेरिकी, ब्रिटिश, भारतीय, अष्ट्रेलियन), स्पेनिश, फ्रान्सेली, चिनियाँ, जापानी, र कोरियाली. यो अत्यधिक छिटो छ, सीपीयू एक्लै मा नजिकै वास्तविक-समय गति मा पाठ प्रक्रिया. MeloTTS उत्पादन प्रयोगको लागि डिजाइन गरिएको छ र सीपीयू र जीपीयू दुवै अनुमान समर्थन गर्दछ.
यसका लागि उत्तम: उत्पादन अनुप्रयोगहरू छिटो, बहुभाषिक TTS आवश्यक
नि: शुल्क प्रयास गर्नुहोस्
OuteTTS Free
OuteTTS मूल वास्तुकला संरक्षण गर्दा पाठ-देखि-भाषण क्षमताहरू संग ठूलो भाषा मोडेल विस्तार गर्दछ। यो llama.cpp (CPU / GPU), Hugging अनुहार Transformers, ExLlamaV2, VLLM, र पनि Transformers.js मार्फत ब्राउजर inference सहित बहु backends समर्थन गर्दछ। विशेषताहरू शून्य-शट स्पीकर प्रोफाइलहरू मार्फत आवाज क्लोनिंग JSON रूपमा बचत।
यसका लागि उत्तम: किनारा वितरण, ब्राउजर आधारित TTS, कम-संसाधन वातावरण
नि: शुल्क प्रयास गर्नुहोस्
Pocket TTS Free
Kyutai द्वारा पोके TTS (Moshi को निर्माता) एक कम्प्याक्ट 100M मापदण्ड पाठ-देखि-भाषण मोडेल छ कि यसको वजन माथि राम्रो Punches. यो सीपीयू मा कुशलतापूर्वक चल्छ, एकल अडियो नमूना देखि शून्य-शट आवाज क्लोनिंग समर्थन, र प्राकृतिक-सुन्ने भाषण उत्पादन. सानो मोडेल साइज यो किनारा तैनात र कम-संसाधन वातावरण लागि आदर्श बनाउँछ।
यसका लागि उत्तम: हल्का वितरण, सीपीयू- मात्र वातावरण, छिटो आवाज क्लोनिङ
नि: शुल्क प्रयास गर्नुहोस्
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
यसका लागि उत्तम: Fast lightweight TTS, edge deployment, low-latency applications
नि: शुल्क प्रयास गर्नुहोस्
Bark Standard
ट्रान्सफर-आधारित पाठ-अडियो मोडेल जसले यथार्थवादी भाषण, संगीत, र ध्वनि प्रभावहरू उत्पन्न गर्दछ।
विकासकर्ता: Suno · इजाजतपत्र: MIT
यसलाई प्रयास गर्नुहोस्
Bark Small Standard
यसले वायुमण्डलमा कार्बन डाइअक्साइडको मात्रा कम गर्न तथा वायुमण्डलको गुणस्तर सुधार गर्न मद्दत गर्दछ।
विकासकर्ता: Suno · इजाजतपत्र: MIT
यसलाई प्रयास गर्नुहोस्
CosyVoice 2 Standard
यसको प्राकृतिक वासस्थान नेपालको तराई तथा हिमाली क्षेत्रमा पाइन्छ।
विकासकर्ता: Alibaba (Tongyi Lab) · इजाजतपत्र: Apache 2.0
यसलाई प्रयास गर्नुहोस्
Dia TTS Standard
यसले विभिन्न प्रकारका प्राकृतिक प्रकोपहरूको सामना गर्न सक्ने क्षमता राख्दछ।
विकासकर्ता: Nari Labs · इजाजतपत्र: Apache 2.0
यसलाई प्रयास गर्नुहोस्
Parler TTS Standard
तपाईँले प्राकृतिक भाषामा चाहनुभएको आवाज वर्णन गर्नुहोस् र Parler ले मिल्दो भाषण उत्पन्न गर्दछ ।
विकासकर्ता: Hugging Face · इजाजतपत्र: Apache 2.0
यसलाई प्रयास गर्नुहोस्
GLM-TTS Standard
खुला स्रोत TTS मोडेलहरू बीच कम क्यारेक्टर त्रुटि दर प्राप्त गर्दछ।
विकासकर्ता: Zhipu AI · इजाजतपत्र: GLM-4 License
यसलाई प्रयास गर्नुहोस्
IndexTTS-2 Standard
यसले वायुमण्डलमा अक्सिजनको मात्रालाई नियन्त्रण तथा उच्च तापक्रमलाई नियन्त्रण गर्दछ।
विकासकर्ता: Index Team · इजाजतपत्र: Bilibili Model License
यसलाई प्रयास गर्नुहोस्
Spark TTS Standard
आवाज क्लोनिंग TTS संग नियन्त्रित भावना र प्रोम्ट्स मार्फत बोल्ने शैली.
विकासकर्ता: SparkAudio · इजाजतपत्र: CC BY-NC-SA 4.0
यसलाई प्रयास गर्नुहोस्
GPT-SoVITS Standard
केही-छाप आवाज क्लोनिंग TTS अडियो को केवल5सेकेन्ड देखि कुनै पनि आवाज प्रतिलिपि गर्दछ।
विकासकर्ता: RVC-Boss · इजाजतपत्र: MIT
यसलाई प्रयास गर्नुहोस्
Orpheus Standard
यसले १०० भन्दा बढी भाषाहरूमा अनुवाद गरेको छ।
विकासकर्ता: Canopy Labs · इजाजतपत्र: Llama 3.2 Community
यसलाई प्रयास गर्नुहोस्
Qwen3 TTS Standard
अलीबाबाको बहुभाषी TTS आवाज क्लोनिंग, पूर्वनिर्धारित आवाज, र पाठबाट आवाज डिजाइन संग।
विकासकर्ता: Alibaba (Qwen) · इजाजतपत्र: Apache 2.0
यसलाई प्रयास गर्नुहोस्
Chatterbox Turbo Standard
यसको वजन लगभग 200 ग्राम हुन्छ र यसमा 100 भन्दा बढी खाद्य पदार्थहरू, जस्तै फल, तरकारी, र माछाहरू पाइन्छन्।
विकासकर्ता: Resemble AI · इजाजतपत्र: MIT
यसलाई प्रयास गर्नुहोस्
Dia 2 Standard
यसमा प्रथम शब्दको अर्थ हुन्छ- भक्ति तथा द्वितीय शब्दको अर्थ हो- भक्ति।
विकासकर्ता: Nari Labs · इजाजतपत्र: Apache 2.0
यसलाई प्रयास गर्नुहोस्
VoxCPM Standard
यसको क्षेत्रफल ४४.१ वर्गकिलोमिटर रहेको छ ।
विकासकर्ता: OpenBMB · इजाजतपत्र: Apache 2.0
यसलाई प्रयास गर्नुहोस्
TADA Standard
यो पत्रिकाको प्रकाशक कमलप्रसाद घिमिरे हो।
विकासकर्ता: Hume AI · इजाजतपत्र: MIT
यसलाई प्रयास गर्नुहोस्
VibeVoice Standard
माइक्रोसफ्ट मोडेल लामो फारम बहु-स्पीकर सामग्री जस्तै पोडकास्टहरू र अडियो पुस्तकहरूको लागि।
विकासकर्ता: Microsoft · इजाजतपत्र: MIT
यसलाई प्रयास गर्नुहोस्
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
विकासकर्ता: Alibaba (FunAudioLLM) · इजाजतपत्र: Apache 2.0
यसलाई प्रयास गर्नुहोस्
CosyVoice 2
यसको प्राकृतिक वासस्थान नेपालको तराई तथा हिमाली क्षेत्रमा पाइन्छ।
भाषा: en, zh, ja, ko, fr, de, it, es
आवाज क्लोन गर्नुहोस्
GLM-TTS
खुला स्रोत TTS मोडेलहरू बीच कम क्यारेक्टर त्रुटि दर प्राप्त गर्दछ।
भाषा: en, zh
आवाज क्लोन गर्नुहोस्
IndexTTS-2
यसले वायुमण्डलमा अक्सिजनको मात्रालाई नियन्त्रण तथा उच्च तापक्रमलाई नियन्त्रण गर्दछ।
भाषा: en, zh
आवाज क्लोन गर्नुहोस्
Spark TTS
आवाज क्लोनिंग TTS संग नियन्त्रित भावना र प्रोम्ट्स मार्फत बोल्ने शैली.
भाषा: en, zh
आवाज क्लोन गर्नुहोस्
GPT-SoVITS
केही-छाप आवाज क्लोनिंग TTS अडियो को केवल5सेकेन्ड देखि कुनै पनि आवाज प्रतिलिपि गर्दछ।
भाषा: en, zh, ja, ko
आवाज क्लोन गर्नुहोस्
Chatterbox
यसले वायुमण्डलमा रहेको अक्सिजनको मात्रालाई नियन्त्रणमा राख्न मद्दत गर्दछ।
भाषा: en
आवाज क्लोन गर्नुहोस्
Tortoise TTS
यसले बहु-भाषी शब्दकोष र बहु-भाषी शब्दकोषको विकासमा महत्वपूर्ण भूमिका खेलेको छ ।
भाषा: en
आवाज क्लोन गर्नुहोस्
OpenVoice
शैली, भावना, र उच्चारण भन्दा ग्रेनलर नियन्त्रण संग तत्काल आवाज क्लोनिंग।
भाषा: en, zh, ja, ko, fr, de, es, it
आवाज क्लोन गर्नुहोस्
Qwen3 TTS
अलीबाबाको बहुभाषी TTS आवाज क्लोनिंग, पूर्वनिर्धारित आवाज, र पाठबाट आवाज डिजाइन संग।
भाषा: en, zh, ja, ko, de, fr, ru, pt, es, it
आवाज क्लोन गर्नुहोस्
Chatterbox Turbo
यसको वजन लगभग 200 ग्राम हुन्छ र यसमा 100 भन्दा बढी खाद्य पदार्थहरू, जस्तै फल, तरकारी, र माछाहरू पाइन्छन्।
भाषा: en
आवाज क्लोन गर्नुहोस्
Pocket TTS
Lightweight 100M parameter model by Kyutai with voice cloning from a single sample.
भाषा: en, fr
आवाज क्लोन गर्नुहोस्
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
भाषा: en, zh, ja, ko, de, es, fr, it, ru
आवाज क्लोन गर्नुहोस्
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
भाषा: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
आवाज क्लोन गर्नुहोस्
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
भाषा: en, zh
आवाज क्लोन गर्नुहोस्विकासकर्ता-पहिलो API
OpenAI-संगत REST API। एक अन्त बिन्दु, 22+ मोडेल। वास्तविक समय अनुप्रयोगहरूको लागि स्ट्रिमिङ समर्थन।
- खुला AI-संगत ढाँचा
- वास्तविक-समय अनुप्रयोगहरूका लागि स्ट्रिमिङ TTS
- ठूला कामका लागि ब्याच प्रक्रिया
- वेबहुक सूचना
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
सरल, पारदर्शी मूल्य
निःशुल्क सुरु गर्नुहोस् । तपाईँ बढ्दै जाँदा मापन गर्नुहोस् ।
स्वतन्त्र
५० क्रेडिट
- Kokoro, Piper, VITS, MeloTTS
- ५०० क्यारेक्टर सीमा
- ३ जन/घण्टा (खाता छैन)
सुरुआतकर्ता
500 क्रेडिट / महिना
- सबै २२+ नमूनाहरू
- प्रति पुस्ता १००,००० क्यारेक्टर
- आवाज क्लोनिङ
प्रो
2,000 क्रेडिट / महिना
- सुरुआतकर्तामा सबै कुरा
- API पहुँच
- प्राथमिकता प्रक्रिया
व्यवसाय
10,000 क्रेडिट / महिना
- प्रो मा सबै कुरा
- ठूलो API
- प्राथमिकता लाम
प्राय सोधिने प्रश्नहरू
हामी के सुधार गर्न सक्छन्? आफ्नो प्रतिक्रिया हामीलाई समस्या समाधान गर्न मद्दत गर्दछ.
आज AI आवाज प्रयोग गर्न सुरु गर्नुहोस्
TTS.ai प्रयोग गरेर निर्माता, विकासकर्ता र व्यवसायहरूमा सामेल हुनुहोस्