फ्री एआई बोलने के लिए पाठ
33+ खुली- श्रोत मॉडल, 273+ आवाज, 33+ भाषा. कोई खाता जरूरी नहीं.
आवाज एआई के लिए आपको जो भी ज़रूरत है
30+C औज़ार जो खोलना-source एआई मॉडल द्वारा नियंत्रित किया गया है
33+ एआई आवाज मॉडल
एक मंच में खुले स्रोत टीटी मॉडल का सबसे व्यापक संग्रह
Kokoro मुक्त
कोकोरो एक 82 लाख पैरामीटरी मॉडल है जो अपने वजन वर्ग के ऊपर बहुत ही अच्छे से पंच करता है. इसके छोटे आकार के बावजूद, यह बहुत ही प्राकृतिक और आकर्षक भाषा उत्पन्न करता है. कोकोरो अनेक भाषाओं में अंग्रेज़ी, जापानी, चीनी, और कोरियाई विविध प्रकार की ध्वनि के साथ. यह उल्लेखनीय रूप से ध्वनि को लगभग 100xx से अधिक तेजी से तैयार करता है.
के लिए उत्तम: न्यूनतम किये जाने वाले अनुप्रयोगों के साथ न्यूनतम तीव्रताटीटीटीएस, स्ट्रीमिंग अनुप्रयोग
मुक्त कोशिश करें
Piper मुक्त
पाइपर एक हल्का पाठ-से- वार्ता इंजन है जो Rssscsee और lunnnnns का उपयोग करता है। यह पूरी तरह से सीपीयू पर दौड़ता है, किनारे उपकरणों के लिए आदर्श बना, घर के उपकरण, और अनुप्रयोग के लिए की जरूरत। 30+Ces के साथ, पाइप scenter वास्तव में ध्वनि s पर प्राकृतिक ध्वनि sonphronting।
के लिए उत्तम: क्विक पूर्वावलोकन, पहुंचनीयता, और अंतर्निर्मित अनुप्रयोगों
मुक्त कोशिश करें
VITS मुक्त
MEGTS (अवर्थरकार के लिए एक अंत-से- वार्ता पाठ-से- वार्ता) सीखने के लिए एक समानांतर अंत-T-TC-TC-टी तरीका है जो मौजूदा दो मंच मॉडलों से अधिक प्राकृतिक ध्वनि बनाता है। यह सामान्य प्रवाह और एक मौजूदा प्रवाह और एक स्वाभाविक विकास, विकसित करने के लिए एक महत्वपूर्ण प्रक्रिया बनाता है।
के लिए उत्तम: सामान्य- से- वार्ता पाठ से प्राकृतिक अभ्यास के साथ
मुक्त कोशिश करें
MeloTTS मुक्त
Mint. oo एक अलग ही भाषा, ब्रिटिश, भारतीय, फ्रेंच, फ्रेंच, चीनी, जापानी, और कोरियाई समर्थन करती है. यह बहुत ही तेजी से सीपीयू पर सामग्री प्रयोग करने के लिए बनाया गया है. Mercut और दोनों सीपीयूों का उपयोग करने के लिए बनाया जाता है और वे दोनों के लिए उपयोग करने के लिए प्रयोग करने के लिए प्रयोग किया जाता है.
के लिए उत्तम: उत्पादों का अनुप्रयोग तेजी से, अलग - अलग भाषाओं में टीएस की जरूरत है
मुक्त कोशिश करें
Kani TTS 2 मुक्त
Gaci-S-S-S2 द्वारा एक Sakyo-S-SCaci-S-Soles द्वारा बनाया गया 400CTM पैरामीटर मॉडल NVIINZE के साथ बनाया गया है. यह सिर्फ 3GBV2 सेकंड में चला जाता है और एक 0.10 सेकंड में बात करता है - 10 सेकंड में। वर्तमान में सिर्फ एक अंग्रेजी जहाजों को खोलने के लिए ही नहीं है, बल्कि सिर्फ एक अंग्रेजी भाषा के लिए नहीं है।
के लिए उत्तम: कम- वी-रैम हार्डवेयर पर तीव्र अंग्रेजी पीढ़ी, त्वरित पूर्वावलोकन
मुक्त कोशिश करें
OuteTTS मुक्त
WERAGERS पाठ-से- वार्ता क्षमताओं के साथ बड़े भाषा मॉडलों को जारी करता है जब मूल संरचनाओं को बनाए. यह कई बैकएण्डों को समर्थन देता है.
के लिए उत्तम: किनारा तैनातमेंट, ब्राउज़र- आधारित टीएस, कम स्रोत वातावरण
मुक्त कोशिश करें
Pocket TTS मुक्त
Cakt Tact Tuti ( मोशी के बढ़ने वाले) एक प्रतिज्ञा 100M पैरामीटर अपने वजन के ऊपर अच्छी तरह से वार करता है। यह सहज रूप से हवा से करता है, एक ही ऑडियो नमूना से शून्य आवाज के लिए समर्थन करता है, और स्वाभाविक मॉडल इसे स्वाभाविक रूप से और कम वातावरण के लिए आदर्श बनाता है।
के लिए उत्तम: हल्के रंग की तैनाती, सीपीयू- सिर्फ वातावरण, त्वरित आवाजस्वाभाविक
मुक्त कोशिश करें
Kitten TTS मुक्त
किटटन टी.टीटीटीटी द्वारा एक प्रोटीटीटीटीटीटीटीटीटीसी मॉडल है जो एनएक्स पर बनाया गया है. 15 एमएम से 80M पैरामीटर (25- 8080) के साथ, यह बिना जीपीपीपीपीडी पर उच्च आवाज प्रदान करता है. 8 इंच विशेषताओं को समायोजित किया जा सकता है, भाषा, भाषा, भाषा, भाषा, भाषा, भाषा, और प्रयोग करने के लिए पाठ, और प्रोक्शन इकाई के लिए उपयोग किया जा रहा है.
के लिए उत्तम: तेज हल्का scces, किनारा व्यवस्था, कम विवेकी अनुप्रयोगों
मुक्त कोशिश करें
Ming-Omni TTS मुक्त
MERTACT- 0. 0. 0. 0. 0. 0.5B है Alanci-टीनी ध्वनि मॉडल एक पैच द्वारा बनाया गया एक पैच-हंक-हंक-क-क-क-क-क-हिंग ऑडियो ऐक्शनर के साथ बनाया गया है. 44.1HEPEPEPENTCHEEENTCHEN(x3), एक दूसरे संदर्भ के लिए समर्थित करता है, और भावना / 0.400CACTCACHACHACHACGEN/ 0.0CHERELACHACHACHENECGEGELACKCKENECACACACKELENENENENECKERELECKECHENECHECHECKECHECHECKCCKCK TECYECYECK TECYECPEACPCPECYEACPEACYPPEPEPEACYEACHEPEPEANANACYEACYEACKEACKEACKEACKEACKEACKECYPCKEACYEACKECKEACYPCYELACYECYECYECYECYECYECYECYECKECKECKECKECK TECYECCCYECKECKECCCCCCCYELACHELACHELCK TENACHACHACCCCHACHACCCHANCHANCHACHACECECKECTCTCTCTCTCTCHANANANEANEANANENELANENENELECTCTCCTCTCTCTCTCTC
के लिए उत्तम: उच्च-तम वार्तालाप, भावनाओं द्वारा नियंत्रित आवाज, चीनी ऑडियोबुक सामग्री
मुक्त कोशिश करें
MOSS-TTS Nano मुक्त
MIS-NCS-NCO-100M ओपनडाकUM की प्रतिज्ञा है TMM-टीटील परिवार के इकाई, देरी-टी-टीएस-टीर के रूप में साझा. 8B मॉडल ~80x वज़न के लिए व्यापार करता है और उल्लेखनीय रूप से कम, यह मुक्त-ट और उच्च प्रवेश करने के लिए उपयुक्त है.
के लिए उत्तम: फ्रीरेयर टीटी, उच्च-वोल्यूशन उत्पादन, कम निश्चय ही इंटरएक्टिव इस्तेमाल करता है
मुक्त कोशिश करें
Bark मानक
ट्रांसपर आधारित पाठ- से- वार्ता मॉडल जो यथार्थ वाणी, संगीत, और ध्वनि प्रभाव उत्पन्न करता है.
डेवलेपर: Suno · लाइसेंस: MIT
इसे कोशिश करें
Bark Small मानक
बारक का हल्का संस्करण इंच व कम मेमोरी उपयोग के साथ.
डेवलेपर: Suno · लाइसेंस: MIT
इसे कोशिश करें
CosyVoice 2 मानक
Alibalalalalalalalalalalalalalalalal scraces.
डेवलेपर: Alibaba (Tongyi Lab) · लाइसेंस: Apache 2.0
इसे कोशिश करें
Dia TTS मानक
मल्टी- स्पीकर संवाद मॉडल जो स्पीकरओं के बीच प्राकृतिक वार्तालाप उत्पन्न करता है.
डेवलेपर: Nari Labs · लाइसेंस: Apache 2.0
इसे कोशिश करें
Parler TTS मानक
स्वाभाविक भाषा में आवाज का वर्णन कीजिए जिसे आप चाहते हैं तथा परलर मेल से मिलते हैं.
डेवलेपर: Hugging Face · लाइसेंस: Apache 2.0
इसे कोशिश करें
IndexTTS-2 मानक
अच्छी भावना नियंत्रण और उच्च अपमान के साथ शून्य-शंजी.
डेवलेपर: Index Team · लाइसेंस: Bilibili Model License
इसे कोशिश करें
Spark TTS मानक
नियंत्रणीय भावनाओं और बोलने वाली शैली के साथ आवाज एच.
डेवलेपर: SparkAudio · लाइसेंस: CC BY-NC-SA 4.0
इसे कोशिश करें
GPT-SoVITS मानक
बहुत कम आवाज CONTCT TTS कि ऑडियो के सिर्फ 5 सेकंड से किसी भी आवाज की नकल करता है.
डेवलेपर: RVC-Boss · लाइसेंस: MIT
इसे कोशिश करें
Orpheus मानक
मानव स्तर भावात्मक टीएस मॉडल द्वारा बोली डाटा के १००के घंटों पर प्रशिक्षित किया गया है.
डेवलेपर: Canopy Labs · लाइसेंस: Llama 3.2 Community
इसे कोशिश करें
Qwen3 TTS मानक
आईएसओबा की अलग-अलग आवाज तथा ध्वनि डिजाइन के साथ.
डेवलेपर: Alibaba (Qwen) · लाइसेंस: Apache 2.0
इसे कोशिश करें
VieNeu-TTS-v2 मानक
विएतनामी + अंग्रेजी कोड 7 पूर्व-प्रचलित आवाज तथा शून्य आवाज की बारी. सीपीयू-सिर्फ वांछित नहीं
डेवलेपर: Phạm Nguyễn Ngọc Bảo · लाइसेंस: Apache 2.0
इसे कोशिश करें
Chatterbox Turbo मानक
हंसने, मर्स, और अधिक से अधिक के लिए उप-200mer बॉक्स के साथ तेज गपशप करें.
डेवलेपर: Resemble AI · लाइसेंस: MIT
इसे कोशिश करें
VoxCPM मानक
MPRECT- फ्री- फ्री- रेएस को संदर्भ- अप्रचलित अनुच्छेद संगतता के साथ सामान्य बनाया जा रहा है.
डेवलेपर: OpenBMB · लाइसेंस: Apache 2.0
इसे कोशिश करें
VibeVoice मानक
बहुत से समाचार माध्यमों तथा ऑडियोबुक जैसे पृष्ठ के लिए माइक्रोसॉफ़्ट मॉडल.
डेवलेपर: Microsoft · लाइसेंस: MIT
इसे कोशिश करें
CosyVoice3 मानक
अगली-पीढ़ी की-पीढ़ी se-stating, भावना नियंत्रण, और शून्य आवाज की नक़ल करें.
डेवलेपर: Alibaba (FunAudioLLM) · लाइसेंस: Apache 2.0
इसे कोशिश करें
Darwin TTS मानक
क्यूवेएसएफ3-टीएफएफएफएफएस के साथ क्रास-टेशनल क्यूवेएन3-1. 7B भाषा मॉडल शुद्ध भिन्न भाषा मॉडल के लिए.
डेवलेपर: FINAL-Bench · लाइसेंस: Apache 2.0
इसे कोशिश करें
MOSS-TTSD मानक
मल्टी- स्पेसर संवाद मॉडल तैयार करता है - 5 स्पीकरों तथा copecent ऑडियो के 60 मिनट के साथ fapony-t-centy-t-t-टील-टील-टील्शन मॉडल तैयार करता है.
डेवलेपर: OpenMOSS · लाइसेंस: Apache 2.0
इसे कोशिश करें
CosyVoice 2
Alibalalalalalalalalalalalalalalalal scraces.
भाषाएँ: en, zh, ja, ko, fr, de, it, es
क्लोन आवाज
GPT-SoVITS
बहुत कम आवाज CONTCT TTS कि ऑडियो के सिर्फ 5 सेकंड से किसी भी आवाज की नकल करता है.
भाषाएँ: en, zh, ja, ko
क्लोन आवाज
Chatterbox
State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.
भाषाएँ: en
क्लोन आवाज
Tortoise TTS
बहु- रूसी पाठ- से- वार्ता ऑटो- प्रोग्रेसिव डिजाइन के साथ गुणवत्ता पर केंद्रित था.
भाषाएँ: en
क्लोन आवाज
OpenVoice
मन की भावनाओं, भावनाओं और उच्चारण पर क़ाबू पाने के लिए तुरंत आवाज़ की ज़रूरत होती है ।
भाषाएँ: en, zh, ja, ko, fr, es
क्लोन आवाज
VieNeu-TTS-v2
विएतनामी + अंग्रेजी कोड 7 पूर्व-प्रचलित आवाज तथा शून्य आवाज की बारी. सीपीयू-सिर्फ वांछित नहीं
भाषाएँ: vi, en
क्लोन आवाज
Chatterbox Turbo
हंसने, मर्स, और अधिक से अधिक के लिए उप-200mer बॉक्स के साथ तेज गपशप करें.
भाषाएँ: en
क्लोन आवाज
VoxCPM
MPRECT- फ्री- फ्री- रेएस को संदर्भ- अप्रचलित अनुच्छेद संगतता के साथ सामान्य बनाया जा रहा है.
भाषाएँ: en, zh
क्लोन आवाज
OuteTTS
TLM आधारित टी-स जो सीपीयू, जीपी या ब्राउज़र पर चलता है.pppp और रूपांतरण.js.j
भाषाएँ: en
क्लोन आवाज
CosyVoice3
अगली-पीढ़ी की-पीढ़ी se-stating, भावना नियंत्रण, और शून्य आवाज की नक़ल करें.
भाषाएँ: en, zh, ja, ko, de, es, fr, it, ru
क्लोन आवाज
Darwin TTS
क्यूवेएसएफ3-टीएफएफएफएफएस के साथ क्रास-टेशनल क्यूवेएन3-1. 7B भाषा मॉडल शुद्ध भिन्न भाषा मॉडल के लिए.
भाषाएँ: en, ko, ja, zh
क्लोन आवाज
MOSS-TTSD
मल्टी- स्पेसर संवाद मॉडल तैयार करता है - 5 स्पीकरों तथा copecent ऑडियो के 60 मिनट के साथ fapony-t-centy-t-t-टील-टील-टील्शन मॉडल तैयार करता है.
भाषाएँ: en, zh
क्लोन आवाज
Ming-Omni TTS
0.5BBELELALARTAC-टीरी भाषण मॉडल उच्च तकनीकी से 44.1HEK आउटपुट और शून्य आवाज की नक़ल करें.
भाषाएँ: en, zh
क्लोन आवाज
MOSS-TTS Nano
छोटा 100MIS-टीएस भिन्नता — एक ही संरचना, 80x छोटा, मुफ्त देर के बीच.
भाषाएँ: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
क्लोन आवाजडेवलपर- प्रथम एपीआई
REARTATRTB खोलें. एक अंत बिन्दु, 22+ मॉडल. बाहरी समय अनुप्रयोगों के लिए समर्थन देता है.
- AV- संगत फ़ॉर्मेट खोलें
- वास्तविक समय app्स के लिए स्ट्रीमिंग टीएसName
- बड़ी कार्यों के लिए बैच प्रक्रिया
- वेबबैक अधिसूचना
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
सरल, पारदर्शी पिथिंग
मुक्त शुरू करो. जैसे ही आप बढ़ते हैं, स्केल.
मुक्त
15,000 अक्षर + 5,000/ दिन
- 7 मुफ्त मॉडल जिनमें कोकोरो भी शामिल है
- 5,000 अक्षर प्रति पीढ़ी
- एपीआई पहुँच शामिल है
प्रारंभ
500 श्रेय/ माह
- सभी 22+ मॉडल
- प्रति पीढ़ी १,००,००० अक्षर
- आवाज कोलोन
प्रोग्रेड
2,000 श्रेय/ माहे
- प्रारंभ में सब कुछ
- एपीआई पहुँच
- प्राथमिकता प्रक्रिया
व्यवसाय
10,000 श्रेय/ माहे
- जो कुछ शुद्ध है
- बल्क एपीआई
- प्राथमिकता क़तार
बार बार पूछे जाने वाले प्रश्न
क्या हम सुधार कर सकते हैं?
एआई आवाज आज का प्रयोग करना प्रारंभ करें
TTS.ai के उपयोग से निर्माता, विकासकर्ता, और व्यवसाय शामिल हैं