फ्री एआई बोलने के लिए पाठ

82M पैरामीटर्स अत्यंत- तेज गोपनीय आवाज़ बहुमुखी स्ट्रीमिंग समर्थन

हल्का 82M पैरामीटर पैरामीटर स्थिर गति से स्टूडियो की भाषा बनाता है.

फास्ट · 1.5GB VRAM इसे कोशिश करें

Piper

सीपीयू- मित्रीय ऑफ़लाइन सक्षम 100+ आवाज 35+ भाषाएँ एसएसएमएल समर्थन

एक तेज, स्थानीय तंत्रिका पाठ जो सिस्टम के लिए अधिकतम करता है Rsphphy P और अंतर्निर्मित उपकरणों के लिए.

फास्ट · 0 (CPU only) VRAM इसे कोशिश करें

VITS

अंत- से- पिन सिंथ स्वाभाविक रीति से तेज इंच बहुल स्पीकर

प्रस्थिति परिवर्तन स्वचालित रूप से एकॉवर के साथ अंत-से- वार्ता पाठ-से- वार्ता के लिए सीख रहे हैं.

फास्ट · 1GB VRAM इसे कोशिश करें

MeloTTS

सीपीयू- पूर्वी बहुमुखी बहुमुखी उच्चारण उत्पादीय- प्रसंग कम रिलीमेंट

उच्चतमता विभिन्न पाठ- से- वार्ता जो कि सीपीयू पर कम से कम देर के साथ चलता है.

फास्ट · 0.5GB (GPU optional) VRAM इसे कोशिश करें

Bark

ध्वनि प्रभाव हँसते/ क़ाबिलेचरिंग संगीत पीढ़ी 100+ स्पीकर बहुमुखी

ट्रांसपर आधारित पाठ- से- वार्ता मॉडल जो यथार्थ वाणी, संगीत, और ध्वनि प्रभाव उत्पन्न करता है.

धीमा · 5GB VRAM इसे कोशिश करें

Bark Small

हल्के रंग पूर्ण पट्टीk से तेज भावात्मक बातचीत बहुमुखी

बारक का हल्का संस्करण इंच व कम मेमोरी उपयोग के साथ.

मध्यम · 2GB VRAM इसे कोशिश करें

CosyVoice 2

स्ट्रीमिंग शून्य- स्नेपशॉट क्रास- ब्रेकिंग तेज नियंत्रण मानव-पारिटी

Alibal scraces.

Dia TTS

मल्टी- स्पीकर संवाद पीढ़ी स्वाभाविक बारी-चक भावात्मक अभिव्यक्‍ति VARPB पैरामीटर्स

मल्टी- स्पीकर संवाद मॉडल जो स्पीकरओं के बीच प्राकृतिक वार्तालाप उत्पन्न करता है.

Parler TTS

आवाज़ वर्णन स्वाभाविक भाषा नियंत्रण अंतर्निर्मित आवाज बनाने में असमर्थ कोई पूर्व- नियत ध्वनि आवश्यक नहीं

स्वाभाविक भाषा में आवाज का वर्णन कीजिए जिसे आप चाहते हैं तथा परलर मेल से मिलते हैं.

Indic Parler TTS

11 इंडियन भाषाएँ आवाज़ वर्णन स्वाभाविक भाषा नियंत्रण सत्यापनात्मक उच्चारण

स्वाभाविक भाषा नियंत्रण के साथ ८+ भारतीय भाषा के लिए उच्च-प्रयोगात्मक भाषा.

धीमा · 8GB VRAM इसे कोशिश करें

KhanomTan TTS

थाई टीएस बहुल स्पीकर आपकी वंशीय रचना व्यावसायिक

वक्ताओं के एक चुनाव के साथ थाई-से-पहले पाठ-से- वार्ता.

फास्ट · 2GB VRAM इसे कोशिश करें

IndexTTS-2

तेज नियंत्रण शून्य- स्नेपशॉट एक्स- रेज़ वेक्टर्स मन लगाकर बात कीजिए बढ़िया- खराब नियंत्रण

अच्छी भावना नियंत्रण और उच्च अपमान के साथ शून्य-शंजी.

Spark TTS

आवाज कहीं नहीं तेज नियंत्रण शैली नियंत्रण संकेत आधारित 5-second-zone

नियंत्रणीय भावनाओं और बोलने वाली शैली के साथ आवाज एच.

GPT-SoVITS

5-second-zone स्वर से गा रहे हैं बहुत कम सीखने के बाद उच्च वफ़ादारी क्रास- ब्रेकिंग

बहुत कम आवाज CONTCT TTS कि ऑडियो के सिर्फ 5 सेकंड से किसी भी आवाज की नकल करता है.

धीमा · 6GB VRAM इसे कोशिश करें

Orpheus

मानव- लेवल भावना 100के घंटे प्रशिक्षण स्वाभाविक ज़ोर मन लगाकर बात कीजिए

मानव स्तर भावात्मक टीएस मॉडल द्वारा बोली डाटा के १००के घंटों पर प्रशिक्षित किया गया है.

Chatterbox

शून्य- स्नेपशॉट तेज नियंत्रण उच्च वफ़ादारी शैली हस्तांतरण एकल नमूनाGenericName

सरकारी-से-अर्ट शून्य-श- 1.

Tortoise TTS

सर्वोच्च गुणवत्ता बहु- प्रतिनिधि सभी- पूर्व रचना आवाज कहीं नहीं स्वतःग्रेसिव

बहु- रूसी पाठ- से- वार्ता ऑटो- प्रोग्रेसिव डिजाइन के साथ गुणवत्ता पर केंद्रित था.

धीमा · 8GB VRAM इसे कोशिश करें

StyleTTS 2

मानव- लेवल शैली एवर्थल प्रशिक्षण स्वाभाविक परिवर्तन उच्च वफ़ादारी

मानव- लेवल पाठ से वार्ता शैली डिफ्यूशन तथा प्रवरस्टिंग प्रशिक्षण के माध्यम से.

OpenVoice

तत्काल जन्नती आवाज रूपांतरण तेज नियंत्रण एसेंट कंट्रोल बहुमुखी

मन की भावनाओं, भावनाओं और उच्चारण पर क़ाबू पाने के लिए तुरंत आवाज़ की ज़रूरत होती है ।

Qwen3 TTS

9 पूर्व- नियत ध्वनि पाठ से आवाज डिजाइन तेज नियंत्रण 10 भाषाएँ

आईएसओबा की अलग-अलग आवाज तथा ध्वनि डिजाइन के साथ.

मध्यम · 7GB VRAM इसे कोशिश करें

VieNeu-TTS-v2

7 पूर्व- नियत स्वर (उत्तरी + दक्षिण कार्ट्रिज) एन- वी- वी- कार्डिंग आवाज क्रोना (3- 5 संदर्भ) पिडकास्ट / बहु- सिंक समर्थन सिर्फ सीपीयू — कोई जीपीयू आवश्यक नहीं

विएतनामी + अंग्रेजी कोड 7 पूर्व-प्रचलित आवाज तथा शून्य आवाज की बारी. सीपीयू-सिर्फ वांछित नहीं

फास्ट · CPU VRAM इसे कोशिश करें

Sesame CSM

वार्तालाप स्वाभाविक समय बारी- पलटो बैक- सेंटर 1B पैरामीटर्स

बातचीत की कला मॉडल स्वाभाविक बातचीत को सही वक्‍त पर और भावनाओं के साथ बनाया जा सकता है ।

धीमा · 8GB VRAM इसे कोशिश करें

Chatterbox Turbo

सब- 2004- मीक्सेस पारलिंग एक्सपोजर टैग्सGenericName 6x वास्तविक समय आवाज कहीं नहीं वाटरमार्किंग

हंसने, मर्स, और अधिक से अधिक के लिए उप-200mer बॉक्स के साथ तेज गपशप करें.

फास्ट · 2GB VRAM इसे कोशिश करें

VoxCPM

44.5HM ऑडियो प्राधिकृत- फ्री क्रास- कैरिकार्ड कॉन्टेक्स्ट- आनवेयर (n) लोरिया बढ़िया

MPRECT- फ्री- फ्री- रेएस को संदर्भ- अप्रचलित अनुच्छेद संगतता के साथ सामान्य बनाया जा रहा है.

फास्ट · 4GB VRAM इसे कोशिश करें

Kani TTS 2

3GB वीरैम अत्यंत- तेज हल्के रंग नेनो कोड मुक्त

Ultlt-sti-styo 400एम अंग्रेजी मॉडल सिर्फ 3GB VR में चल रहा है.

फास्ट · 3GB VRAM इसे कोशिश करें

OuteTTS

सीपीयू इंच चुपके से ब्राउज़र बहुल बैकएण्ड्स स्पीकर

TLM आधारित टी-स जो सीपीयू, जीपी या ब्राउज़र पर चलता है.p और रूपांतरण.js.j

धीमा · 2GB VRAM इसे कोशिश करें

VibeVoice

मल्टी- स्पीकर 90 मि. पोडकास्ट बनाना (P) स्पीकर संगतता 0 मी (पानी)

बहुत से समाचार माध्यमों तथा ऑडियोबुक जैसे पृष्ठ के लिए माइक्रोसॉफ़्ट मॉडल.

फास्ट · 4GB VRAM इसे कोशिश करें

Pocket TTS

100M पैरामीटर्स सीपीयू इंच आवाज कहीं नहीं एकल- एम्पल मुलर किनारा- तैयार

हल्का 100M पैरामीटर मॉडल एक ही नमूना से एक लाइन के साथ है.

फास्ट · 1GB VRAM इसे कोशिश करें

Kitten TTS

सिर्फ सीपीयू 80MB मॉडल आकार में 8 निर्मित ध्वनि गति नियंत्रण ऑन- आधारित 24kHE आउटपुट

UNUP के बिना सीपीयू पर Ult-Se- hitlus.

फास्ट · 0GB VRAM इसे कोशिश करें

CosyVoice3

बि- जाया जा रहा है तेज नियंत्रण आवाज कहीं नहीं गति/वोल्यूल नियंत्रण निम्न निर्देश

अगली-पीढ़ी की-पीढ़ी se-stating, भावना नियंत्रण, और शून्य आवाज की नक़ल करें.

फास्ट · 4GB VRAM इसे कोशिश करें

NAMAA Saudi TTS

सऊदी अरबीName आधुनिक मानक अरबी शून्य-शॉट तेज नियंत्रण नेटिव उच्चारण

सबसे पहले सऊदी सऊदी टीएस.

मध्यम · 6GB VRAM इसे कोशिश करें

Darwin TTS

आवाज कहीं नहीं क्रास- ब्रेकिंग FFN- बिन्ड 4 कोर भाषाएँ क्यूवेरियन

क्यूवेएसएफ3-टीएफएस के साथ क्रास-टेशनल क्यूवेएन3-1. 7B भाषा मॉडल शुद्ध भिन्न भाषा मॉडल के लिए.

मध्यम · 7GB VRAM इसे कोशिश करें

MOSS-TTSD

मल्टी- स्पीकर संवाद 5 वक्‍त के गुज़रते 60 मिनट के लिए ऑडियो आवाज कहीं नहीं पोस्ट- आउट्‌प्ड

मल्टी- स्पेसर संवाद मॉडल तैयार करता है - 5 स्पीकरों तथा copecent ऑडियो के 60 मिनट के साथ fapony-t-centy-t-t-टील्शन मॉडल तैयार करता है.

मध्यम · 12GB VRAM इसे कोशिश करें

Ming-Omni TTS

44.1kHz आउटपुट आवाज कहीं नहीं तेज नियंत्रण स्किल नियंत्रण BGM पीढ़ी सघन

0.5BBELELALARTAC-टीरी भाषण मॉडल उच्च तकनीकी से 44.1HEK आउटपुट और शून्य आवाज की नक़ल करें.

मध्यम · 3GB VRAM इसे कोशिश करें

MOSS-TTS Nano