मुक्त AI पाठ्य ते वक्तव्यName

82M पैरामीटर अतिशय जलद अभिव्यक्तीशील आवाज बहुभाषिक स्ट्रीमिंग समर्थन

2008-09-02 रोजी पाहिले.

ठराविक · 1.5GB VRAM प्रयत्न करा

Piper

CPU- मैत्रीपूर्ण ऑफलाइन समर्थीत १००+ आवाज 35+ भाषा SSML समर्थन

द्रुत, स्थानिक न्यूरल पाठ्य ते वक्तृत्व प्रणाली, रेशीम पाई आणि अंतर्भूत साधनांसाठी अनुकूलित.

ठराविक · 0 (CPU only) VRAM प्रयत्न करा

VITS

अंत- ते- अंत संश्लेषण नैसर्गिक शब्दरचना जलद निष्कर्षण बहु स्पीकर

नंतरच्या काळात लिंगभावाच्या अभ्यासासाठी लिंगभावशास्त्राचा वापर केला जाऊ लागला.

ठराविक · 1GB VRAM प्रयत्न करा

MeloTTS

CPU- अनुकूलीत बहुभाषिक बहुविध उच्चारण उत्पादन- सज्ज कमी लाटेन्सी

मराठी भाषेतील अनेक मराठी चित्रपटांची कथा ही लीलावतीच्या कथांवर आधारित आहे.

ठराविक · 0.5GB (GPU optional) VRAM प्रयत्न करा

Bark

ध्वनी प्रभाव हसणे/चिडचिड संगीत निर्मिती 100+ स्पीकर बहुभाषिक

मराठी चित्रपटसृष्टीतील संगीत दिग्दर्शक, संगीत दिग्दर्शक, संगीत दिग्दर्शक आणि संगीत दिग्दर्शक.

मंद · 5GB VRAM प्रयत्न करा

Bark Small

हलके पूर्ण बार्क पेक्षा जलद भावनिक भाषण बहुभाषिक

याचा वापर हायड्रोजनच्या वापरापेक्षा कमी खर्चिक व कमी हानिकारक आहे.

माध्यम · 2GB VRAM प्रयत्न करा

CosyVoice 2

स्ट्रीमिंग शून्य-शॉट क्लोन क्रॉस- भाषाName भावना नियंत्रण मानवी-पॅरिटी

ॲरिस्टॉटलच्या मते मानवी जीवन हे एक अत्यंत असामान्य आणि अलौकिक असे जीवन आहे.

Dia TTS

बहु स्पीकर संवाद निर्मिती नैसर्गिक वळण घेणे भावनिक अभिव्यक्ती 1.6B पैरामीटर

अनेक भाषांत भाषांतरित झालेले हे पुस्तक मराठी भाषेतील अनेक भाषांत अनुवादित झाले आहे.

Parler TTS

आवाज वर्णन नैसर्गिक भाषा नियंत्रण लहान आवाज निर्मिती पूर्वनिर्धारित आवाजांची आवश्यकता नाही

मराठी भाषेत लिंगभाव हा शब्द वापरला जातो आणि लिंगभाव हा शब्द मराठी भाषेत वापरला जातो.

Indic Parler TTS

भारतीय भाषा आवाज वर्णन नैसर्गिक भाषा नियंत्रण भारतीय तत्त्वज्ञान

भारतीय भाषांतील ८०+ भाषिकांच्या उच्च दर्जाच्या भाषणासाठी नैसर्गिक आवाज नियंत्रण.

मंद · 8GB VRAM प्रयत्न करा

KhanomTan TTS

थाई TTS बहु स्पीकर YourTTS आर्किटेक्चर व्यावसायिक-सुरक्षित परवाना

मराठी भाषेतील पहिले मराठी-मराठी शब्दकोश त्यांनी लिहिले.

ठराविक · 2GB VRAM प्रयत्न करा

IndexTTS-2

भावना नियंत्रण शून्य-शॉट भावना वेक्टर अभिव्यक्तीशील वक्तव्य Fine- Grained नियंत्रण

याचा अर्थ हायड्रोजनचे अणू एकमेकांशी अतिशय घट्ट आणि अतिशय स्थिर आहेत.

Spark TTS

आवाज क्लोन भावना नियंत्रण शैली नियंत्रण प्रोम्ट- आधारीत 5 सेकंद क्लोन

मराठी भाषेतील शब्दांची यादी मराठी भाषेतील शब्दांची यादी मराठी भाषेतील शब्दांची यादी मराठी शब्दांची यादी

GPT-SoVITS

5 सेकंद क्लोन गायन आवाज थोडे- थोडे शिकणे उच्च विश्वासार्हता क्रॉस- भाषाName

नंतरच्या काळात ॲपलने ॲपल टीव्ही प्लस हा टीव्ही बाजारात आणला ज्यात ५.

मंद · 6GB VRAM प्रयत्न करा

Orpheus

मानवी स्तरावरील भावना 100K तास प्रशिक्षण नैसर्गिक भर अभिव्यक्तीशील वक्तव्य

100 पेक्षा जास्त तासांच्या अभ्यासक्रमासाठी 100 हून अधिक भाषांचे ज्ञान आवश्यक आहे.

Chatterbox

शून्य-शॉट क्लोन भावना नियंत्रण उच्च विश्वासार्हता शैली स्थानांतरण एकल नमूना क्लोनिंग

ॲरिस्टॉटलच्या मते, तत्त्वज्ञान हे तत्त्वज्ञानाच्या संकल्पनेतून व्यक्त होऊन तत्त्वज्ञानाच्या माध्यमातून व्यक्त होते.

Tortoise TTS

सर्वोत्तम दर्जा बहु- आवाज DALL-E आर्किटेक्चर आवाज क्लोन स्वयं- परतफेक

अनेक मराठी लेखकांनी मराठी साहित्यात लिंगभावाच्या प्रश्नावर लेखन केले आहे.

मंद · 8GB VRAM प्रयत्न करा

StyleTTS 2

मानवी- स्तर शैली प्रसारण प्रतिस्पर्धी प्रशिक्षण नैसर्गिक बदल उच्च विश्वासार्हता

या वृत्तपत्रात वृत्तांत, लेख, भाषणे या माध्यमातून लोकांची माहिती दिली जाते.

OpenVoice

त्वरित क्लोन आवाज रूपांतरण भावना नियंत्रण उच्चारण नियंत्रण बहुभाषिक

त्यांतील काही तत्त्वे पुढीलप्रमाणे :- लिंगभाव, लिंगभावभावना, लिंगभावभावना आणि लिंगभावभावना.

Qwen3 TTS

9 पूर्वनिर्धारित आवाज पाठ्य पासून आवाज रचना भावना नियंत्रण भाषा

ॲपलच्या अनेक उपकंपन्यांनी या ॲपची निर्मिती केली आहे.

माध्यम · 7GB VRAM प्रयत्न करा

VieNeu-TTS-v2

7 पूर्वनिर्धारित आवाज (उत्तर + दक्षिण उच्चारण) Name En-Vi कोड-स्विचिंग आवाज क्लोन (3-5s संदर्भ) पॉडकास्ट / बहु- स्पीकर समर्थन फक्त CPU — GPU आवश्यक नाही

व्हियेतनामी + इंग्रजी कोड- स्विचिंग TTS7पूर्वनिर्धारित आवाज व शून्य- शॉट आवाज क्लोनिंग सह. फक्त CPU, GPU आवश्यक नाही.

ठराविक · CPU VRAM प्रयत्न करा

Sesame CSM

संवादName नैसर्गिक वेळ फेरी घेणे बॅक- चैनल 1B पैरामीटर

तत्त्वज्ञानाच्या अभ्यासात तत्त्वज्ञान हा शब्द सामान्यतः तत्त्वज्ञान आणि तत्त्वज्ञानाशी संबंधित विषयांसाठी वापरला जातो.

मंद · 8GB VRAM प्रयत्न करा

Chatterbox Turbo

सब- 200ms लेटेंसी Paralinguistic टॅग 6x वास्तविक वेळ आवाज क्लोन वॉटरमार्क

यामध्ये अनुसूचित जातीचे लोक ० असून अनुसूचित जमातीचे ० लोक आहेत.

ठराविक · 2GB VRAM प्रयत्न करा

VoxCPM

44.1kHz ऑडिओ टोकेनिझर- फ्री क्रॉस- भाषा क्लोनिंग संदर्भ- संवेदनशील LoRA सुधारणा

44.1 kHz ऑडिओ संदर्भ-जाणते अनुच्छेद एकसमानतेसह Tokenizer-मुक्त TTS तयार करते.

ठराविक · 4GB VRAM प्रयत्न करा

Kani TTS 2

3GB VRAM अतिशय जलद हलके नैनोकोडेक मोकळे

400 MHz पर्यंतच्या हाय-स्पीड इंटरनेट कनेक्शनसाठी 3G वापरले जाते.

ठराविक · 3GB VRAM प्रयत्न करा

OuteTTS

CPU निष्कर्षण ब्राऊजर निष्कर्षण अनेक बॅकएन्ड स्पीकर प्रोफाइल

या यंत्रणेत CPU, GPU, आणि ग्राफिक्स कार्ड यांचा वापर केला जातो.

मंद · 2GB VRAM प्रयत्न करा

VibeVoice

बहु स्पीकर 90 मिनिट पर्यंत पॉडकास्ट निर्मिती स्पीकर सुसंगतता 200ms स्ट्रीमिंग

मायक्रोसॉफ्ट मॉडेल पॉडकास्ट आणि ऑडिओबुक सारख्या लांब स्वरूपाच्या बहु-स्पीकर सामग्रीसाठी.

ठराविक · 4GB VRAM प्रयत्न करा

Pocket TTS

100M पैरामीटर CPU निष्कर्षण आवाज क्लोन एकल-सामाग्री क्लोन किनार- सज्ज

100 मीटर धावण्याच्या शर्यतीत 100 मीटर धावण्याचा एकेरी प्रकार स्पर्धेत समाविष्ट आहे.

ठराविक · 1GB VRAM प्रयत्न करा

Kitten TTS

फक्त CPU- इंफरन्स 80MB पेक्षा कमी मॉडल आकार 8 अंतर्भूतीत आवाजName वेग नियंत्रण ONNX आधारीत 24kHz आऊटपुट

80MB पेक्षा कमी अतिशय हलके TTS. GPU नसून CPU वर चालविले जाते.

ठराविक · 0GB VRAM प्रयत्न करा

CosyVoice3

दुहेरी प्रवाह भावना नियंत्रण आवाज क्लोन वेग/ आवाज नियंत्रण निर्देश पुढे

नंतरच्या पिढीतील बहुभाषिक TTS, bi-streaming, emotional control आणि zero-shot voice cloning सोबत.

ठराविक · 4GB VRAM प्रयत्न करा

NAMAA Saudi TTS

सौदी अरेबियाई बोलीName आधुनिक मानक अरबी शून्य-शॉट आवाज क्लोनिंग भावना नियंत्रण मूळ उच्चार

पहिला खुला सौदी- अरबी TTS. चॅटरबॉक्स- गुणवत्तेचे आवाज क्लोनसह स्वदेशी सौदी बोलीभाषा. Name

माध्यम · 6GB VRAM प्रयत्न करा

Darwin TTS

आवाज क्लोन क्रॉस- भाषाName FFN- ब्लेंडेड भाषाName Qwen3 बॅकबोन

गूगल क्रोम ३.१ पासून गूगल क्रोम ३.२ पर्यंतच्या सर्व आवृत्त्या गूगल क्रोमच्या अधिकृत संकेतस्थळावर उपलब्ध आहेत.

माध्यम · 7GB VRAM प्रयत्न करा

MOSS-TTSD

बहु- स्पीकर संवाद 5 स्पीकर पर्यंत 60min संतुलित ऑडिओ आवाज क्लोन पॉडकास्ट ऑप्टिमायझेशन

’अभिव्यक्ती’चे संपादकीय विभागात काम करताना त्यांनी अनेक मराठी चित्रपटांना संगीत दिले व सुमारे ६० चित्रपटांना संगीत दिले.

माध्यम · 12GB VRAM प्रयत्न करा

Ming-Omni TTS

44. 1kHz आऊटपुट आवाज क्लोन भावना नियंत्रण बोली नियंत्रण BGM निर्मिती कॉम्पॅक्ट 0.5B

०.५ बी ओएमएम (Omni-Modal) भाषण मॉडेल इंकल्यूजनएआय पासून उच्च विश्वासार्हता ४४.

माध्यम · 3GB VRAM प्रयत्न करा

MOSS-TTS Nano