मुक्त AI पाठ्य ते वक्तव्यName

33+ ओपन सोर्स मॉडेल, 273+ आवाज, 33+ भाषा. खाते आवश्यक नाही.

17K+
बनविणारे
70K+
आवृत्ती
33+
AI नमूने
273+
आवाज
0/500 अक्षरे · ५००० च्या आसपास आहे. → मोकळे
TTS.ai आवडले? तुमच्या मित्रांना सांगा!

आवाज AI साठी तुम्हाला हवे ते सर्वName

30+ उपकरणे ओपन-सोर्स AI मॉडेल्सद्वारे चालविली जातात

33+ AI आवाज मॉडेलName

एका प्लॅटफॉर्मवर खुले स्रोत TTS मॉडेलचे सर्वात व्यापक संग्रह

KokoroKokoro मोकळे

कोकोरो हे 82 दशलक्ष पैरामीटर पाठ्य- ते- वक्तव्य मॉडेल आहे जे त्याच्या वजन वर्गापेक्षा जास्त आहे. त्याचे लहान आकार असले तरी, ते उल्लेखनीय नैसर्गिक आणि अभिव्यक्तीशील वक्तव्य निर्माण करते. कोकोरो अनेक भाषांना समर्थन देते ज्यात इंग्रजी, जपानी, चिनी व कोरियाई यांचा समावेश आहे ज्यात विविध अभिव्यक्तीशील आवाज आहेत. ते अत्यंत जलद चालते - जीपीयूवरील वास्तविक वेळेपेक्षा सुमारे 100 पट जलद ऑडिओ निर्माण करते.

सर्वोत्तम: कमीत कमी विलंबतासह उच्च दर्जाचे TTS, स्ट्रीमिंग अनुप्रयोगName

मोफत प्रयत्न करा

PiperPiper मोकळे

Piper हे Rhasspy द्वारे विकसित केले गेलेले एक हलके पाठ्य-भाष्य इंजिन आहे जे VITS आणि larynx आर्किटेक्चर वापरते. ते पूर्णपणे CPU वर चालते, जे ते अत्यंत उपकरणांसाठी, घरातील स्वयंचलितीकरणासाठी आणि ऑफलाइन TTS आवश्यक असलेल्या अनुप्रयोगांसाठी आदर्श बनवते. 30+ भाषांमधील 100 पेक्षा जास्त आवाजांसह, Piper ने Raspberry Pi4वरही वास्तविक वेळेत नैसर्गिक-ध्वनी ध्वनी प्रदान केला आहे.

सर्वोत्तम: जलद पूर्वदृश्य, प्रवेशीयता, व अंतर्भूतीत अनुप्रयोगName

मोफत प्रयत्न करा

VITSVITS मोकळे

VITS (विविधता निष्कर्षासह विरोधाभास शिकणे अंत- ते- अंत पाठ- ते- भाषणासाठी) एक समांतर अंत- ते- अंत TTS पद्धत आहे जी सध्याच्या दोन- टप्प्या मॉडेलपेक्षा अधिक नैसर्गिक आवाज ध्वनी निर्माण करते. ते वैविध्यपूर्ण निष्कर्षासह सामान्यीकरण प्रवाह आणि विरोधाभास प्रशिक्षण प्रक्रियासह वाढविलेले स्वीकारते, नैसर्गिकतेमध्ये उल्लेखनीय सुधारणा प्राप्त करते.

सर्वोत्तम: नैसर्गिक शब्दरचना सह सर्वसाधारण पाठ्य- ते- वक्तव्यName

मोफत प्रयत्न करा

MeloTTSMeloTTS मोकळे

MyShell. ai द्वारे MeloTTS एक बहुभाषिक TTS लायब्ररी आहे जी इंग्रजी (अमेरिकन, ब्रिटिश, भारतीय, ऑस्ट्रेलियन), स्पॅनिश, फ्रेंच, चिनी, जपानी, आणि कोरियाई समर्थन करीता आहे. हे अतिशय जलद आहे, फक्त CPU वर जवळजवळ वास्तविक वेळ गतीने पाठ्य प्रक्रिया करते. MeloTTS उत्पादन वापर करीता डिझाइन केले गेले आहे व CPU व GPU दोन्ही निरीक्षण करीता समर्थन पुरवते.

सर्वोत्तम: वेगवान, बहुभाषिक TTS आवश्यक असलेले उत्पादन अनुप्रयोगName

मोफत प्रयत्न करा

Kani TTS 2Kani TTS 2 मोकळे

Kani-TTS-2 by NineNineSix हे एक अतिशय हलके 400M पैरामीटर मॉडेल आहे जे Nvidia NanoCodec सह LiquidAI LFM2 बॅकबोनवर बनविले गेले आहे. ते फक्त3GB VRAM मध्ये चालते आणि ~2 सेकंदांमध्ये 10 सेकंद भाषण (RTF 0.2) प्राप्त करते. स्पीकर एम्बेडिंग्सद्वारे शून्य-शॉट आवाज क्लोनिंगला समर्थन देते.

सर्वोत्तम: कमी VRAM हायपरवॉलेटवर जलद इंग्रजी निर्मिती, जलद पूर्वदृश्य

मोफत प्रयत्न करा

OuteTTSOuteTTS मोकळे

OuteTTS मूलभूत वास्तुकला संरक्षित करत असताना पाठ्य-भाषण क्षमतांसह मोठ्या भाषा मॉडेल्स विस्तारित करते. ते lama. cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, आणि Transformers. js द्वारे ब्राउझर इन्फरन्ससह अनेक बॅकएंडला समर्थन देते. JSON म्हणून संचयित स्पीकर प्रोफाइलद्वारे शून्य-शॉट आवाज क्लोनिंगची वैशिष्ट्ये.

सर्वोत्तम: किनारा वितरण, ब्राऊजर-आधारित TTS, कमी-स्त्रोत वातावरण

मोफत प्रयत्न करा

Pocket TTSPocket TTS मोकळे

पोकेमॉन गो (Moji चे निर्माता) द्वारे पोकेमॉन TTS एक संकुचित 100M पैरामीटर पाठ्य- ते- वक्तव्य मॉडेल आहे जे त्याच्या वजनाच्या वर जातो. ते CPU वर कार्यक्षमरित्या चालते, एकल ऑडिओ नमूने पासून शून्य- शॉट आवाज क्लोनिंग समर्थन करते, आणि नैसर्गिक- आवाजाचा आवाज निर्माण करते. लहान मॉडेल आकार हे अत्यंत वापरासाठी आणि कमी स्त्रोत वातावरणासाठी आदर्श बनवितो.

सर्वोत्तम: हलके वितरण, फक्त CPU वातावरण, जलद आवाज क्लोनिंग

मोफत प्रयत्न करा

Kitten TTSKitten TTS मोकळे

Kitten TTS by KittenML हे ONNX वर बांधलेले अतिशय हलके पाठ्य- ते- वक्तव्य मॉडेल आहे. 15M ते 80M पैरामीटर (डिस्कवर 25- 80 MB) पासून भिन्नतेसह, GPU ची आवश्यकता नसून CPU वर उच्च दर्जाचे वक्तव्य संश्लेषण पुरविते. 8 अंतर्भूतीत आवाज, समायोज्य वक्तव्य वेग, आणि संख्या, चलन, व एककांसाठी अंतर्भूतीत पाठ्य पूर्वप्रक्रिया. किनारा वितरण व कमी- लेटेन्सी अनुप्रयोग करीता आदर्श.

सर्वोत्तम: जलद हलके TTS, किनारा वितरण, कमी- लेटेन्सी अनुप्रयोगName

मोफत प्रयत्न करा

Ming-Omni TTSMing-Omni TTS मोकळे

Ming-omni-tts-0.5B by inclusionAI is a compact omni-modal speech model built on the BailingMM dense backbone with a Patch-by-Patch flow-matching audio decoder. Delivers 44.1kHz output (near CD quality), supports zero-shot voice cloning from a 3+ second reference, and includes built-in emotion / dialect / BGM control via JSON instructions. Excellent stability — 0.83% WER on Chinese benchmarks.

सर्वोत्तम: मराठी भाषा साहित्य संमेलन, पुणे मराठी भाषा साहित्य संमेलन, पुणे मराठी भाषा साहित्य संमेलन, पुणे

मोफत प्रयत्न करा

MOSS-TTS NanoMOSS-TTS Nano मोकळे

100M MOSS-TTS-Nano-100M MOSS-TTS कुटुंबातील OpenMOSS चा कॉम्पॅक्ट 100M-परामर्श व्हेरिएंट आहे, डिले-ट्रान्सफॉर्मर आर्किटेक्चर शेअर करते.

सर्वोत्तम: मुक्त- स्तर TTS, उच्च- प्रमाण उत्पादन, कमी- विलंब संवाद वापर

मोफत प्रयत्न करा

BarkBark मुलभूत

मराठी चित्रपटसृष्टीतील संगीत दिग्दर्शक, संगीत दिग्दर्शक, संगीत दिग्दर्शक आणि संगीत दिग्दर्शक.

डेव्हलपर: Suno · परवाना: MIT

प्रयत्न करा

Bark SmallBark Small मुलभूत

याचा वापर हायड्रोजनच्या वापरापेक्षा कमी खर्चिक व कमी हानिकारक आहे.

डेव्हलपर: Suno · परवाना: MIT

प्रयत्न करा

CosyVoice 2CosyVoice 2 मुलभूत

ॲरिस्टॉटलच्या मते मानवी जीवन हे एक अत्यंत असामान्य आणि अलौकिक असे जीवन आहे.

डेव्हलपर: Alibaba (Tongyi Lab) · परवाना: Apache 2.0

प्रयत्न करा

Dia TTSDia TTS मुलभूत

अनेक भाषांत भाषांतरित झालेले हे पुस्तक मराठी भाषेतील अनेक भाषांत अनुवादित झाले आहे.

डेव्हलपर: Nari Labs · परवाना: Apache 2.0

प्रयत्न करा

Parler TTSParler TTS मुलभूत

मराठी भाषेत लिंगभाव हा शब्द वापरला जातो आणि लिंगभाव हा शब्द मराठी भाषेत वापरला जातो.

डेव्हलपर: Hugging Face · परवाना: Apache 2.0

प्रयत्न करा

IndexTTS-2IndexTTS-2 मुलभूत

याचा अर्थ हायड्रोजनचे अणू एकमेकांशी अतिशय घट्ट आणि अतिशय स्थिर आहेत.

डेव्हलपर: Index Team · परवाना: Bilibili Model License

प्रयत्न करा

Spark TTSSpark TTS मुलभूत

मराठी भाषेतील शब्दांची यादी मराठी भाषेतील शब्दांची यादी मराठी भाषेतील शब्दांची यादी मराठी शब्दांची यादी

डेव्हलपर: SparkAudio · परवाना: CC BY-NC-SA 4.0

प्रयत्न करा

GPT-SoVITSGPT-SoVITS मुलभूत

नंतरच्या काळात ॲपलने ॲपल टीव्ही प्लस हा टीव्ही बाजारात आणला ज्यात ५.

डेव्हलपर: RVC-Boss · परवाना: MIT

प्रयत्न करा

OrpheusOrpheus मुलभूत

100 पेक्षा जास्त तासांच्या अभ्यासक्रमासाठी 100 हून अधिक भाषांचे ज्ञान आवश्यक आहे.

डेव्हलपर: Canopy Labs · परवाना: Llama 3.2 Community

प्रयत्न करा

Qwen3 TTSQwen3 TTS मुलभूत

ॲपलच्या अनेक उपकंपन्यांनी या ॲपची निर्मिती केली आहे.

डेव्हलपर: Alibaba (Qwen) · परवाना: Apache 2.0

प्रयत्न करा

VieNeu-TTS-v2VieNeu-TTS-v2 मुलभूत

व्हियेतनामी + इंग्रजी कोड- स्विचिंग TTS7पूर्वनिर्धारित आवाज व शून्य- शॉट आवाज क्लोनिंग सह. फक्त CPU, GPU आवश्यक नाही.

डेव्हलपर: Phạm Nguyễn Ngọc Bảo · परवाना: Apache 2.0

प्रयत्न करा

Chatterbox TurboChatterbox Turbo मुलभूत

यामध्ये अनुसूचित जातीचे लोक ० असून अनुसूचित जमातीचे ० लोक आहेत.

डेव्हलपर: Resemble AI · परवाना: MIT

प्रयत्न करा

VoxCPMVoxCPM मुलभूत

44.1 kHz ऑडिओ संदर्भ-जाणते अनुच्छेद एकसमानतेसह Tokenizer-मुक्त TTS तयार करते.

डेव्हलपर: OpenBMB · परवाना: Apache 2.0

प्रयत्न करा

VibeVoiceVibeVoice मुलभूत

मायक्रोसॉफ्ट मॉडेल पॉडकास्ट आणि ऑडिओबुक सारख्या लांब स्वरूपाच्या बहु-स्पीकर सामग्रीसाठी.

डेव्हलपर: Microsoft · परवाना: MIT

प्रयत्न करा

CosyVoice3CosyVoice3 मुलभूत

नंतरच्या पिढीतील बहुभाषिक TTS, bi-streaming, emotional control आणि zero-shot voice cloning सोबत.

डेव्हलपर: Alibaba (FunAudioLLM) · परवाना: Apache 2.0

प्रयत्न करा

NAMAA Saudi TTSNAMAA Saudi TTS मुलभूत

पहिला खुला सौदी- अरबी TTS. चॅटरबॉक्स- गुणवत्तेचे आवाज क्लोनसह स्वदेशी सौदी बोलीभाषा. Name

डेव्हलपर: NAMAA Space · परवाना: MIT

प्रयत्न करा

Darwin TTSDarwin TTS मुलभूत

गूगल क्रोम ३.१ पासून गूगल क्रोम ३.२ पर्यंतच्या सर्व आवृत्त्या गूगल क्रोमच्या अधिकृत संकेतस्थळावर उपलब्ध आहेत.

डेव्हलपर: FINAL-Bench · परवाना: Apache 2.0

प्रयत्न करा

MOSS-TTSDMOSS-TTSD मुलभूत

’अभिव्यक्ती’चे संपादकीय विभागात काम करताना त्यांनी अनेक मराठी चित्रपटांना संगीत दिले व सुमारे ६० चित्रपटांना संगीत दिले.

डेव्हलपर: OpenMOSS · परवाना: Apache 2.0

प्रयत्न करा

ChatterboxChatterbox प्रीमियम

ॲरिस्टॉटलच्या मते, तत्त्वज्ञान हे तत्त्वज्ञानाच्या संकल्पनेतून व्यक्त होऊन तत्त्वज्ञानाच्या माध्यमातून व्यक्त होते.

गुणवत्ता:

प्रयत्न करा

Tortoise TTSTortoise TTS प्रीमियम

अनेक मराठी लेखकांनी मराठी साहित्यात लिंगभावाच्या प्रश्नावर लेखन केले आहे.

गुणवत्ता:

प्रयत्न करा

StyleTTS 2StyleTTS 2 प्रीमियम

या वृत्तपत्रात वृत्तांत, लेख, भाषणे या माध्यमातून लोकांची माहिती दिली जाते.

गुणवत्ता:

प्रयत्न करा

OpenVoiceOpenVoice प्रीमियम

त्यांतील काही तत्त्वे पुढीलप्रमाणे :- लिंगभाव, लिंगभावभावना, लिंगभावभावना आणि लिंगभावभावना.

गुणवत्ता:

प्रयत्न करा

Sesame CSMSesame CSM प्रीमियम

तत्त्वज्ञानाच्या अभ्यासात तत्त्वज्ञान हा शब्द सामान्यतः तत्त्वज्ञान आणि तत्त्वज्ञानाशी संबंधित विषयांसाठी वापरला जातो.

गुणवत्ता:

प्रयत्न करा

CosyVoice 2CosyVoice 2

ॲरिस्टॉटलच्या मते मानवी जीवन हे एक अत्यंत असामान्य आणि अलौकिक असे जीवन आहे.

भाषा: en, zh, ja, ko, fr, de, it, es

आवाज प्रतिकृत करा

IndexTTS-2IndexTTS-2

याचा अर्थ हायड्रोजनचे अणू एकमेकांशी अतिशय घट्ट आणि अतिशय स्थिर आहेत.

भाषा: en, zh

आवाज प्रतिकृत करा

Spark TTSSpark TTS

मराठी भाषेतील शब्दांची यादी मराठी भाषेतील शब्दांची यादी मराठी भाषेतील शब्दांची यादी मराठी शब्दांची यादी

भाषा: en, zh

आवाज प्रतिकृत करा

GPT-SoVITSGPT-SoVITS

नंतरच्या काळात ॲपलने ॲपल टीव्ही प्लस हा टीव्ही बाजारात आणला ज्यात ५.

भाषा: en, zh, ja, ko

आवाज प्रतिकृत करा

ChatterboxChatterbox

ॲरिस्टॉटलच्या मते, तत्त्वज्ञान हे तत्त्वज्ञानाच्या संकल्पनेतून व्यक्त होऊन तत्त्वज्ञानाच्या माध्यमातून व्यक्त होते.

भाषा: en

आवाज प्रतिकृत करा

Tortoise TTSTortoise TTS

अनेक मराठी लेखकांनी मराठी साहित्यात लिंगभावाच्या प्रश्नावर लेखन केले आहे.

भाषा: en

आवाज प्रतिकृत करा

OpenVoiceOpenVoice

त्यांतील काही तत्त्वे पुढीलप्रमाणे :- लिंगभाव, लिंगभावभावना, लिंगभावभावना आणि लिंगभावभावना.

भाषा: en, zh, ja, ko, fr, es

आवाज प्रतिकृत करा

VieNeu-TTS-v2VieNeu-TTS-v2

व्हियेतनामी + इंग्रजी कोड- स्विचिंग TTS7पूर्वनिर्धारित आवाज व शून्य- शॉट आवाज क्लोनिंग सह. फक्त CPU, GPU आवश्यक नाही.

भाषा: vi, en

आवाज प्रतिकृत करा

Chatterbox TurboChatterbox Turbo

यामध्ये अनुसूचित जातीचे लोक ० असून अनुसूचित जमातीचे ० लोक आहेत.

भाषा: en

आवाज प्रतिकृत करा

VoxCPMVoxCPM

44.1 kHz ऑडिओ संदर्भ-जाणते अनुच्छेद एकसमानतेसह Tokenizer-मुक्त TTS तयार करते.

भाषा: en, zh

आवाज प्रतिकृत करा

OuteTTSOuteTTS

या यंत्रणेत CPU, GPU, आणि ग्राफिक्स कार्ड यांचा वापर केला जातो.

भाषा: en

आवाज प्रतिकृत करा

Pocket TTSPocket TTS

100 मीटर धावण्याच्या शर्यतीत 100 मीटर धावण्याचा एकेरी प्रकार स्पर्धेत समाविष्ट आहे.

भाषा: en, fr

आवाज प्रतिकृत करा

CosyVoice3CosyVoice3

नंतरच्या पिढीतील बहुभाषिक TTS, bi-streaming, emotional control आणि zero-shot voice cloning सोबत.

भाषा: en, zh, ja, ko, de, es, fr, it, ru

आवाज प्रतिकृत करा

NAMAA Saudi TTSNAMAA Saudi TTS

पहिला खुला सौदी- अरबी TTS. चॅटरबॉक्स- गुणवत्तेचे आवाज क्लोनसह स्वदेशी सौदी बोलीभाषा. Name

भाषा: ar

आवाज प्रतिकृत करा

Darwin TTSDarwin TTS

गूगल क्रोम ३.१ पासून गूगल क्रोम ३.२ पर्यंतच्या सर्व आवृत्त्या गूगल क्रोमच्या अधिकृत संकेतस्थळावर उपलब्ध आहेत.

भाषा: en, ko, ja, zh

आवाज प्रतिकृत करा

MOSS-TTSDMOSS-TTSD

’अभिव्यक्ती’चे संपादकीय विभागात काम करताना त्यांनी अनेक मराठी चित्रपटांना संगीत दिले व सुमारे ६० चित्रपटांना संगीत दिले.

भाषा: en, zh

आवाज प्रतिकृत करा

Ming-Omni TTSMing-Omni TTS

०.५ बी ओएमएम (Omni-Modal) भाषण मॉडेल इंकल्यूजनएआय पासून उच्च विश्वासार्हता ४४.

भाषा: en, zh

आवाज प्रतिकृत करा

MOSS-TTS NanoMOSS-TTS Nano

100M MOSS-TTS व्हेरिएंट - तेच आर्किटेक्चर, 80x लहान, मुक्त स्तर लॅटिनिटी.

भाषा: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

आवाज प्रतिकृत करा

डेव्हलपर- प्रथम API

OpenAI-सुसंगत REST API. एक अंतबिंदू, 22+ मॉडेल. वास्तविक वेळ अनुप्रयोगांसाठी स्ट्रीमिंग समर्थन.

  • OpenAI- सुसंगत स्वरूप
  • वास्तविक वेळ अनुप्रयोग करीता TTS स्ट्रीमिंग
  • मोठे कार्य करीता बॅच प्रक्रिया
  • वेबहॉक सूचना
API दस्तऐवजीकरण पहा
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

सोपे, पारदर्शक दर

मुक्तपणे सुरू करा. वाढू द्या.

मोकळे

$0

१५,००० अक्षरे + ५०००/दिवस

  • कोकोरोसह ७ मोफत नमुने
  • 5,000 अक्षरे प्रति निर्मिती
  • API प्रवेश समाविष्टीत आहे
नोंदणी करा

प्रारंभकर्ता

$9/% 1 सेकंद

500 क्रेडिट/महिने

  • सर्व 22+ मॉडेल
  • 100,000 अक्षरे प्रति निर्मिती
  • आवाज क्लोनिंग
सुरू करा
सर्वात लोकप्रिय

प्रो

$29/% 1 सेकंद

2,000 क्रेडिट/महिने

  • स्टार्टअप अंतर्गत सर्वकाही
  • API प्रवेश
  • प्राधान्यता प्रक्रिया
प्रो मिळवा

व्यवसाय

$99/% 1 सेकंद

10,000 क्रेडिट/महिने

  • प्रो मध्ये सर्वकाही
  • मोठे API
  • प्राधान्यता कतार
व्यवसाय मिळवा

अक्षर पॅकेजेससह सर्व योजना पहा →

वारंवार विचारले जाणारे प्रश्न

TTS.ai हे सर्वात व्यापक AI आवाज प्लॅटफॉर्म आहे, 22 + पाठ-ते-भाषण मॉडेल, आवाज क्लोनिंग, भाषण-ते-भाषण आणि ऑडिओ साधने प्रदान करते.

होय! TTS.ai कोकोरो, पाइपर, VITS, आणि MeloTTS मॉडेलसह मोफत पाठ-भाषेत बोलण्याची ऑफर करते. खाते आवश्यक नाही. 15,000 मोफत अक्षरे मिळविण्यासाठी नोंदणी करा आणि सर्व मॉडेल्सचा वापर करा.

वेगासाठी, Kokoro किंवा Piper चा वापर करा. गुणवत्तेसाठी, CosyVoice2किंवा StyleTTS2चा वापर करा. आवाज क्लोनिंग करीता, Chatterbox किंवा GPT- SoVITS चा वापर करा. संवाद करीता, Dia TTS चा वापर करा. तुलना करीता एकाच पाठ्यावर अनेक मॉडेल्सचा वापर करा.

होय. TTS, STT, आवाज क्लोनिंग, आणि ऑडिओ साधनांसाठी OpenAI-सुसंगत REST API. मोफत यांसह प्रत्येक प्लॅनवर समाविष्ट, दर मर्यादा स्तरानुसार वाढते (मोफत: 10 req/min, लाईट: 20, स्टार्टर: 30, प्रो: 60, बिझनेस: 300). tts.ai/api/ येथे दस्तऐवज पहा.

आवाजाची गुणवत्ता मॉडेलनुसार बदलते. प्रीमियम मॉडेल्स जसे की कॉसीव्हॉईस2, स्टाइलटीटीएस2आणि चॅटरबॉक्स नैसर्गिक उच्चार व भावनांसह मानवी गुणवत्तेच्या जवळचे भाषण तयार करतात. कोकोरो सारखे मोफत मॉडेल बहुतेक वापरासाठी उत्कृष्ट गुणवत्ता प्रदान करतात.

TTS.ai 30+ भाषांना समर्थन देते. इंग्रजीला सर्वात व्यापक समर्थन आहे, पण कॉसीव्हॉईस2यासारख्या मॉडेल चीनी, जपानी आणि कोरियाई भाषांचा समावेश करतात; जीपीटी-सोविट्स चीनी, जपानी, कोरियाई आणि इंग्रजी हाताळतात; आणि मेलोटीटीएस इंग्रजी, स्पॅनिश, फ्रेंच, चीनी, जपानी आणि कोरियाई भाषांचा समर्थन करते.

होय. सर्व प्रक्रिया आमच्या समर्पित GPU सर्वरवर होते. आम्ही तुमच्या पाठ्य इनपुट किंवा वितरण नंतर निर्माण झालेले ऑडिओ साठवत नाही. क्लोन करीता अपलोड केलेले आवाज नमुने फक्त वर्तमान सत्र करीता वापरले जातात व ठेवले जात नाहीत. आम्ही कधीच तुमची माहिती तिसरया पक्षाशी शेअर करत नाही किंवा मॉडेल प्रशिक्षण करीता वापरत नाही.

होय. TTS.ai वर निर्माण केलेले सर्व ऑडिओ व्यावसायिक वापरासाठी तुमच्याकडे आहे, YouTube व्हिडिओ, पॉडकास्ट, ऑडिओबुक, ऍप, जाहिरात आणि उत्पादने यासह. आमचे मॉडेल परवाना (MIT, Apache 2.0) अंतर्गत ओपन सोर्स आहेत. रॉयल्टी किंवा श्रेय आवश्यक नाही.

TTS.ai सर्वोत्तम दर्जासाठी WAV स्वरूपात मुलभूतरित्या ऑडिओ निर्माण करते. आपण MP3, FLAC, OGG, किंवा M4A मध्ये बदलवू शकता आमचे मोफत ऑडिओ कनवर्टर साधन वापरून. API अनुप्रयोगात थेट आपल्या पसंतीचे आऊटपुट स्वरूप निश्चित करण्यास समर्थन देतो.

तुम्हाला क्लोन करायचे असणारे आवाजाचे छोटे ऑडिओ नमुने अपलोड करा (5 सेकंद पेक्षा कमी), त्यानंतर त्या आवाजात भाषण निर्माण करण्याकरीता कोणताही पाठ्य टाइप करा. चॅटरबॉक्स, GPT-SoVITS, आणि CosyVoice2यासारखे मॉडेल आवाज क्लोन करीता समर्थन देतात. क्लोन केलेले आवाज टोन, उच्चार, व बोलण्याची शैली रेकॉर्ड करतो.

मोफत मॉडेल (कोकोरो, पाइपर, VITS, MeloTTS) खाते आवश्यक नाही आणि शून्य अक्षरे खर्च. मानक मॉडेल (2,000 अक्षरे/1K इनपुट) मध्ये बार्क, कॉसीव्हॉईस2, F5-TTS, आणि डाय समावेश आहे. प्रीमियम मॉडेल (4,000 अक्षरे/1K इनपुट) मध्ये ओपनव्हॉईस, चॅटरबॉक्स, स्टाइलTTS2, आणि टॉर्टोइस समावेश आहे. मोफत मॉडेल सामान्यतः उच्च दर्जा, अधिक आवाज, आणि आवाज क्लोनिंग सारख्या अतिरिक्त वैशिष्ट्ये प्रदान करतात.

होय. API बॅच प्रोसेसिंगला पाठ्य ते भाषण मोठ्या प्रमाणावर रूपांतरित करण्यासाठी समर्थन देते. अनेक विनंती सादर करा आणि काम UUIDs वापरून परिणाम असमांतरपणे प्राप्त करा. व्यवसाय योजना ($99/month) आणि अधिक वेगवान बॅच प्रोसेसिंगसाठी प्राधान्यता कतार प्रवेश समाविष्ट करते. ऑडिओबुक उत्पादन, कोर्स विषयवस्तु, आणि मोठ्या प्रमाणावर आवाज प्रकल्पांसाठी आदर्श.
4.1/5 (42)

आपण काय सुधारू शकतो? तुमचा प्रतिसाद आम्हाला समस्या सोडवण्यात मदत करतो.

AI आवाज वापरणे आजच सुरू करा

TTS.ai वापरून निर्माता, डेव्हलपर आणि व्यवसायांना सामील व्हा