स्वतन्त्र एआई पाठ वाचकComment

20+ खुला स्रोत नमूनाहरू, 107+ आवाजहरू, 32+ भाषाहरू । खाता आवश्यक छैन ।

1K+
सिर्जनाकर्ता
2K+
पुस्ताहरू
20+
AI नमूना
107+
आवाजहरू
0/500 क्यारेक्टर स्वतन्त्र
5,000 chars per generation 15,000 free characters क्रेडिट कार्ड छैन व्यावसायिक प्रयोग ठीक छ
Sign up free
0:00 / 0:00
अडियो डाउनलोड गर्नुहोस् लिङ्क २४ घण्टामा समाप्त हुन्छ
TTS.ai जस्तै? आफ्नो साथीहरूलाई भन्नुहोस्!

तपाईँलाई आवाज एआईको लागि आवश्यक सबै कुरा

30+ खुला स्रोत एआई मोडेल द्वारा संचालित उपकरणहरू

20+ AI आवाज नमूना

एक प्लेटफर्ममा खुला स्रोत TTS नमूनाहरूको सबैभन्दा व्यापक संग्रह

KokoroKokoro Free

कोकोरो एक 82 मिलियन मापदण्ड पाठ-देखि-भाषण मोडेल छ जुन यसको वजन वर्ग माथि राम्रोसँग प्रहार गर्दछ। यसको सानो आकारको बावजुद, यो उल्लेखनीय रूपमा प्राकृतिक र अभिव्यक्तिशील भाषण उत्पादन गर्दछ। कोकोरोले अंग्रेजी, जापानी, चिनियाँ, र कोरियाली सहित विभिन्न भाषाहरू समर्थन गर्दछ। यो अविश्वसनीय रूपमा छिटो चल्छ - जीपीयूमा वास्तविक समय भन्दा लगभग 100x छिटो अडियो उत्पन्न गर्दछ।

यसका लागि उत्तम: न्यूनतम लेटेन्सीको साथ उच्च गुणस्तर TTS, स्ट्रिमिङ अनुप्रयोगहरू

निःशुल्क प्रयास गर्नुहोस्

PiperPiper Free

पाइपर एक हल्का पाठ-देखि-भाषण इन्जिन Rhasspy द्वारा विकसित छ जुन VITS र larynx वास्तुकला प्रयोग गर्दछ। यो सीपीयूमा पूर्ण रूपमा चल्छ, किनारा उपकरणहरू, घर स्वचालन र अफलाइन TTS आवश्यक अनुप्रयोगहरूको लागि आदर्श बनाउँछ। 100+ भाषाहरूमा 100+ आवाजहरूसँग, पाइपरले एक रास्पबेरी पाइ4मा पनि वास्तविक समय गतिमा प्राकृतिक-सुन्ने भाषण प्रदान गर्दछ।

यसका लागि उत्तम: छिटो पूर्वावलोकन, पहुँचता, र सम्मिलित अनुप्रयोगहरू

निःशुल्क प्रयास गर्नुहोस्

VITSVITS Free

VITS (अन्त्य-सम्म-अन्त पाठ-देखि-भाषण लागि adversarial सिक्ने संग भिन्नता निष्कर्ष) एक समानान्तर अन्त-सम्म-अन्त्य TTS विधि छ जुन वर्तमान दुई-चरण मोडेल भन्दा बढी प्राकृतिक ध्वनि अडियो उत्पन्न गर्दछ। यो सामान्यीकरण प्रवाह र एक adversarial प्रशिक्षण प्रक्रिया संग बढेको भिन्नता निष्कर्ष अपनाउँछ, प्राकृतिकता मा एक महत्वपूर्ण सुधार हासिल।

यसका लागि उत्तम: सामान्य- उद्देश्य पाठ-बाट-वाचनमा प्राकृतिक शब्दावलीसँगName

निःशुल्क प्रयास गर्नुहोस्

MeloTTSMeloTTS Free

MyShell.ai द्वारा MeloTTS एक बहुभाषी TTS लाइब्रेरी अंग्रेजी समर्थन (अमेरिकी, ब्रिटिश, भारतीय, अष्ट्रेलियन), स्पेनिश, फ्रान्सेली, चिनियाँ, जापानी, र कोरियाली छ। यो अत्यधिक छिटो छ, सीपीयू एक्लै मा नजिकै वास्तविक-समय गतिमा पाठ प्रक्रिया। MeloTTS उत्पादन प्रयोगको लागि डिजाइन गरिएको छ र सीपीयू र जीपीयू दुवै अनुमान समर्थन गर्दछ।

यसका लागि उत्तम: उत्पादन अनुप्रयोगहरू छिटो, बहुभाषिक TTS आवश्यक

निःशुल्क प्रयास गर्नुहोस्

BarkBark Standard

ट्रान्सफर-आधारित पाठ-अडियो मोडेल जसले यथार्थवादी भाषण, संगीत, र ध्वनि प्रभावहरू उत्पन्न गर्दछ।

विकासकर्ता: Suno · इजाजतपत्र MIT

यसलाई प्रयास गर्नुहोस्

Bark SmallBark Small Standard

यसले वायुमण्डलमा कार्बन डाइअक्साइडको मात्रा कम गर्न तथा वायुमण्डलको गुणस्तर सुधार गर्न मद्दत गर्दछ।

विकासकर्ता: Suno · इजाजतपत्र MIT

यसलाई प्रयास गर्नुहोस्

CosyVoice 2CosyVoice 2 Standard

यसले मानव-समानता प्राकृतिकता र निकट-शून्य latency संग Alibaba को scalable streaming TTS प्रदान गर्दछ।

विकासकर्ता: Alibaba (Tongyi Lab) · इजाजतपत्र Apache 2.0

यसलाई प्रयास गर्नुहोस्

Dia TTSDia TTS Standard

बहु-स्पीकर संवाद उत्पादन मोडेल जो स्पीकर बीच प्राकृतिक कुराकानी सिर्जना गर्दछ।

विकासकर्ता: Nari Labs · इजाजतपत्र Apache 2.0

यसलाई प्रयास गर्नुहोस्

Parler TTSParler TTS Standard

तपाईँले प्राकृतिक भाषामा चाहनुभएको आवाज वर्णन गर्नुहोस् र Parler ले मिल्दो भाषण उत्पन्न गर्दछ ।

विकासकर्ता: Hugging Face · इजाजतपत्र Apache 2.0

यसलाई प्रयास गर्नुहोस्

GLM-TTSGLM-TTS Standard

खुला स्रोत TTS मोडेलहरू बीच कम क्यारेक्टर त्रुटि दर प्राप्त गर्दछ।

विकासकर्ता: Zhipu AI · इजाजतपत्र GLM-4 License

यसलाई प्रयास गर्नुहोस्

IndexTTS-2IndexTTS-2 Standard

यसले वायुमण्डलमा अक्सिजनको मात्रालाई नियन्त्रण तथा उच्च तापक्रमलाई नियन्त्रण गर्दछ।

विकासकर्ता: Index Team · इजाजतपत्र Bilibili Model License

यसलाई प्रयास गर्नुहोस्

Spark TTSSpark TTS Standard

आवाज क्लोनिंग TTS संग नियन्त्रित भावना र प्रोम्ट्स मार्फत बोल्ने शैली.

विकासकर्ता: SparkAudio · इजाजतपत्र CC BY-NC-SA 4.0

यसलाई प्रयास गर्नुहोस्

GPT-SoVITSGPT-SoVITS Standard

केही-छाप आवाज क्लोनिंग TTS अडियो को केवल5सेकेन्ड देखि कुनै पनि आवाज प्रतिलिपि गर्दछ।

विकासकर्ता: RVC-Boss · इजाजतपत्र MIT

यसलाई प्रयास गर्नुहोस्

OrpheusOrpheus Standard

यसले १०० भन्दा बढी भाषाहरूमा अनुवाद गरेको छ।

विकासकर्ता: Canopy Labs · इजाजतपत्र Llama 3.2 Community

यसलाई प्रयास गर्नुहोस्

Qwen3 TTSQwen3 TTS Standard

अलीबाबाको बहुभाषी TTS आवाज क्लोनिंग, पूर्वनिर्धारित आवाज, र पाठबाट आवाज डिजाइन संग।

विकासकर्ता: Alibaba (Qwen) · इजाजतपत्र Apache 2.0

यसलाई प्रयास गर्नुहोस्

ChatterboxChatterbox Premium

यसले वायुमण्डलमा रहेको अक्सिजनको मात्रालाई नियन्त्रणमा राख्न मद्दत गर्दछ।

गुणस्तर:

यसलाई प्रयास गर्नुहोस्

Tortoise TTSTortoise TTS Premium

यसले बहु-भाषी शब्दकोष र बहु-भाषी शब्दकोषको विकासमा महत्वपूर्ण भूमिका खेलेको छ ।

गुणस्तर:

यसलाई प्रयास गर्नुहोस्

StyleTTS 2StyleTTS 2 Premium

मानव-स्तरको पाठ-देखि-भाषण शैली प्रसार तथा प्रतिस्पर्धात्मक प्रशिक्षण मार्फत।

गुणस्तर:

यसलाई प्रयास गर्नुहोस्

OpenVoiceOpenVoice Premium

शैली, भावना, र अभिव्यक्ति माथि ग्रेनल नियन्त्रण संग तत्काल आवाज क्लोनिंग।

गुणस्तर:

यसलाई प्रयास गर्नुहोस्

Sesame CSMSesame CSM Premium

यसले प्राकृतिक तथा सामाजिक जीवनमा सकारात्मक प्रभाव पार्ने गर्दछ ।

गुणस्तर:

यसलाई प्रयास गर्नुहोस्

CosyVoice 2CosyVoice 2

यसले मानव-समानता प्राकृतिकता र निकट-शून्य latency संग Alibaba को scalable streaming TTS प्रदान गर्दछ।

भाषा: en, zh, ja, ko, fr, de, it, es

आवाज क्लोन गर्नुहोस्

GLM-TTSGLM-TTS

खुला स्रोत TTS मोडेलहरू बीच कम क्यारेक्टर त्रुटि दर प्राप्त गर्दछ।

भाषा: en, zh

आवाज क्लोन गर्नुहोस्

IndexTTS-2IndexTTS-2

यसले वायुमण्डलमा अक्सिजनको मात्रालाई नियन्त्रण तथा उच्च तापक्रमलाई नियन्त्रण गर्दछ।

भाषा: en, zh

आवाज क्लोन गर्नुहोस्

Spark TTSSpark TTS

आवाज क्लोनिंग TTS संग नियन्त्रित भावना र प्रोम्ट्स मार्फत बोल्ने शैली.

भाषा: en, zh

आवाज क्लोन गर्नुहोस्

GPT-SoVITSGPT-SoVITS

केही-छाप आवाज क्लोनिंग TTS अडियो को केवल5सेकेन्ड देखि कुनै पनि आवाज प्रतिलिपि गर्दछ।

भाषा: en, zh, ja, ko

आवाज क्लोन गर्नुहोस्

ChatterboxChatterbox

यसले वायुमण्डलमा रहेको अक्सिजनको मात्रालाई नियन्त्रणमा राख्न मद्दत गर्दछ।

भाषा: en

आवाज क्लोन गर्नुहोस्

Tortoise TTSTortoise TTS

यसले बहु-भाषी शब्दकोष र बहु-भाषी शब्दकोषको विकासमा महत्वपूर्ण भूमिका खेलेको छ ।

भाषा: en

आवाज क्लोन गर्नुहोस्

OpenVoiceOpenVoice

शैली, भावना, र अभिव्यक्ति माथि ग्रेनल नियन्त्रण संग तत्काल आवाज क्लोनिंग।

भाषा: en, zh, ja, ko, fr, de, es, it

आवाज क्लोन गर्नुहोस्

Qwen3 TTSQwen3 TTS

अलीबाबाको बहुभाषी TTS आवाज क्लोनिंग, पूर्वनिर्धारित आवाज, र पाठबाट आवाज डिजाइन संग।

भाषा: en, zh, ja, ko, de, fr, ru, pt, es, it

आवाज क्लोन गर्नुहोस्

विकासकर्ता पहिलो API

OpenAI-संगत REST API। एक अन्त बिन्दु, 22+ मोडेल। वास्तविक समय अनुप्रयोगहरूको लागि स्ट्रिमिङ समर्थन।

  • खुला AI-संगत ढाँचा
  • वास्तविक-समय अनुप्रयोगहरूका लागि स्ट्रिमिङ TTS
  • ठूला कामका लागि ब्याच प्रक्रिया
  • वेबहुक सूचना
एपीआई मिसिलीकरण हेर्नुहोस्
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

सरल, पारदर्शी मूल्य

निःशुल्क सुरु गर्नुहोस् । तपाईँ बढ्दै जाँदा मापन गर्नुहोस् ।

स्वतन्त्र

$0

५० क्रेडिट

  • Kokoro, Piper, VITS, MeloTTS
  • ५०० क्यारेक्टर सीमा
  • ३ जन/घण्टा (खाता छैन)
निःशुल्क दर्ता गर्नुहोस्

सुरुआतकर्ता

$9/मिनेट

500 क्रेडिट / महिना

  • सबै २२+ नमूनाहरू
  • 100,000 chars per generation
  • आवाज क्लोनिङ
सुरु गर्नुहोस्
सबैभन्दा लोकप्रिय

प्रो

$29/मिनेट

2,000 क्रेडिट / महिना

  • सुरुआतकर्तामा सबै कुरा
  • API पहुँच
  • प्राथमिकता प्रक्रिया
प्रो प्राप्त गर्नुहोस्

व्यवसाय

$99/मिनेट

10,000 क्रेडिट / महिना

  • प्रो मा सबै कुरा
  • ठूलो API
  • प्राथमिकता लाम
व्यापार प्राप्त गर्नुहोस्

क्रेडिट प्याक सहित सबै योजनाहरू हेर्नुहोस् →

प्राय सोधिने प्रश्नहरू

TTS.ai सबैभन्दा व्यापक एआई आवाज प्लेटफर्म हो, 22+ पाठ-देखि-भाषण मोडेल, आवाज क्लोनिंग, भाषण-देखि-पाठ, र अडियो उपकरण प्रस्ताव। सबै मोडेल कुनै विक्रेता लक-इन संग खुला स्रोत छन्।

हो! TTS.ai कोकोरो संग निःशुल्क पाठ-देखि-भाषण प्रस्ताव, पाइपर, VITS, र MeloTTS मोडेल. कुनै खाता आवश्यक. पाउन साइन अप 15 नि: शुल्क क्रेडिट र सबै मोडेल पहुँच. भुक्तानी योजना $9/महिना मा सुरु.

गतिका लागि, कोकोरो वा पाइपर प्रयोग गर्नुहोस् । गुणस्तरका लागि, कोसीभोइस २ वा स्टाइलटीटीएस २ प्रयोग गर्नुहोस् । आवाज क्लोनिङका लागि, च्याटरबक्स वा जीपीटी- सोभिट्स प्रयोग गर्नुहोस् । संवादका लागि, डाय टीटीएस प्रयोग गर्नुहोस् । तुलना गर्न एउटै पाठमा बहुविध नमूना प्रयोग गर्नुहोस् ।

हो। TTS, STT, आवाज क्लोनिंग, र अडियो उपकरणहरूको लागि OpenAI-सुसंगत REST API। प्रो ($29/mo) र उद्यम ($99/mo) योजनाहरूमा उपलब्ध। tts.ai/api / मा कागजात हेर्नुहोस्।

आवाज गुणस्तर मोडेल द्वारा भिन्न हुन्छ। CosyVoice2जस्तै प्रिमियम मोडेल, StyleTTS2र Chatterbox प्राकृतिक intonation र भावना संग निकट-मानव गुणस्तर भाषण उत्पादन। Kokoro जस्तै निःशुल्क मोडेल अधिकांश प्रयोगका लागि उत्कृष्ट गुणस्तर प्रस्ताव।

TTS.ai यसको मोडेल लाइब्रेरी मार्फत 30+ भाषाहरू समर्थन गर्दछ। अंग्रेजी सबैभन्दा व्यापक मोडेल समर्थन छ, तर CosyVoice2जस्तै मोडेल चीनी, जापानी, र कोरियाली कभर; GPT-SoVITS चीनी, जापानी, कोरियाली, र अंग्रेजी ह्यान्डलहरू; र MeloTTS अंग्रेजी, स्पेनिश, फ्रान्सेली, चीनी, जापानी, र कोरियाली समर्थन गर्दछ।

हो. सबै प्रक्रिया हाम्रो समर्पित GPU सर्भरमा हुन्छ. हामी आफ्नो पाठ आगत वा वितरण पछि उत्पन्न अडियो भण्डारण गर्दैनौं. क्लोनिङका लागि अपलोड गरिएको आवाज नमूनाहरू हालको सत्रका लागि मात्र प्रयोग गरिन्छ र राखिएको छैन. हामी तेस्रो पक्षसँग आफ्नो डेटा साझेदारी गर्दैनौं वा नमूनाहरू ट्रेन गर्न यसलाई प्रयोग गर्दछौं।

हो। TTS.ai मा उत्पन्न सबै अडियो व्यावसायिक रूपमा प्रयोग गर्न तपाईंको हो, यूट्यूब भिडियोहरू, पोडकास्टहरू, अडियोबुकहरू, अनुप्रयोगहरू, विज्ञापनहरू र उत्पादनहरू सहित। हाम्रो मोडेलहरू अनुमति दिने लाइसेन्सहरू अन्तर्गत खुला स्रोत हुन् (एमआईटी, अपाचे 2.0)। कुनै रॉयल्टी वा श्रेय आवश्यक छैन।

TTS.ai अधिकतम गुणस्तर लागि पूर्वनिर्धारित द्वारा WAV ढाँचामा अडियो उत्पन्न गर्दछ। तपाईं MP3 गर्न रूपान्तरण गर्न सक्नुहुन्छ, FLAC, OGG, वा M4A हाम्रो नि: शुल्क अडियो Converter उपकरण प्रयोग। एपीआई अनुरोधमा सीधा आफ्नो मनपर्ने निर्गत ढाँचा निर्दिष्ट समर्थन गर्दछ।

तपाईँले क्लोन गर्न चाहेको आवाजको छोटो अडियो नमूना (५ सेकेन्ड जति सानो) अपलोड गर्नुहोस्, त्यसपछि त्यो आवाजमा भाषण उत्पन्न गर्न कुनै पनि पाठ टाइप गर्नुहोस् । च्याटरबक्स, GPT-SoVITS, र कोसीभाइज २ जस्ता नमूनाहरूले आवाज क्लोनिङलाई समर्थन गर्दछन् । क्लोन गरिएको आवाजले टोन, अभिव्यक्ति, र बोल्ने शैली समात्दछ ।

निःशुल्क मोडेल (Kokoro, Piper, VITS, MeloTTS) कुनै खाता आवश्यक र लागत शून्य क्रेडिट. मानक मोडेल (2 क्रेडिट / 1K क्यारेक्टर) समावेश Bark, CosyVoice2, F5-TTS, र Dia. प्रिमियम मोडेल (4 क्रेडिट / 1K क्यारेक्टर) समावेश OpenVoice, Chatterbox, StyleTTS2, र Tortoise. भुक्तानी मोडेल सामान्यतया उच्च गुणस्तर प्रस्ताव, थप आवाज, र आवाज क्लोनिङ जस्तै अतिरिक्त सुविधाहरू.

हो. एपीआई भाषण पाठ को ठूलो मात्रा रूपान्तरण लागि ब्याच प्रक्रिया समर्थन. बहु अनुरोध पेश र काम UUIDs प्रयोग परिणाम असीमित रूपमा पुन: प्राप्ति. उद्यम योजना ($ 99 / mo) छिटो ब्याच प्रक्रिया लागि प्राथमिकता कतार पहुँच समावेश. अडियोबुक उत्पादन लागि आदर्श, पाठ्यक्रम सामग्री, र ठूलो-स्केल आवाज परियोजनाहरू.
4.0/5 (8)

आज AI आवाज प्रयोग गर्न सुरु गर्नुहोस्

TTS.ai प्रयोग गरेर निर्माता, विकासकर्ता र व्यवसायहरूमा सामेल हुनुहोस्