स्वतन्त्र एआई पाठ वाचकComment

33+ खुला स्रोत नमूनाहरू, 273+ आवाजहरू, 33+ भाषाहरू । खाता आवश्यक छैन ।

18K+
सिर्जनाकर्ता
71K+
पुस्ताहरू
33+
AI नमूना
273+
आवाजहरू
0/500 क्यारेक्टर · 5,000 प्रति पुस्ता लागि साइन अप → स्वतन्त्र
TTS.ai प्रेम? आफ्नो साथीहरूलाई भन्नुहोस्!

तपाईँलाई आवाज एआईको लागि आवश्यक सबै कुरा

30+ खुला स्रोत एआई मोडेल द्वारा संचालित उपकरणहरू

33+ AI आवाज नमूना

एक प्लेटफर्ममा खुला स्रोत TTS नमूनाहरूको सबैभन्दा व्यापक संग्रह

KokoroKokoro स्वतन्त्र

कोकोरो एक 82 मिलियन मापदण्ड पाठ-देखि-भाषण मोडेल छ कि यसको वजन वर्ग माथि राम्रो संग Punches. यसको सानो आकार बावजुद, यो उल्लेखनीय प्राकृतिक र अभिव्यक्तिशील भाषण उत्पादन. कोकोरो अंग्रेजी सहित बहु भाषाहरू समर्थन, जापानी, चिनियाँ, र कोरियाली अभिव्यक्तिपूर्ण आवाज को एक किसिम संग. यो अविश्वसनीय रूपमा छिटो चल्छ - GPU मा वास्तविक समय भन्दा लगभग 100x छिटो अडियो उत्पन्न.

यसका लागि उत्तम: न्यूनतम लाटेन्सी, स्ट्रिमिङ अनुप्रयोगहरूसँग उच्च गुणस्तर TTS

नि: शुल्क प्रयास गर्नुहोस्

PiperPiper स्वतन्त्र

पाइपर एक हल्का पाठ-देखि-भाषण इन्जिन Rhasspy द्वारा विकसित छ जुन VITS र larynx वास्तुकला प्रयोग गर्दछ। यो सीपीयूमा पूर्ण रूपमा चल्छ, किनारा उपकरणहरू, घर स्वचालन र अफलाइन TTS आवश्यक अनुप्रयोगहरूको लागि आदर्श बनाउँछ। 100+ भाषाहरूमा 100+ आवाजहरूसँग, पाइपरले एक रास्पबेरी पाइ4मा पनि वास्तविक समय गतिमा प्राकृतिक-सुन्ने भाषण प्रदान गर्दछ।

यसका लागि उत्तम: छिटो पूर्वावलोकन, पहुँचता, र सम्मिलित अनुप्रयोगहरू

नि: शुल्क प्रयास गर्नुहोस्

VITSVITS स्वतन्त्र

VITS (अन्त-सम्म-अन्त पाठ-देखि-भाषण लागि adversarial सिक्ने संग भिन्नता निष्कर्ष) एक समानान्तर अन्त-सम्म-अन्त TTS विधि छ कि वर्तमान दुई-चरण मोडेल भन्दा बढी प्राकृतिक ध्वनि अडियो उत्पन्न गर्दछ। यो सामान्यीकरण प्रवाह र एक adversarial प्रशिक्षण प्रक्रिया संग बढेको भिन्नता निष्कर्ष अपनाउँछ, प्राकृतिकता मा एक महत्वपूर्ण सुधार हासिल।

यसका लागि उत्तम: प्राकृतिक शब्दसँग सामान्य- उद्देश्य पाठ-बाट-वाचन

नि: शुल्क प्रयास गर्नुहोस्

MeloTTSMeloTTS स्वतन्त्र

MyShell.ai द्वारा MeloTTS अंग्रेजी समर्थन एक बहुभाषी TTS लाइब्रेरी छ (अमेरिकी, ब्रिटिश, भारतीय, अष्ट्रेलियन), स्पेनिश, फ्रान्सेली, चिनियाँ, जापानी, र कोरियाली. यो अत्यधिक छिटो छ, सीपीयू एक्लै मा नजिकै वास्तविक-समय गति मा पाठ प्रक्रिया. MeloTTS उत्पादन प्रयोगको लागि डिजाइन गरिएको छ र सीपीयू र जीपीयू दुवै अनुमान समर्थन गर्दछ.

यसका लागि उत्तम: उत्पादन अनुप्रयोगहरू छिटो, बहुभाषिक TTS आवश्यक

नि: शुल्क प्रयास गर्नुहोस्

Kani TTS 2Kani TTS 2 स्वतन्त्र

NineNineSix द्वारा Kani-TTS-2 एक NVIDIA NanoCodec संग एक तरल AI LFM2 ब्याकबोन मा निर्मित एक अल्ट्रा-लाइटवेट 400M पैरामीटर मोडेल हो। यो केवल 3GB VRAM मा चल्छ र A100 (RTF 0.2) मा ~2सेकेन्डमा ~ 10 सेकेन्डमा भाषणको उत्पादन गर्दछ। हालको सार्वजनिक रिलीजले अंग्रेजी-मात्र `kani-tts-2-en` चेकपोइन्ट पठाउँदछ र आवाज क्लोनिङको लागि आवश्यक स्पीकर-इम्बेडिंग हुकलाई उजागर गर्दैन - क्लोनिङको लागि Chatterbox / IndexTTS2 / F5-TTS प्रयोग गर्नुहोस्, वा गैर-अंग्रेजीको लागि Kokoro / MeloTTS।

यसका लागि उत्तम: कम- VRAM हार्डवेयरमा छिटो अंग्रेजी सिर्जना, छिटो पूर्वावलोकन

नि: शुल्क प्रयास गर्नुहोस्

OuteTTSOuteTTS स्वतन्त्र

OuteTTS मूल वास्तुकला संरक्षण गर्दा पाठ-देखि-भाषण क्षमताहरू संग ठूलो भाषा मोडेल विस्तार गर्दछ। यो llama.cpp (CPU / GPU), Hugging अनुहार Transformers, ExLlamaV2, VLLM, र पनि Transformers.js मार्फत ब्राउजर inference सहित बहु backends समर्थन गर्दछ। विशेषताहरू शून्य-शट स्पीकर प्रोफाइलहरू मार्फत आवाज क्लोनिंग JSON रूपमा बचत।

यसका लागि उत्तम: किनारा वितरण, ब्राउजर आधारित TTS, कम-संसाधन वातावरण

नि: शुल्क प्रयास गर्नुहोस्

Pocket TTSPocket TTS स्वतन्त्र

Kyutai द्वारा पोके TTS (Moshi को निर्माता) एक कम्प्याक्ट 100M मापदण्ड पाठ-देखि-भाषण मोडेल छ कि यसको वजन माथि राम्रो Punches. यो सीपीयू मा कुशलतापूर्वक चल्छ, एकल अडियो नमूना देखि शून्य-शट आवाज क्लोनिंग समर्थन, र प्राकृतिक-सुन्ने भाषण उत्पादन. सानो मोडेल साइज यो किनारा तैनात र कम-संसाधन वातावरण लागि आदर्श बनाउँछ।

यसका लागि उत्तम: हल्का वितरण, सीपीयू- मात्र वातावरण, छिटो आवाज क्लोनिङ

नि: शुल्क प्रयास गर्नुहोस्

Kitten TTSKitten TTS स्वतन्त्र

KittenML द्वारा Kitten TTS एक अत्यन्त हल्का पाठ-देखि-भाषण मोडेल ONNX मा निर्माण गरिएको छ। 15M देखि 80M मापदण्ड (डिस्कमा 25-80 मेगाबाइट) देखि भिन्नता संग, यो GPU को आवश्यकता बिना सीपीयू मा उच्च गुणवत्ता आवाज संश्लेषण प्रदान गर्दछ। विशेषताहरू 8 निर्माण-मा आवाज, समायोज्य भाषण गति, र संख्याहरू, मुद्राहरू, र इकाइहरूको लागि निर्माण पाठ पूर्व-प्रक्रिया। किनारा तैनात र कम-लाटेन्सी अनुप्रयोगहरूको लागि आदर्श।

यसका लागि उत्तम: छिटो हल्का TTS, किनारा तैनाती, कम-लाटेन्सी अनुप्रयोगहरू

नि: शुल्क प्रयास गर्नुहोस्

Ming-Omni TTSMing-Omni TTS स्वतन्त्र

inclusionAI द्वारा मिङ-omni-tts-0.5B एक प्याच-by-प्याच प्रवाह-मिल्दो अडियो डिकोडर संग BailingMM घना backbone मा निर्मित एक कम्प्याक्ट Omni-modal भाषण मोडेल छ। 44.1kHz आउटपुट (सीडी गुणस्तर नजिक) प्रदान गर्दछ, एक 3+ दोस्रो सन्दर्भबाट शून्य-शट आवाज क्लोनिंग समर्थन गर्दछ, र JSON निर्देशहरू मार्फत निर्मित भावना / बोली / BGM नियन्त्रण समावेश गर्दछ। उत्कृष्ट स्थिरता - चीनी बेन्चमार्कमा 0.83% WER।

यसका लागि उत्तम: उच्च-विश्वासी द्विभाषी कथा, भावना-नियन्त्रित आवाज अभिनय, चिनियाँ अडियोबुक सामग्री

नि: शुल्क प्रयास गर्नुहोस्

MOSS-TTS NanoMOSS-TTS Nano स्वतन्त्र

MOSS-TTS-Nano-100M MOSS-TTS परिवारको OpenMOSS को कम्प्याक्ट 100M-परिमिति प्रकार्य हो, विलम्ब-ट्रान्सफर वास्तुकला साझेदारी गर्दछ। ~ 80x सानो तौल र नाटकीय रूपमा प्रति अनुरोध VRAM को लागि 8B मोडेलको उच्चतम गुणवत्ता व्यापार गर्दछ, यो निःशुल्क-तह र उच्च-थ्रूपुट तैनातिका लागि उपयुक्त बनाउँछ। उही 20-भाषा पहुँच।

यसका लागि उत्तम: निःशुल्क-तह TTS, उच्च-भोल्युम उत्पादन, कम-लाटेन्सी अन्तरक्रियात्मक प्रयोग

नि: शुल्क प्रयास गर्नुहोस्

BarkBark मानक

ट्रान्सफर-आधारित पाठ-अडियो मोडेल जसले यथार्थवादी भाषण, संगीत, र ध्वनि प्रभावहरू उत्पन्न गर्दछ।

विकासकर्ता: Suno · इजाजतपत्र: MIT

यसलाई प्रयास गर्नुहोस्

Bark SmallBark Small मानक

यसले वायुमण्डलमा कार्बन डाइअक्साइडको मात्रा कम गर्न तथा वायुमण्डलको गुणस्तर सुधार गर्न मद्दत गर्दछ।

विकासकर्ता: Suno · इजाजतपत्र: MIT

यसलाई प्रयास गर्नुहोस्

CosyVoice 2CosyVoice 2 मानक

यसको प्राकृतिक वासस्थान नेपालको तराई तथा हिमाली क्षेत्रमा पाइन्छ।

विकासकर्ता: Alibaba (Tongyi Lab) · इजाजतपत्र: Apache 2.0

यसलाई प्रयास गर्नुहोस्

Dia TTSDia TTS मानक

यसले विभिन्न प्रकारका प्राकृतिक प्रकोपहरूको सामना गर्न सक्ने क्षमता राख्दछ।

विकासकर्ता: Nari Labs · इजाजतपत्र: Apache 2.0

यसलाई प्रयास गर्नुहोस्

Parler TTSParler TTS मानक

तपाईँले प्राकृतिक भाषामा चाहनुभएको आवाज वर्णन गर्नुहोस् र Parler ले मिल्दो भाषण उत्पन्न गर्दछ ।

विकासकर्ता: Hugging Face · इजाजतपत्र: Apache 2.0

यसलाई प्रयास गर्नुहोस्

IndexTTS-2IndexTTS-2 मानक

यसले वायुमण्डलमा अक्सिजनको मात्रालाई नियन्त्रण तथा उच्च तापक्रमलाई नियन्त्रण गर्दछ।

विकासकर्ता: Index Team · इजाजतपत्र: Bilibili Model License

यसलाई प्रयास गर्नुहोस्

Spark TTSSpark TTS मानक

आवाज क्लोनिंग TTS संग नियन्त्रित भावना र प्रोम्ट्स मार्फत बोल्ने शैली.

विकासकर्ता: SparkAudio · इजाजतपत्र: CC BY-NC-SA 4.0

यसलाई प्रयास गर्नुहोस्

GPT-SoVITSGPT-SoVITS मानक

केही-छाप आवाज क्लोनिंग TTS अडियो को केवल5सेकेन्ड देखि कुनै पनि आवाज प्रतिलिपि गर्दछ।

विकासकर्ता: RVC-Boss · इजाजतपत्र: MIT

यसलाई प्रयास गर्नुहोस्

OrpheusOrpheus मानक

यसले १०० भन्दा बढी भाषाहरूमा अनुवाद गरेको छ।

विकासकर्ता: Canopy Labs · इजाजतपत्र: Llama 3.2 Community

यसलाई प्रयास गर्नुहोस्

Qwen3 TTSQwen3 TTS मानक

अलीबाबाको बहुभाषी TTS पूर्वनिर्धारित आवाज र पाठ देखि आवाज डिजाइन संग।

विकासकर्ता: Alibaba (Qwen) · इजाजतपत्र: Apache 2.0

यसलाई प्रयास गर्नुहोस्

VieNeu-TTS-v2VieNeu-TTS-v2 मानक

भिएतनाम + अंग्रेजी कोड-स्विचिंग TTS7प्रिसेट आवाज र शून्य-छाप आवाज क्लोनिंग संग। CPU-मात्र, कुनै GPU आवश्यक।

विकासकर्ता: Phạm Nguyễn Ngọc Bảo · इजाजतपत्र: Apache 2.0

यसलाई प्रयास गर्नुहोस्

Chatterbox TurboChatterbox Turbo मानक

यसको वजन लगभग 200 ग्राम हुन्छ र यसमा 100 भन्दा बढी खाद्य पदार्थहरू, जस्तै फल, तरकारी, र माछाहरू पाइन्छन्।

विकासकर्ता: Resemble AI · इजाजतपत्र: MIT

यसलाई प्रयास गर्नुहोस्

VoxCPMVoxCPM मानक

यसको क्षेत्रफल ४४.१ वर्गकिलोमिटर रहेको छ ।

विकासकर्ता: OpenBMB · इजाजतपत्र: Apache 2.0

यसलाई प्रयास गर्नुहोस्

VibeVoiceVibeVoice मानक

माइक्रोसफ्ट मोडेल लामो फारम बहु-स्पीकर सामग्री जस्तै पोडकास्टहरू र अडियो पुस्तकहरूको लागि।

विकासकर्ता: Microsoft · इजाजतपत्र: MIT

यसलाई प्रयास गर्नुहोस्

CosyVoice3CosyVoice3 मानक

यसमा बहुभाषिक TTS, भावना नियन्त्रण, र शून्य-शट आवाज क्लोनिंग समावेश छ।

विकासकर्ता: Alibaba (FunAudioLLM) · इजाजतपत्र: Apache 2.0

यसलाई प्रयास गर्नुहोस्

NAMAA Saudi TTSNAMAA Saudi TTS मानक

पहिलो खुला सऊदी अरब-अरबी TTS। Chatterbox-गुणस्तर आवाज क्लोनिंग संग मूल सऊदी बोली।

विकासकर्ता: NAMAA Space · इजाजतपत्र: MIT

यसलाई प्रयास गर्नुहोस्

Darwin TTSDarwin TTS मानक

यसमा ३.७ मेगाहर्जको माइक्रोफोन र ३.७ मेगाहर्जको माइक्रोफोनको साथमा एक माइक्रोफोनको साथमा एक माइक्रोफोनको साथमा एक माइक्रोफोनको साथमा एक माइक्रोफोनको साथमा एक माइक्रोफोन छ।

विकासकर्ता: FINAL-Bench · इजाजतपत्र: Apache 2.0

यसलाई प्रयास गर्नुहोस्

MOSS-TTSDMOSS-TTSD मानक

यसमा एक पटकमा ५ देखि १० जनासम्म सहभागी हुन सक्ने गरी कार्यक्रमको आयोजना गरिएको छ ।

विकासकर्ता: OpenMOSS · इजाजतपत्र: Apache 2.0

यसलाई प्रयास गर्नुहोस्

ChatterboxChatterbox प्रिमियम

यसले वायुमण्डलमा रहेको अक्सिजनको मात्रालाई नियन्त्रणमा राख्न मद्दत गर्दछ।

गुणस्तर:

यसलाई प्रयास गर्नुहोस्

Tortoise TTSTortoise TTS प्रिमियम

यसले बहु-भाषी शब्दकोष र बहु-भाषी शब्दकोषको विकासमा महत्वपूर्ण भूमिका खेलेको छ ।

गुणस्तर:

यसलाई प्रयास गर्नुहोस्

StyleTTS 2StyleTTS 2 प्रिमियम

मानव-स्तरको पाठ-देखि-भाषण शैली प्रसार तथा प्रतिस्पर्धात्मक प्रशिक्षण मार्फत।

गुणस्तर:

यसलाई प्रयास गर्नुहोस्

OpenVoiceOpenVoice प्रिमियम

शैली, भावना, र उच्चारण भन्दा ग्रेनलर नियन्त्रण संग तत्काल आवाज क्लोनिंग।

गुणस्तर:

यसलाई प्रयास गर्नुहोस्

Sesame CSMSesame CSM प्रिमियम

यसले प्राकृतिक तथा सामाजिक जीवनमा सकारात्मक प्रभाव पार्ने गर्दछ ।

गुणस्तर:

यसलाई प्रयास गर्नुहोस्

CosyVoice 2CosyVoice 2

यसको प्राकृतिक वासस्थान नेपालको तराई तथा हिमाली क्षेत्रमा पाइन्छ।

भाषा: en, zh, ja, ko, fr, de, it, es

आवाज क्लोन गर्नुहोस्

IndexTTS-2IndexTTS-2

यसले वायुमण्डलमा अक्सिजनको मात्रालाई नियन्त्रण तथा उच्च तापक्रमलाई नियन्त्रण गर्दछ।

भाषा: en, zh

आवाज क्लोन गर्नुहोस्

Spark TTSSpark TTS

आवाज क्लोनिंग TTS संग नियन्त्रित भावना र प्रोम्ट्स मार्फत बोल्ने शैली.

भाषा: en, zh

आवाज क्लोन गर्नुहोस्

GPT-SoVITSGPT-SoVITS

केही-छाप आवाज क्लोनिंग TTS अडियो को केवल5सेकेन्ड देखि कुनै पनि आवाज प्रतिलिपि गर्दछ।

भाषा: en, zh, ja, ko

आवाज क्लोन गर्नुहोस्

ChatterboxChatterbox

यसले वायुमण्डलमा रहेको अक्सिजनको मात्रालाई नियन्त्रणमा राख्न मद्दत गर्दछ।

भाषा: en

आवाज क्लोन गर्नुहोस्

Tortoise TTSTortoise TTS

यसले बहु-भाषी शब्दकोष र बहु-भाषी शब्दकोषको विकासमा महत्वपूर्ण भूमिका खेलेको छ ।

भाषा: en

आवाज क्लोन गर्नुहोस्

OpenVoiceOpenVoice

शैली, भावना, र उच्चारण भन्दा ग्रेनलर नियन्त्रण संग तत्काल आवाज क्लोनिंग।

भाषा: en, zh, ja, ko, fr, es

आवाज क्लोन गर्नुहोस्

VieNeu-TTS-v2VieNeu-TTS-v2

भिएतनाम + अंग्रेजी कोड-स्विचिंग TTS7प्रिसेट आवाज र शून्य-छाप आवाज क्लोनिंग संग। CPU-मात्र, कुनै GPU आवश्यक।

भाषा: vi, en

आवाज क्लोन गर्नुहोस्

Chatterbox TurboChatterbox Turbo

यसको वजन लगभग 200 ग्राम हुन्छ र यसमा 100 भन्दा बढी खाद्य पदार्थहरू, जस्तै फल, तरकारी, र माछाहरू पाइन्छन्।

भाषा: en

आवाज क्लोन गर्नुहोस्

VoxCPMVoxCPM

यसको क्षेत्रफल ४४.१ वर्गकिलोमिटर रहेको छ ।

भाषा: en, zh

आवाज क्लोन गर्नुहोस्

OuteTTSOuteTTS

यो पत्रिकाको प्रकाशक नेपाल पत्रकार महासंघ, नेपाल हो।

भाषा: en

आवाज क्लोन गर्नुहोस्

Pocket TTSPocket TTS

Lightweight 100M parameter model by Kyutai with voice cloning from a single sample.

भाषा: en, fr

आवाज क्लोन गर्नुहोस्

CosyVoice3CosyVoice3

यसमा बहुभाषिक TTS, भावना नियन्त्रण, र शून्य-शट आवाज क्लोनिंग समावेश छ।

भाषा: en, zh, ja, ko, de, es, fr, it, ru

आवाज क्लोन गर्नुहोस्

NAMAA Saudi TTSNAMAA Saudi TTS

पहिलो खुला सऊदी अरब-अरबी TTS। Chatterbox-गुणस्तर आवाज क्लोनिंग संग मूल सऊदी बोली।

भाषा: ar

आवाज क्लोन गर्नुहोस्

Darwin TTSDarwin TTS

यसमा ३.७ मेगाहर्जको माइक्रोफोन र ३.७ मेगाहर्जको माइक्रोफोनको साथमा एक माइक्रोफोनको साथमा एक माइक्रोफोनको साथमा एक माइक्रोफोनको साथमा एक माइक्रोफोनको साथमा एक माइक्रोफोन छ।

भाषा: en, ko, ja, zh

आवाज क्लोन गर्नुहोस्

MOSS-TTSDMOSS-TTSD

यसमा एक पटकमा ५ देखि १० जनासम्म सहभागी हुन सक्ने गरी कार्यक्रमको आयोजना गरिएको छ ।

भाषा: en, zh

आवाज क्लोन गर्नुहोस्

Ming-Omni TTSMing-Omni TTS

यसको क्षेत्रफल ५४.४१ वर्ग किलोमिटर छ भने जनसङ्ख्या ४४,४४१ रहेको छ ।

भाषा: en, zh

आवाज क्लोन गर्नुहोस्

MOSS-TTS NanoMOSS-TTS Nano

यसको क्षेत्रफल ८० वर्ग किलोमिटर (३८ वर्ग माइल) रहेको छ ।

भाषा: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

आवाज क्लोन गर्नुहोस्

विकासकर्ता-पहिलो API

OpenAI-संगत REST API। एक अन्त बिन्दु, 22+ मोडेल। वास्तविक समय अनुप्रयोगहरूको लागि स्ट्रिमिङ समर्थन।

  • खुला AI-संगत ढाँचा
  • वास्तविक-समय अनुप्रयोगहरूका लागि स्ट्रिमिङ TTS
  • ठूला कामका लागि ब्याच प्रक्रिया
  • वेबहुक सूचना
एपीआई मिसिलीकरण हेर्नुहोस्
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

सरल, पारदर्शी मूल्य

निःशुल्क सुरु गर्नुहोस् । तपाईँ बढ्दै जाँदा मापन गर्नुहोस् ।

स्वतन्त्र

$0

१५,००० क्यारेक्टर + ५,०००/दिन

  • 7 Kokoro सहित निःशुल्क मोडेल
  • प्रति पुस्ता ५,००० क्यारेक्टर
  • API पहुँच समावेश गरिएको छ
निःशुल्क दर्ता गर्नुहोस्

सुरुआतकर्ता

$9/मिनेट

500 क्रेडिट / महिना

  • सबै २२+ नमूनाहरू
  • प्रति पुस्ता १००,००० क्यारेक्टर
  • आवाज क्लोनिङ
सुरु गर्नुहोस्
सबैभन्दा लोकप्रिय

प्रो

$29/मिनेट

2,000 क्रेडिट / महिना

  • सुरुआतकर्तामा सबै कुरा
  • API पहुँच
  • प्राथमिकता प्रक्रिया
प्रो प्राप्त गर्नुहोस्

व्यवसाय

$99/मिनेट

10,000 क्रेडिट / महिना

  • प्रो मा सबै कुरा
  • ठूलो API
  • प्राथमिकता लाम
व्यापार प्राप्त गर्नुहोस्

क्रेडिट प्याक सहित सबै योजनाहरू हेर्नुहोस् →

प्राय सोधिने प्रश्नहरू

TTS.ai सबैभन्दा व्यापक AI आवाज प्लेटफर्म हो, 22 + पाठ-देखि-भाषण मोडेल, आवाज क्लोनिंग, भाषण-देखि-पाठ, र अडियो उपकरणहरू प्रस्ताव। सबै मोडेलहरू कुनै विक्रेता लक-इन संग खुला स्रोत छन्।

हो! TTS.ai कोकोरो संग निःशुल्क पाठ-देखि-भाषण प्रस्ताव, पाइपर, VITS, र MeloTTS मोडेल. कुनै खाता आवश्यक. पाउन साइन अप 15 नि: शुल्क क्रेडिट र सबै मोडेल पहुँच. भुक्तानी योजना $9/महिना मा सुरु.

गतिका लागि, कोकोरो वा पाइपर प्रयोग गर्नुहोस् । गुणस्तरका लागि, कोसीभोइस २ वा स्टाइलटीटीएस २ प्रयोग गर्नुहोस् । आवाज क्लोनिङका लागि, च्याटरबक्स वा जीपीटी- सोभिट्स प्रयोग गर्नुहोस् । संवादका लागि, डाय टीटीएस प्रयोग गर्नुहोस् । तुलना गर्न एउटै पाठमा बहुविध नमूना प्रयोग गर्नुहोस् ।

हो। TTS, STT, आवाज क्लोनिंग, र अडियो उपकरणहरूको लागि OpenAI-सुसंगत REST API। प्रत्येक योजनामा समावेश गरिएको, नि: शुल्क सहित, तह द्वारा मापन गरिएको दर सीमाहरूसँग (नि: शुल्क: 10 req / मिनेट, लाईट: 20, स्टार्टर: 30, प्रो: 60, व्यापार: 300)। tts.ai/api/ मा मिसिलिकरण हेर्नुहोस्।

आवाज गुणस्तर मोडेल द्वारा भिन्न हुन्छ। CosyVoice2जस्तै प्रिमियम मोडेल, StyleTTS2र Chatterbox प्राकृतिक intonation र भावना संग निकट-मानव गुणस्तर भाषण उत्पादन। Kokoro जस्तै निःशुल्क मोडेल अधिकांश प्रयोगका लागि उत्कृष्ट गुणस्तर प्रस्ताव।

TTS.ai यसको मोडेल पुस्तकालय मार्फत 30+ भाषाहरू समर्थन गर्दछ। अंग्रेजी सबैभन्दा व्यापक मोडेल समर्थन छ, तर CosyVoice2जस्तै मोडेल चीनी, जापानी, र कोरियाली कभर; GPT-SoVITS चीनी, जापानी, कोरियाली, र अंग्रेजी ह्यान्डलहरू; र MeloTTS अंग्रेजी, स्पेनिश, फ्रान्सेली, चीनी, जापानी, र कोरियाली समर्थन गर्दछ।

हो. सबै प्रक्रिया हाम्रो समर्पित GPU सर्भरमा हुन्छ. हामी आफ्नो पाठ आगत वा वितरण पछि उत्पन्न अडियो भण्डारण गर्दैनौं. क्लोनिङका लागि अपलोड गरिएको आवाज नमूनाहरू हालको सत्रका लागि मात्र प्रयोग गरिन्छ र राखिएको छैन. हामी तेस्रो पक्षसँग आफ्नो डेटा साझेदारी गर्दैनौं वा नमूनाहरू ट्रेन गर्न यसलाई प्रयोग गर्दछौं।

हो। TTS.ai मा उत्पन्न सबै अडियो व्यावसायिक रूपमा प्रयोग गर्न तपाईंको हो, यूट्यूब भिडियोहरू, पोडकास्टहरू, अडियोबुकहरू, अनुप्रयोगहरू, विज्ञापनहरू र उत्पादनहरू सहित। हाम्रो मोडेलहरू अनुमति दिने लाइसेन्सहरू अन्तर्गत खुला स्रोत हुन् (एमआईटी, अपाचे 2.0)। कुनै रॉयल्टी वा श्रेय आवश्यक छैन।

TTS.ai अधिकतम गुणस्तर लागि पूर्वनिर्धारित द्वारा WAV ढाँचामा अडियो उत्पन्न गर्दछ। तपाईं MP3, FLAC, OGG, वा M4A हाम्रो नि: शुल्क अडियो Converter उपकरण प्रयोग गरेर रूपान्तरण गर्न सक्नुहुन्छ। यो API अनुरोधमा आफ्नो रुचिको निर्गत ढाँचा सीधा निर्दिष्ट समर्थन गर्दछ।

तपाईँले क्लोन गर्न चाहेको आवाजको छोटो अडियो नमूना (५ सेकेन्ड जति सानो) अपलोड गर्नुहोस्, त्यसपछि त्यो आवाजमा भाषण उत्पन्न गर्न कुनै पनि पाठ टाइप गर्नुहोस् । च्याटरबक्स, GPT-SoVITS, र कोसीभाइज २ जस्ता नमूनाहरूले आवाज क्लोनिङलाई समर्थन गर्दछन् । क्लोन गरिएको आवाजले टोन, अभिव्यक्ति, र बोल्ने शैली समात्दछ ।

निःशुल्क मोडेल (Kokoro, Piper, VITS, MeloTTS) कुनै खाता आवश्यक र लागत शून्य क्रेडिट. मानक मोडेल (2 क्रेडिट / 1K क्यारेक्टर) समावेश Bark, CosyVoice2, F5-TTS, र Dia. प्रिमियम मोडेल (4 क्रेडिट / 1K क्यारेक्टर) समावेश OpenVoice, Chatterbox, StyleTTS2, र Tortoise. भुक्तानी मोडेल सामान्यतया उच्च गुणस्तर प्रस्ताव, थप आवाज, र आवाज क्लोनिङ जस्तै अतिरिक्त सुविधाहरू.

हो. एपीआई भाषण पाठ ठूलो मात्रा रूपान्तरण लागि ब्याच प्रक्रिया समर्थन. बहु अनुरोध पेश र काम UUIDs प्रयोग परिणाम असीमित रूपमा पुन: प्राप्त. व्यापार योजना ($99 / mo) र उच्च छिटो ब्याच प्रक्रिया लागि प्राथमिकता कतार पहुँच समावेश. अडियोबुक उत्पादन लागि आदर्श, पाठ्यक्रम सामग्री, र ठूलो-स्केल आवाज परियोजनाहरू.
4.1/5 (42)

हामी के सुधार गर्न सक्छन्? आफ्नो प्रतिक्रिया हामीलाई समस्या समाधान गर्न मद्दत गर्दछ.

आज AI आवाज प्रयोग गर्न सुरु गर्नुहोस्

TTS.ai प्रयोग गरेर निर्माता, विकासकर्ता र व्यवसायहरूमा सामेल हुनुहोस्