නිදහස් AI පෙළ සිට කථාවName
31+ විවෘත මූලාශ්රය ආකෘති, 231+ හඬවල්, 34+ භාෂා. ගිණුමක් අවශ්ය නැත.
හඬ AI සඳහා ඔබට අවශ්ය සියලු
30+ විවෘත මූලාශ්රය AI ආකෘති මගින් බලගැන්වෙන මෙවලම්
31+ AI හඬ ආකෘති
එක් වේදිකාවක් තුළ විවෘත මූලාශ්රය TTS ආකෘති වඩාත් පුළුල් එකතුව
Kokoro Free
Kokoro යනු එහි බර පන්තියට වඩා හොඳින් පීඩනය කරන 82 මිලියන පරාමිතික පෙළ-කථා ආකෘතියකි. එහි කුඩා ප් රමාණයට පටහැනිව, එය විශිෂ්ට ස්වාභාවික හා ප් රකාශාත්මක කථාව නිපදවයි. Kokoro ඉංග් රීසි, ජපන්, චීන, සහ කොරියානු ඇතුළු විවිධ භාෂා සඳහා සහාය දක්වයි. එය අතිශයින් වේගවත්ව ක් රියාත්මක වේ - GPU මත සැබෑ කාලයට වඩා 100x වේගයෙන් ශ් රව් ය ජනනය කරයි.
සඳහා හොඳම: අවම ප්රමාදයක් සහිත උසස් තත්ත්වයේ TTS, ප්රවාහ යෙදුම්
නිදහස් උත්සාහ කරන්න
Piper Free
Piper යනු VITS සහ larynx ගෘහ නිර්මාණ ශිල්ප භාවිතා කරන Rhasspy විසින් සංවර්ධනය කරන ලද සැහැල්ලු පෙළ-කථා එන්ජිමකි. එය සම්පූර්ණයෙන්ම CPU මත ධාවනය වන අතර, එය අගල් උපාංග, ගෘහ ස්වයංක් රීයකරණ සහ ඔෆ්ලයින් TTS අවශ් ය වන යෙදුම් සඳහා පරිපූර්ණ කරයි. 30+ භාෂා හරහා 100 හඬවල් කට වඩා වැඩි, Piper රාස්ප්බෙරි පයි මත පවා තත්පරයට ස්වභාවික හඬක් ඇති කථාව ලබා දෙයි4.
සඳහා හොඳම: ඉක්මන් පූර්වදසුන, පිවිසුම් හැකියාව, සහ තිළැලි යෙදුම්Name
නිදහස් උත්සාහ කරන්න
VITS Free
VITS (අවසන්-අවසන් පෙළ-කථාව සඳහා විරුද්ධාභාස ඉගෙනීම සමග විචලනය උපකල්පනය) වත්මන් අදියර දෙකක් ආකෘති වඩා ස්වභාවික ශබ්ද ශ්රව්ය ජනනය කරන සමාන්තර අවසන්-අවසන් TTS ක්රමයකි. එය ස්වභාවිකත්වය සැලකිය යුතු දියුණුවක් ලබා ගැනීම සඳහා, සාමාන්යකරණය ප්රවාහයන් හා විරුද්ධාභාස පුහුණු ක්රියාවලිය සමග වැඩි දියුණු කරන ලද විචලනය උපකල්පනය අනුගමනය කරයි.
සඳහා හොඳම: ස්වභාවික කටහඬ සහිත පොදු අරමුණු පෙළ- සිට- කථාවName
නිදහස් උත්සාහ කරන්න
MeloTTS Free
MyShell.ai විසින් MeloTTS ඉංග්රීසි සහාය බහුභාෂා TTS පුස්තකාලයක් (ඇමරිකානු, බ්රිතාන්ය, ඉන්දියානු, ඕස්ට් රේලියානු), ස්පාඤ්ඤ, ප්රංශ, චීන, ජපන්, සහ කොරියානු. එය ඉතා වේගවත්, CPU පමණක් මත සමීප තත්කාලීන වේගයෙන් පෙළ සැකසීම. MeloTTS නිෂ්පාදනය භාවිතා කිරීම සඳහා නිර්මාණය කර ඇති අතර CPU සහ GPU නිගමනය දෙකම සහාය.
සඳහා හොඳම: වේගවත්, බහුභාෂා TTS අවශ්ය නිෂ්පාදන යෙදුම්
නිදහස් උත්සාහ කරන්න
OuteTTS Free
OuteTTS මූලික ගෘහ නිර්මාණ ශිල්පය ආරක්ෂා කරමින් පෙළ-කථාව හැකියාවන් සමග විශාල භාෂා ආකෘති දීර්ඝ කරයි. එය llama.cpp (CPU / GPU) ඇතුළු බහු backends සහාය, හග් ෆේස් ට් රාන්ස්ෆෝමර්ස්, ExLlamaV2, VLLM, සහ Transformers.js හරහා බ්රවුසරයේ නිගමනය පවා.
සඳහා හොඳම: Edge යෙදවීම, බ්රවුසර-පාදක TTS, අඩු සම්පත් පරිසර
නිදහස් උත්සාහ කරන්න
Pocket TTS Free
Kyutai විසින් පොකට් TTS (Moshi නිර්මාණකරුවන්) එහි බර ඉක්මවා යන සංයුක්ත 100M පරාමිතික පෙළ-කථා ආකෘතියකි. එය CPU මත කාර්යක්ෂමව ක් රියාත්මක වන අතර, තනි ශ්රව්ය සාම්පලයකින් ශුන්ය-ෂොට් හඬ ක්ලෝන කිරීම සහ ස්වාභාවික හඬක් ඇති කථාව නිපදවයි. කුඩා ආකෘති ප් රමාණයෙන් එය අගුළු දැමීම සහ අඩු සම්පත් පරිසර සඳහා පරිපූර්ණ වේ.
සඳහා හොඳම: සැහැල්ලු යෙදවීම, CPU-එකම පරිසර, ඉක්මන් හඬ ක්ලෝන
නිදහස් උත්සාහ කරන්න
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
සඳහා හොඳම: Fast lightweight TTS, edge deployment, low-latency applications
නිදහස් උත්සාහ කරන්න
Bark Standard
පරිවර්තනය මත පදනම් වූ ලේඛන-ශ්රවණ ආකෘතිය, යථාර්ථවාදී කථාව, සංගීතය සහ ශබ්ද බලපෑම් ජනනය කරයි.
සංවර්ධක: Suno · බලපත්රය: MIT
උත්සහ කරන්න.
Bark Small Standard
සරල රේඛීය ශ්රිතයක් සරල රේඛීය ශ්රිතයක් හා අඩු ශ්රිතයක් ලෙසද හැඳින්වේ.
සංවර්ධක: Suno · බලපත්රය: MIT
උත්සහ කරන්න.
CosyVoice 2 Standard
අලිබාබාගේ පරිමාණගත ශ්රව්ය-දෘශ්ය TTS මානව-පාරිශුද්ධ ස්වභාවය සහ ශුන්ය ආසන්න පරතරය සමග.
සංවර්ධක: Alibaba (Tongyi Lab) · බලපත්රය: Apache 2.0
උත්සහ කරන්න.
Dia TTS Standard
සන්නිවේදන ක්රමවේදයන්ගේ සංකීර්ණතාවය නිසා විවිධ සංස්කෘතීන් අතර සංවාදයන් ඇති වේ.
සංවර්ධක: Nari Labs · බලපත්රය: Apache 2.0
උත්සහ කරන්න.
Parler TTS Standard
ස්වභාවික භාෂාවෙන් ඔබට අවශ්ය හඬ විස්තර සහ Parler ගැලපෙන කථාව ජනනය කරයි.
සංවර්ධක: Hugging Face · බලපත්රය: Apache 2.0
උත්සහ කරන්න.
GLM-TTS Standard
ටෙස්ට් ක්රිකට් ඉතිහාසයේ අඩුම ලකුණු ලබාගත් පිතිකරුවා ලෙසින් වාර්තාවක් තබයි.
සංවර්ධක: Zhipu AI · බලපත්රය: GLM-4 License
උත්සහ කරන්න.
IndexTTS-2 Standard
ඝන-අංශු හැඟීම් පාලනය සහ ඉහළ ප්රකාශනශීලීත්වය සමග ශුන්ය-ෂොට් TTS.
සංවර්ධක: Index Team · බලපත්රය: Bilibili Model License
උත්සහ කරන්න.
Spark TTS Standard
හඬ ක්ලෝන TTS පාලනය කළ හැකි හැඟීම් සහ ඉල්ලීම් හරහා කතා ශෛලිය.
සංවර්ධක: SparkAudio · බලපත්රය: CC BY-NC-SA 4.0
උත්සහ කරන්න.
GPT-SoVITS Standard
හුදෙක් ශ්රව්ය තත්පර5ක ඕනෑම හඬක් අනුපිටපත් කරන හඬ කිහිපයක්-ෂොට් ක්ලෝන TTS.
සංවර්ධක: RVC-Boss · බලපත්රය: MIT
උත්සහ කරන්න.
Orpheus Standard
100000 කට අධික සංඛ්යාවක මනෝවිද්යාත්මක දත්ත මත පදනම්ව සකස් කරන ලද මානව මට්ටමේ හැඟීම් සන්නිවේදන ආකෘතියකි.
සංවර්ධක: Canopy Labs · බලපත්රය: Llama 3.2 Community
උත්සහ කරන්න.
Qwen3 TTS Standard
හඬ ක්ලෝන, පෙරනිමි හඬ, සහ පෙළ සිට හඬ සැලසුම් සමග අලිබාබා බහුභාෂා TTS.
සංවර්ධක: Alibaba (Qwen) · බලපත්රය: Apache 2.0
උත්සහ කරන්න.
Chatterbox Turbo Standard
සිනහව සඳහා උප-200ms කල් ඉකුත්වීම සහ paralinguistic ටැග් සමග වේගවත් Chatterbox, කැස්ස, සහ තවත්.
සංවර්ධක: Resemble AI · බලපත්රය: MIT
උත්සහ කරන්න.
Dia 2 Standard
1.සංවාදාත්මක සන්නිවේදනය - සංවාදාත්මක සන්නිවේදනය යනු සන්නිවේදනය හා සංවාදය අතර ඇති සම්බන්ධතාවයයි.
සංවර්ධක: Nari Labs · බලපත්රය: Apache 2.0
උත්සහ කරන්න.
VoxCPM Standard
Tokenizer-නිදහස් TTS 44.1kHz ශ්රව්ය සන්දර්භය-දැනුවත් පරිච්ඡේදය සමග අනුකූලතාවයක් නිෂ්පාදනය.
සංවර්ධක: OpenBMB · බලපත්රය: Apache 2.0
උත්සහ කරන්න.
TADA Standard
ශුන්ය-හීනමාන TTS පෙළ-ශබ්ද ද්විත්ව අනුකූලතාවය සමග, 5x සසඳන LLM TTS වඩා වේගවත්.
සංවර්ධක: Hume AI · බලපත්රය: MIT
උත්සහ කරන්න.
VibeVoice Standard
මයික්රොසොෆ්ට් ආකෘතිය පොඩ්කාස්ට් සහ ශ්රව්ය පොත් වැනි දිගු ආකෘති බහු-කථික අන්තර්ගතය සඳහා.
සංවර්ධක: Microsoft · බලපත්රය: MIT
උත්සහ කරන්න.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
සංවර්ධක: Alibaba (FunAudioLLM) · බලපත්රය: Apache 2.0
උත්සහ කරන්න.
CosyVoice 2
අලිබාබාගේ පරිමාණගත ශ්රව්ය-දෘශ්ය TTS මානව-පාරිශුද්ධ ස්වභාවය සහ ශුන්ය ආසන්න පරතරය සමග.
භාෂා: en, zh, ja, ko, fr, de, it, es
හඬ ක්ලෝන කරන්න
GLM-TTS
ටෙස්ට් ක්රිකට් ඉතිහාසයේ අඩුම ලකුණු ලබාගත් පිතිකරුවා ලෙසින් වාර්තාවක් තබයි.
භාෂා: en, zh
හඬ ක්ලෝන කරන්න
IndexTTS-2
ඝන-අංශු හැඟීම් පාලනය සහ ඉහළ ප්රකාශනශීලීත්වය සමග ශුන්ය-ෂොට් TTS.
භාෂා: en, zh
හඬ ක්ලෝන කරන්න
GPT-SoVITS
හුදෙක් ශ්රව්ය තත්පර5ක ඕනෑම හඬක් අනුපිටපත් කරන හඬ කිහිපයක්-ෂොට් ක්ලෝන TTS.
භාෂා: en, zh, ja, ko
හඬ ක්ලෝන කරන්න
Chatterbox
මනෝවිද්යාවේදී, මනෝවිශ්ලේෂණය යනු මනෝවිද්යාවේ මනෝවිද්යාව පිළිබඳ අධ්යයනයයි.
භාෂා: en
හඬ ක්ලෝන කරන්න
Tortoise TTS
ව්යවහාරික භාෂා විද්යාව යනු භාෂාවන්හි ව්යවහාරික ගුණාංග පිළිබඳ අධ්යයනයයි.
භාෂා: en
හඬ ක්ලෝන කරන්න
OpenVoice
ශෛලිය, හැඟීම්, සහ උච්චාරණය මත කැටිති පාලනය සමග ක්ෂණික හඬ ක්ලෝන.
භාෂා: en, zh, ja, ko, fr, de, es, it
හඬ ක්ලෝන කරන්න
Qwen3 TTS
හඬ ක්ලෝන, පෙරනිමි හඬ, සහ පෙළ සිට හඬ සැලසුම් සමග අලිබාබා බහුභාෂා TTS.
භාෂා: en, zh, ja, ko, de, fr, ru, pt, es, it
හඬ ක්ලෝන කරන්න
Chatterbox Turbo
සිනහව සඳහා උප-200ms කල් ඉකුත්වීම සහ paralinguistic ටැග් සමග වේගවත් Chatterbox, කැස්ස, සහ තවත්.
භාෂා: en
හඬ ක්ලෝන කරන්න
VoxCPM
Tokenizer-නිදහස් TTS 44.1kHz ශ්රව්ය සන්දර්භය-දැනුවත් පරිච්ඡේදය සමග අනුකූලතාවයක් නිෂ්පාදනය.
භාෂා: en, zh
හඬ ක්ලෝන කරන්න
OuteTTS
LLM-පාදක TTS CPU, GPU, හෝ lama.cpp සහ Transformers.js හරහා බ්රව්සරයේ ධාවනය වේ.
භාෂා: en
හඬ ක්ලෝන කරන්න
Pocket TTS
100M පරාමිති ආකෘතිය Kyutai විසින් තනි සාම්පලයකින් හඬ ක්ලෝන කිරීම.
භාෂා: en, fr
හඬ ක්ලෝන කරන්න
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
භාෂා: en, zh, ja, ko, de, es, fr, it, ru
හඬ ක්ලෝන කරන්න
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
භාෂා: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
හඬ ක්ලෝන කරන්න
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
භාෂා: en, zh
හඬ ක්ලෝන කරන්නසංවර්ධක- පළමු API
OpenAI අනුකූල REST API. එක් අවසන් ස්ථානයක්, 22+ ආකෘති. සැබෑ-කාලීන යෙදුම් සඳහා ප් රවාහනය සහාය.
- OpenAI අනුකූල සංයුතිය
- සත්ය කාලීන යෙදුම් සඳහා TTS ප්රවාහනය
- විශාල වැඩ සඳහා බැච් සැකසීම
- Webhook දැනුම්දීම්
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
සරල, විනිවිද මිල ගණන්
නිදහස් ආරම්භ කරන්න. ඔබ වර්ධනය ලෙස පරිමාණය.
නිදහස්
15 ණය
- Kokoro, Piper, VITS, MeloTTS
- අකුරු සීමා 500
- 3 gen / පැය (ගැණුම්කරුවන් නැත)
ආරම්භකයා
500 ණය / මාස
- සියලු 22+ ආකෘති
- පරම්පරාවකට අකුරු 100,000
- හඬ ක්ලෝන කිරීම
ප්රො
2,000 ණය / මාස
- ආරම්භකයේ ඇති සියල්ල
- API පිවිසුම
- ප්රමුඛතාව සැකසීම
නිතර අසන ප්රශ්න
අපි වැඩි දියුණු කළ හැකි දේ? ඔබේ ප්රතිචාරය අපට ගැටළු විසඳීමට උපකාරී වේ.
අද AI හඬ භාවිතා ආරම්භ
නිර්මාණකරුවන් එක්වන්න, සංවර්ධකයින්, සහ ව්යාපාර භාවිතා TTS.ai