නිදහස් AI පෙළ සිට කථාවName
20+ විවෘත මූලාශ්රය ආකෘති, 107+ හඬවල්, 32+ භාෂා. ගිණුමක් අවශ්ය නැත.
හඬ AI සඳහා ඔබට අවශ්ය සියලු
30+ විවෘත මූලාශ්රය AI ආකෘති මගින් බලගැන්වෙන මෙවලම්
20+ AI හඬ ආකෘති
එක් වේදිකාවක් තුළ විවෘත මූලාශ්රය TTS ආකෘති වඩාත් පුළුල් එකතුව
Kokoro Free
Kokoro යනු එහි බර පන්තියට වඩා හොඳින් පහර දෙන 82 මිලියන පරාමිතික පෙළ-කථා ආකෘතියකි. එහි කුඩා ප් රමාණයට පටහැනිව, එය විශිෂ්ට ස්වාභාවික හා ප් රකාශාත්මක කථාවක් නිපදවයි. Kokoro ඉංග් රීසි, ජපන්, චීන සහ කොරියානු වැනි බහු භාෂා සඳහා සහාය දක්වයි. එය GPU මත සැබෑ කාලයට වඩා 100x වේගයෙන් ශ් රව්ය ජනනය කරයි.
සඳහා හොඳම: අවම ප් රමාදයක් සහිත උසස් තත්ත්වයේ TTS, ප් රවාහ යෙදුම්
නොමිලේ උත්සාහ කරන්න
Piper Free
Piper යනු VITS සහ larynx ගෘහ නිර්මාණ ශිල්ප භාවිතා කරන Rhasspy විසින් සංවර්ධනය කරන ලද සැහැල්ලු පෙළ-කථා එන්ජිමකි. එය සම්පූර්ණයෙන්ම CPU මත ධාවනය වන අතර, එය අගල් උපාංග, ගෘහ ස්වයංක් රීයකරණ සහ ඔෆ්ලයින් TTS අවශ් ය වන යෙදුම් සඳහා පරිපූර්ණ කරයි. 30+ භාෂා හරහා 100 හඬවල් කට වඩා වැඩි, Piper රාස්ප්බෙරි පයි මත පවා තත්පරයට ස්වභාවික හඬක් ඇති කථාව ලබා දෙයි4.
සඳහා හොඳම: ඉක්මන් පූර්වදසුන, පිවිසුම් හැකියාව, සහ තිළැලි යෙදුම්Name
නොමිලේ උත්සාහ කරන්න
VITS Free
VITS (අවසන්-අවසන් පෙළ-කථාව සඳහා විරුද්ධවාදී ඉගෙනීම සමඟ විචල්ය නිගමනය) වත්මන් අදියර දෙකක් ආකෘති වලට වඩා ස්වභාවික ශබ්ද ශ්රව්ය ජනනය කරන සමාන්තර අවසන්-අවසන් TTS ක්රමය වේ. එය ස්වාභාවිකත්වයේ සැලකිය යුතු වැඩි දියුණුවක් අත්පත් කර ගනිමින් ප්රවාහයන් සාමාන්යකරණය සහ විරුද්ධවාදී පුහුණු ක්රියාවලිය සමඟ වැඩි දියුණු කරන ලද විචල්ය නිගමනය අනුගමනය කරයි.
සඳහා හොඳම: ස්වාභාවික කටහඬ සහිත පොදු අරමුණු පෙළ- සිට- කථාවName
නොමිලේ උත්සාහ කරන්න
MeloTTS Free
MyShell.ai විසින් MeloTTS ඉංග්රීසි සහාය බහුභාෂා TTS පුස්තකාලයක් (ඇමරිකානු, බ්රිතාන්ය, ඉන්දියානු, ඕස්ට් රේලියානු), ස්පාඤ්ඤ, ප්රංශ, චීන, ජපන්, සහ කොරියානු. එය අතිශයින් වේගවත්, CPU මත පමණක් සමීප තත්කාලීන වේගයෙන් පෙළ සැකසීම. MeloTTS නිෂ්පාදනය භාවිතය සඳහා නිර්මාණය කර ඇති අතර CPU සහ GPU නිගමනය දෙකම සහාය.
සඳහා හොඳම: වේගවත්, බහුභාෂා TTS අවශ්ය නිෂ්පාදන යෙදුම්
නොමිලේ උත්සාහ කරන්න
Bark Standard
පරිවර්තනය මත පදනම් වූ ලේඛන-ශ්රවණ ආකෘතිය, යථාර්ථවාදී කථාව, සංගීතය සහ ශබ්ද බලපෑම් ජනනය කරයි.
සංවර්ධක: Suno · බලපත්රය: MIT
උත්සහ කරන්න.
Bark Small Standard
සරල රේඛීය ශ්රිතයක් සරල රේඛීය ශ්රිතයක් හා අඩු ශ්රිතයක් ලෙසද හැඳින්වේ.
සංවර්ධක: Suno · බලපත්රය: MIT
උත්සහ කරන්න.
CosyVoice 2 Standard
අලිබාබාගේ පරිමාණය කළ හැකි මානව-පාරිශුද්ධ ස්වාභාවිකත්වය සහ ශුන්යයට ආසන්න ප්රමාදතාවයක් සහිත ටීටීඑස්.
සංවර්ධක: Alibaba (Tongyi Lab) · බලපත්රය: Apache 2.0
උත්සහ කරන්න.
Dia TTS Standard
ස්වාභාවික භාෂා පරිවර්තනය යනු ස්වාභාවික භාෂා ව්යවහාරයෙහි ස්වාභාවික භාෂා පරිවර්තනයයි.
සංවර්ධක: Nari Labs · බලපත්රය: Apache 2.0
උත්සහ කරන්න.
Parler TTS Standard
ස්වභාවික භාෂාවෙන් ඔබට අවශ්ය හඬ විස්තර සහ Parler ගැලපෙන කථාව ජනනය කරයි.
සංවර්ධක: Hugging Face · බලපත්රය: Apache 2.0
උත්සහ කරන්න.
GLM-TTS Standard
ටෙස්ට් ක්රිකට් ඉතිහාසයේ අඩුම ලකුණු ලබාගත් පිතිකරුවා ලෙසින් වාර්තාවක් තබයි.
සංවර්ධක: Zhipu AI · බලපත්රය: GLM-4 License
උත්සහ කරන්න.
IndexTTS-2 Standard
ඝන-අංශු හැඟීම් පාලනය සහ ඉහළ ප්රකාශනශීලීත්වය සමග ශුන්ය-ෂොට් TTS.
සංවර්ධක: Index Team · බලපත්රය: Bilibili Model License
උත්සහ කරන්න.
Spark TTS Standard
හඬ ක්ලෝන TTS පාලනය කළ හැකි හැඟීම් සහ ඉල්ලීම් හරහා කතා ශෛලිය.
සංවර්ධක: SparkAudio · බලපත්රය: CC BY-NC-SA 4.0
උත්සහ කරන්න.
GPT-SoVITS Standard
හුදෙක් ශ්රව්ය තත්පර5ක ඕනෑම හඬක් අනුපිටපත් කරන හඬ කිහිපයක්-ෂොට් ක්ලෝන TTS.
සංවර්ධක: RVC-Boss · බලපත්රය: MIT
උත්සහ කරන්න.
Orpheus Standard
100000 කට අධික සංඛ්යාවක මනෝවිද්යාත්මක දත්ත මත පදනම්ව සකස් කරන ලද මානව මට්ටමේ හැඟීම් සන්නිවේදන ආකෘතියකි.
සංවර්ධක: Canopy Labs · බලපත්රය: Llama 3.2 Community
උත්සහ කරන්න.
Qwen3 TTS Standard
හඬ ක්ලෝන, පෙරනිමි හඬ, සහ පෙළ සිට හඬ සැලසුම් සමග අලිබාබා බහුභාෂා TTS.
සංවර්ධක: Alibaba (Qwen) · බලපත්රය: Apache 2.0
උත්සහ කරන්න.
CosyVoice 2
අලිබාබාගේ පරිමාණය කළ හැකි මානව-පාරිශුද්ධ ස්වාභාවිකත්වය සහ ශුන්යයට ආසන්න ප්රමාදතාවයක් සහිත ටීටීඑස්.
භාෂා: en, zh, ja, ko, fr, de, it, es
හඬ ක්ලෝන කරන්න
GLM-TTS
ටෙස්ට් ක්රිකට් ඉතිහාසයේ අඩුම ලකුණු ලබාගත් පිතිකරුවා ලෙසින් වාර්තාවක් තබයි.
භාෂා: en, zh
හඬ ක්ලෝන කරන්න
IndexTTS-2
ඝන-අංශු හැඟීම් පාලනය සහ ඉහළ ප්රකාශනශීලීත්වය සමග ශුන්ය-ෂොට් TTS.
භාෂා: en, zh
හඬ ක්ලෝන කරන්න
GPT-SoVITS
හුදෙක් ශ්රව්ය තත්පර5ක ඕනෑම හඬක් අනුපිටපත් කරන හඬ කිහිපයක්-ෂොට් ක්ලෝන TTS.
භාෂා: en, zh, ja, ko
හඬ ක්ලෝන කරන්න
Chatterbox
මනෝවිද්යාවේදී, මනෝවිශ්ලේෂණය යනු මනෝවිද්යාවේ මනෝවිද්යාව පිළිබඳ අධ්යයනයයි.
භාෂා: en
හඬ ක්ලෝන කරන්න
Tortoise TTS
ව්යවහාරික භාෂා විද්යාව යනු භාෂාවන්හි ව්යවහාරික ගුණාංග පිළිබඳ අධ්යයනයයි.
භාෂා: en
හඬ ක්ලෝන කරන්න
OpenVoice
ශෛලිය, හැඟීම්, සහ උච්චාරණය මත කැටිති පාලනය සමග ක්ෂණික හඬ ක්ලෝන.
භාෂා: en, zh, ja, ko, fr, de, es, it
හඬ ක්ලෝන කරන්න
Qwen3 TTS
හඬ ක්ලෝන, පෙරනිමි හඬ, සහ පෙළ සිට හඬ සැලසුම් සමග අලිබාබා බහුභාෂා TTS.
භාෂා: en, zh, ja, ko, de, fr, ru, pt, es, it
හඬ ක්ලෝන කරන්නසංවර්ධක- පළමු API
OpenAI අනුකූල REST API. එක් අවසන් ස්ථානයක්, 22+ ආකෘති. සැබෑ-කාලීන යෙදුම් සඳහා ප් රවාහනය සහාය.
- OpenAI අනුකූල සංයුතිය
- සත්ය කාලීන යෙදුම් සඳහා TTS ප්රවාහනය
- විශාල වැඩ සඳහා බැච් සැකසීම
- Webhook දැනුම්දීම්
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
සරල, විනිවිද මිල ගණන්
නිදහස් ආරම්භ කරන්න. ඔබ වර්ධනය ලෙස පරිමාණය.
නිදහස්
15 ණය
- Kokoro, Piper, VITS, MeloTTS
- අකුරු සීමා 500
- 3 gen / පැය (ගැණුම්කරුවන් නැත)
ආරම්භකයා
500 ණය / මාස
- සියලු 22+ ආකෘති
- 100,000 chars per generation
- හඬ ක්ලෝන කිරීම
ප්රො
2,000 ණය / මාස
- ආරම්භකයේ ඇති සියල්ල
- API පිවිසුම
- ප්රමුඛතාව සැකසීම
නිතර අසන ප්රශ්න
අද AI හඬ භාවිතා ආරම්භ
නිර්මාණකරුවන් එක්වන්න, සංවර්ධකයින්, සහ ව්යාපාර භාවිතා TTS.ai