නිදහස් AI පෙළ සිට කථාවName

33+ විවෘත මූලාශ්රය ආකෘති, 273+ හඬවල්, 33+ භාෂා. ගිණුමක් අවශ්ය නැත.

18K+
නිර්මාණකරුවන්
71K+
පරම්පරා
33+
AI ආකෘති
273+
හඬ
TTS.ai ආදරය? ඔබේ මිතුරන්ට කියන්න!

හඬ AI සඳහා ඔබට අවශ්ය සියලු

30+ විවෘත මූලාශ්රය AI ආකෘති මගින් බලගැන්වෙන මෙවලම්

33+ AI හඬ ආකෘති

එක් වේදිකාවක් තුළ විවෘත මූලාශ්රය TTS ආකෘති වඩාත් පුළුල් එකතුව

KokoroKokoro නිදහස්

Kokoro යනු එහි බර පන්තියට වඩා හොඳින් පීඩනය කරන 82 මිලියන පරාමිතික පෙළ-කථා ආකෘතියකි. එහි කුඩා ප් රමාණයට පටහැනිව, එය විශිෂ්ට ස්වාභාවික හා ප් රකාශාත්මක කථාව නිපදවයි. Kokoro ඉංග් රීසි, ජපන්, චීන, සහ කොරියානු ඇතුළු විවිධ භාෂා සඳහා සහාය දක්වයි. එය අතිශයින් වේගවත්ව ක් රියාත්මක වේ - GPU මත සැබෑ කාලයට වඩා 100x වේගයෙන් ශ් රව් ය ජනනය කරයි.

සඳහා හොඳම: අවම ප්රමාදයක් සහිත උසස් තත්ත්වයේ TTS, ප්රවාහ යෙදුම්

නිදහස් උත්සාහ කරන්න

PiperPiper නිදහස්

Piper යනු VITS සහ larynx ගෘහ නිර්මාණ ශිල්ප භාවිතා කරන Rhasspy විසින් සංවර්ධනය කරන ලද සැහැල්ලු පෙළ-කථා එන්ජිමකි. එය සම්පූර්ණයෙන්ම CPU මත ධාවනය වන අතර, එය අගල් උපාංග, ගෘහ ස්වයංක් රීයකරණ සහ ඔෆ්ලයින් TTS අවශ් ය වන යෙදුම් සඳහා පරිපූර්ණ කරයි. 30+ භාෂා හරහා 100 හඬවල් කට වඩා වැඩි, Piper රාස්ප්බෙරි පයි මත පවා තත්පරයට ස්වභාවික හඬක් ඇති කථාව ලබා දෙයි4.

සඳහා හොඳම: ඉක්මන් පූර්‍වදසුන, පිවිසුම් හැකියාව, සහ තිළැලි යෙදුම්Name

නිදහස් උත්සාහ කරන්න

VITSVITS නිදහස්

VITS (අවසන්-අවසන් පෙළ-කථාව සඳහා විරුද්ධාභාස ඉගෙනීම සමග විචලනය උපකල්පනය) වත්මන් අදියර දෙකක් ආකෘති වඩා ස්වභාවික ශබ්ද ශ්රව්ය ජනනය කරන සමාන්තර අවසන්-අවසන් TTS ක්රමයකි. එය ස්වභාවිකත්වය සැලකිය යුතු දියුණුවක් ලබා ගැනීම සඳහා, සාමාන්යකරණය ප්රවාහයන් හා විරුද්ධාභාස පුහුණු ක්රියාවලිය සමග වැඩි දියුණු කරන ලද විචලනය උපකල්පනය අනුගමනය කරයි.

සඳහා හොඳම: ස්වභාවික කටහඬ සහිත පොදු අරමුණු පෙළ- සිට- කථාවName

නිදහස් උත්සාහ කරන්න

MeloTTSMeloTTS නිදහස්

MyShell.ai විසින් MeloTTS ඉංග්රීසි සහාය බහුභාෂා TTS පුස්තකාලයක් (ඇමරිකානු, බ්‍රිතාන්‍ය, ඉන්දියානු, ඕස්ට් රේලියානු), ස්පාඤ්ඤ, ප්රංශ, චීන, ජපන්, සහ කොරියානු. එය ඉතා වේගවත්, CPU පමණක් මත සමීප තත්කාලීන වේගයෙන් පෙළ සැකසීම. MeloTTS නිෂ්පාදනය භාවිතා කිරීම සඳහා නිර්මාණය කර ඇති අතර CPU සහ GPU නිගමනය දෙකම සහාය.

සඳහා හොඳම: වේගවත්, බහුභාෂා TTS අවශ්ය නිෂ්පාදන යෙදුම්

නිදහස් උත්සාහ කරන්න

Kani TTS 2Kani TTS 2 නිදහස්

NineNineSix විසින් Kani-TTS-2 යනු NVIDIA NanoCodec සමඟ දියර AI LFM2 පිටුපස ඉදිකරන ලද අතිශය සැහැල්ලු 400M පරාමිතික ආකෘතියකි. එය 3GB VRAM හි ධාවනය වන අතර A100 (RTF 0.2) මත ~2 තත්පර වලදී ~ 10 තත්පර කතාබහක් නිපදවයි. වත්මන් මහජන නිකුතුව ඉංග් රීසි පමණක් `kani-tts-2-en` චෙක්පොයින්ට් එකක් සහ හඬ ක්ලෝන කිරීම සඳහා අවශ් ය කථික-අභ් යන්තරකරණය වූ හොක් නිරාවරණය නොකරයි - ක්ලෝන කිරීම සඳහා Chatterbox / IndexTTS2 / F5-TTS භාවිතා කරන්න, හෝ ඉංග් රීසි නොවන Kokoro / MeloTTS.

සඳහා හොඳම: අඩු VRAM දෘඩාංග මත වේගවත් ඉංග්රීසි ජනපදය, ඉක්මන් පූර්ව දර්ශන

නිදහස් උත්සාහ කරන්න

OuteTTSOuteTTS නිදහස්

OuteTTS මූලික ගෘහ නිර්මාණ ශිල්පය ආරක්ෂා කරමින් පෙළ-කථාව හැකියාවන් සමග විශාල භාෂා ආකෘති දීර්ඝ කරයි. එය llama.cpp (CPU / GPU) ඇතුළු බහු backends සහාය, හග් ෆේස් ට් රාන්ස්ෆෝමර්ස්, ExLlamaV2, VLLM, සහ Transformers.js හරහා බ්රවුසරයේ නිගමනය පවා.

සඳහා හොඳම: Edge යෙදවීම, බ්රවුසර-පාදක TTS, අඩු සම්පත් පරිසර

නිදහස් උත්සාහ කරන්න

Pocket TTSPocket TTS නිදහස්

Kyutai විසින් පොකට් TTS (Moshi නිර්මාණකරුවන්) එහි බර ඉක්මවා යන සංයුක්ත 100M පරාමිතික පෙළ-කථා ආකෘතියකි. එය CPU මත කාර්යක්ෂමව ක් රියාත්මක වන අතර, තනි ශ්රව්ය සාම්පලයකින් ශුන්‍ය-ෂොට් හඬ ක්ලෝන කිරීම සහ ස්වාභාවික හඬක් ඇති කථාව නිපදවයි. කුඩා ආකෘති ප් රමාණයෙන් එය අගුළු දැමීම සහ අඩු සම්පත් පරිසර සඳහා පරිපූර්ණ වේ.

සඳහා හොඳම: සැහැල්ලු යෙදවීම, CPU-එකම පරිසර, ඉක්මන් හඬ ක්ලෝන

නිදහස් උත්සාහ කරන්න

Kitten TTSKitten TTS නිදහස්

KittenML විසින් Kitten TTS යනු ONNX මත ඉදිකරන ලද අතිශය සැහැල්ලු පෙළ-කථන ආකෘතියකි. 15M සිට 80M පරාමිතීන් දක්වා (තැටිය මත 25-80 MB) වෙනස්කම් සමඟ, එය GPU අවශ් ය නොවන පරිදි CPU මත උසස් තත්ත්වයේ හඬ සංස්ලේෂණය ලබා දෙයි. අංක, මුදල් සහ ඒකක සඳහා 8 ස්ථාපිත හඬ, වෙනස් කළ හැකි කතා වේගය සහ ස්ථාපිත පෙළ පෙර සැකසීම. අගුළු යෙදවීම සහ අඩු ප් රමාණයේ යෙදුම් සඳහා පරිපූර්ණ.

සඳහා හොඳම: වේගවත් සැහැල්ලු TTS, අගල් යෙදවීම, අඩු-ලෙන්ටිටි යෙදුම්

නිදහස් උත්සාහ කරන්න

Ming-Omni TTSMing-Omni TTS නිදහස්

inclusionAI විසින් Ming-omni-tts-0.5B පැච්-by-පැච් ප්රවාහය ගැලපෙන ශ්රව්ය විකේතනය සමග BailingMM ඝන පිටුපස මත ඉදි කරන ලද සංයුක්ත omni-modal කථා ආකෘතිය වේ. 44.1kHz ප්රතිදානය (CD ගුණාත්මක අසල), 3+ තත්පර උපුටා ගැනීමකින් ශුන්‍ය-ෂොට් හඬ ක්ලෝන සහාය, සහ JSON උපදෙස් හරහා තනන ලද හැඟීම් / උපභාෂාව / BGM පාලනය ඇතුළත් වේ. විශිෂ්ට ස්ථාවරත්වය - චීන සම්මතයන් මත 0.83% WER.

සඳහා හොඳම: ඉහළ විශ්වාසනීය දෙමළ කථා, හැඟීම් පාලනය හඬ ක්රියා, චීන ශ්රව්ය පොත් අන්තර්ගතය

නිදහස් උත්සාහ කරන්න

MOSS-TTS NanoMOSS-TTS Nano නිදහස්

MOSS-TTS-Nano-100M යනු MOSS-TTS පවුලේ OpenMOSS හි සංයුක්ත 100M-පරාමිතික විකල්පය වන අතර ප්රමාද-ප් රතිවර්ත ගෘහ නිර්මාණ ශිල්පය හුවමාරු කරයි. 80x කුඩා බර සහ ඉල්ලුම් කරන VRAM සඳහා 8B ආකෘතියේ උපරිම ගුණාත්මකභාවය වෙළඳාම් කරයි. එය නිදහස් ස්ථර සහ ඉහළ කාර්යක්ෂමතාවයකින් යුත් යෙදවුම් සඳහා සුදුසු වේ.

සඳහා හොඳම: නිදහස්-තලය TTS, ඉහළ පරිමාව නිෂ්පාදනය, අඩු-ලෙන්ටිටි අන්තර්ක්රියාකාරී භාවිතය

නිදහස් උත්සාහ කරන්න

BarkBark සම්මත

පරිවර්තනය මත පදනම් වූ ලේඛන-ශ්‍රවණ ආකෘතිය, යථාර්ථවාදී කථාව, සංගීතය සහ ශබ්ද බලපෑම් ජනනය කරයි.

සංවර්‍ධක: Suno · බලපත්‍රය: MIT

උත්සහ කරන්න.

Bark SmallBark Small සම්මත

සරල රේඛීය ශ්‍රිතයක් සරල රේඛීය ශ්‍රිතයක් හා අඩු ශ්‍රිතයක් ලෙසද හැඳින්වේ.

සංවර්‍ධක: Suno · බලපත්‍රය: MIT

උත්සහ කරන්න.

CosyVoice 2CosyVoice 2 සම්මත

අලිබාබාගේ පරිමාණගත ශ්‍රව්‍ය-දෘශ්‍ය TTS මානව-පාරිශුද්ධ ස්වභාවය සහ ශුන්‍ය ආසන්න පරතරය සමග.

සංවර්‍ධක: Alibaba (Tongyi Lab) · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

Dia TTSDia TTS සම්මත

සන්නිවේදන ක්‍රමවේදයන්ගේ සංකීර්ණතාවය නිසා විවිධ සංස්කෘතීන් අතර සංවාදයන් ඇති වේ.

සංවර්‍ධක: Nari Labs · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

Parler TTSParler TTS සම්මත

ස්වභාවික භාෂාවෙන් ඔබට අවශ්ය හඬ විස්තර සහ Parler ගැලපෙන කථාව ජනනය කරයි.

සංවර්‍ධක: Hugging Face · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

IndexTTS-2IndexTTS-2 සම්මත

ඝන-අංශු හැඟීම් පාලනය සහ ඉහළ ප්‍රකාශනශීලීත්වය සමග ශුන්‍ය-ෂොට් TTS.

සංවර්‍ධක: Index Team · බලපත්‍රය: Bilibili Model License

උත්සහ කරන්න.

Spark TTSSpark TTS සම්මත

හඬ ක්ලෝන TTS පාලනය කළ හැකි හැඟීම් සහ ඉල්ලීම් හරහා කතා ශෛලිය.

සංවර්‍ධක: SparkAudio · බලපත්‍රය: CC BY-NC-SA 4.0

උත්සහ කරන්න.

GPT-SoVITSGPT-SoVITS සම්මත

හුදෙක් ශ්රව්ය තත්පර5ක ඕනෑම හඬක් අනුපිටපත් කරන හඬ කිහිපයක්-ෂොට් ක්ලෝන TTS.

සංවර්‍ධක: RVC-Boss · බලපත්‍රය: MIT

උත්සහ කරන්න.

OrpheusOrpheus සම්මත

100000 කට අධික සංඛ්‍යාවක මනෝවිද්‍යාත්මක දත්ත මත පදනම්ව සකස් කරන ලද මානව මට්ටමේ හැඟීම් සන්නිවේදන ආකෘතියකි.

සංවර්‍ධක: Canopy Labs · බලපත්‍රය: Llama 3.2 Community

උත්සහ කරන්න.

Qwen3 TTSQwen3 TTS සම්මත

අලිබාබාගේ පෙර සැකසූ හඬ සහ පෙළ සිට හඬ සැලසුම් සමග බහුභාෂා TTS.

සංවර්‍ධක: Alibaba (Qwen) · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

VieNeu-TTS-v2VieNeu-TTS-v2 සම්මත

වියට්නාම + ඉංග්රීසි කේතය-ස්විච් TTS සමග7පෙර-සැකසූ හඬ සහ ශුන්‍ය-ෂොට් හඬ ක්ලෝන. CPU-එක්, කිසිදු GPU අවශ්ය.

සංවර්‍ධක: Phạm Nguyễn Ngọc Bảo · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

Chatterbox TurboChatterbox Turbo සම්මත

සිනහව සඳහා උප-200ms කල් ඉකුත්වීම සහ paralinguistic ටැග් සමග වේගවත් Chatterbox, කැස්ස, සහ තවත්.

සංවර්‍ධක: Resemble AI · බලපත්‍රය: MIT

උත්සහ කරන්න.

VoxCPMVoxCPM සම්මත

Tokenizer-නිදහස් TTS 44.1kHz ශ්රව්ය සන්දර්භය-දැනුවත් පරිච්ඡේදය සමග අනුකූලතාවයක් නිෂ්පාදනය.

සංවර්‍ධක: OpenBMB · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

VibeVoiceVibeVoice සම්මත

මයික්‍රොසොෆ්ට් ආකෘතිය පොඩ්කාස්ට් සහ ශ්‍රව්‍ය පොත් වැනි දිගු ආකෘති බහු-කථික අන්තර්ගතය සඳහා.

සංවර්‍ධක: Microsoft · බලපත්‍රය: MIT

උත්සහ කරන්න.

CosyVoice3CosyVoice3 සම්මත

ද්විත්ව-ස්වභාවික, හැඟීම් පාලනය, සහ ශුන්‍ය-ෂොට් හඬ ක්ලෝන සමග ඊළඟ පරම්පරාව බහුභාෂා TTS.

සංවර්‍ධක: Alibaba (FunAudioLLM) · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

NAMAA Saudi TTSNAMAA Saudi TTS සම්මත

පළමු විවෘත සවුදි අරාබි TTS. Chatterbox-ගුණාත්මක හඬ ක්ලෝන සමග ස්වදේශීය සවුදි භාෂාව.

සංවර්‍ධක: NAMAA Space · බලපත්‍රය: MIT

උත්සහ කරන්න.

Darwin TTSDarwin TTS සම්මත

Qwen3-1.7B භාෂා ආකෘතිය මඟින් FFN බර සහිතව ක්‍රමාංකනය කරන ලද Qwen3-TTS වර්ගය වඩාත් තීව්‍ර බහුභාෂා ක්ලෝන කිරීම සඳහා මිශ්‍ර කර ඇත.

සංවර්‍ධක: FINAL-Bench · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

MOSS-TTSDMOSS-TTSD සම්මත

බහු-කථික සංවාදය දිගටම ආකෘතිය - දක්වා5කථිකයන් හා 60 මිනිත්තු සමගාමී ශ්‍රව්‍ය සමග පොඩ්කාස්ට්-ශෛලිය සංවාදයක් ජනනය.

සංවර්‍ධක: OpenMOSS · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

ChatterboxChatterbox ප්‍රමිතිය

මනෝවිද්‍යාවේදී, මනෝවිශ්ලේෂණය යනු මනෝවිද්‍යාවේ මනෝවිද්‍යාව පිළිබඳ අධ්‍යයනයයි.

තත්ත්ව:

උත්සහ කරන්න.

Tortoise TTSTortoise TTS ප්‍රමිතිය

ව්‍යවහාරික භාෂා විද්‍යාව යනු භාෂාවන්හි ව්‍යවහාරික ගුණාංග පිළිබඳ අධ්‍යයනයයි.

තත්ත්ව:

උත්සහ කරන්න.

StyleTTS 2StyleTTS 2 ප්‍රමිතිය

මනෝවිද්‍යාව යනු මනෝවිද්‍යාවේ හා මනෝවිද්‍යාව සම්බන්ධ විෂය ක්ෂේත්‍රයකි.

තත්ත්ව:

උත්සහ කරන්න.

OpenVoiceOpenVoice ප්‍රමිතිය

ශෛලිය, හැඟීම්, සහ උච්චාරණය මත කැටිති පාලනය සමග ක්ෂණික හඬ ක්ලෝන.

තත්ත්ව:

උත්සහ කරන්න.

Sesame CSMSesame CSM ප්‍රමිතිය

ස්වභාවික සංසිද්ධි හා සංකල්ප අතර ඇති සම්බන්ධතාවය තේරුම් ගැනීමේ දී මනෝවිද්‍යාව වැදගත් වේ.

තත්ත්ව:

උත්සහ කරන්න.

CosyVoice 2CosyVoice 2

අලිබාබාගේ පරිමාණගත ශ්‍රව්‍ය-දෘශ්‍ය TTS මානව-පාරිශුද්ධ ස්වභාවය සහ ශුන්‍ය ආසන්න පරතරය සමග.

භාෂා: en, zh, ja, ko, fr, de, it, es

හඬ ක්ලෝන කරන්න

IndexTTS-2IndexTTS-2

ඝන-අංශු හැඟීම් පාලනය සහ ඉහළ ප්‍රකාශනශීලීත්වය සමග ශුන්‍ය-ෂොට් TTS.

භාෂා: en, zh

හඬ ක්ලෝන කරන්න

Spark TTSSpark TTS

හඬ ක්ලෝන TTS පාලනය කළ හැකි හැඟීම් සහ ඉල්ලීම් හරහා කතා ශෛලිය.

භාෂා: en, zh

හඬ ක්ලෝන කරන්න

GPT-SoVITSGPT-SoVITS

හුදෙක් ශ්රව්ය තත්පර5ක ඕනෑම හඬක් අනුපිටපත් කරන හඬ කිහිපයක්-ෂොට් ක්ලෝන TTS.

භාෂා: en, zh, ja, ko

හඬ ක්ලෝන කරන්න

ChatterboxChatterbox

මනෝවිද්‍යාවේදී, මනෝවිශ්ලේෂණය යනු මනෝවිද්‍යාවේ මනෝවිද්‍යාව පිළිබඳ අධ්‍යයනයයි.

භාෂා: en

හඬ ක්ලෝන කරන්න

Tortoise TTSTortoise TTS

ව්‍යවහාරික භාෂා විද්‍යාව යනු භාෂාවන්හි ව්‍යවහාරික ගුණාංග පිළිබඳ අධ්‍යයනයයි.

භාෂා: en

හඬ ක්ලෝන කරන්න

OpenVoiceOpenVoice

ශෛලිය, හැඟීම්, සහ උච්චාරණය මත කැටිති පාලනය සමග ක්ෂණික හඬ ක්ලෝන.

භාෂා: en, zh, ja, ko, fr, es

හඬ ක්ලෝන කරන්න

VieNeu-TTS-v2VieNeu-TTS-v2

වියට්නාම + ඉංග්රීසි කේතය-ස්විච් TTS සමග7පෙර-සැකසූ හඬ සහ ශුන්‍ය-ෂොට් හඬ ක්ලෝන. CPU-එක්, කිසිදු GPU අවශ්ය.

භාෂා: vi, en

හඬ ක්ලෝන කරන්න

Chatterbox TurboChatterbox Turbo

සිනහව සඳහා උප-200ms කල් ඉකුත්වීම සහ paralinguistic ටැග් සමග වේගවත් Chatterbox, කැස්ස, සහ තවත්.

භාෂා: en

හඬ ක්ලෝන කරන්න

VoxCPMVoxCPM

Tokenizer-නිදහස් TTS 44.1kHz ශ්රව්ය සන්දර්භය-දැනුවත් පරිච්ඡේදය සමග අනුකූලතාවයක් නිෂ්පාදනය.

භාෂා: en, zh

හඬ ක්ලෝන කරන්න

OuteTTSOuteTTS

LLM-පාදක TTS CPU, GPU, හෝ lama.cpp සහ Transformers.js හරහා බ්‍රව්සරයේ ධාවනය වේ.

භාෂා: en

හඬ ක්ලෝන කරන්න

Pocket TTSPocket TTS

100M පරාමිති ආකෘතිය Kyutai විසින් තනි සාම්පලයකින් හඬ ක්ලෝන කිරීම.

භාෂා: en, fr

හඬ ක්ලෝන කරන්න

CosyVoice3CosyVoice3

ද්විත්ව-ස්වභාවික, හැඟීම් පාලනය, සහ ශුන්‍ය-ෂොට් හඬ ක්ලෝන සමග ඊළඟ පරම්පරාව බහුභාෂා TTS.

භාෂා: en, zh, ja, ko, de, es, fr, it, ru

හඬ ක්ලෝන කරන්න

NAMAA Saudi TTSNAMAA Saudi TTS

පළමු විවෘත සවුදි අරාබි TTS. Chatterbox-ගුණාත්මක හඬ ක්ලෝන සමග ස්වදේශීය සවුදි භාෂාව.

භාෂා: ar

හඬ ක්ලෝන කරන්න

Darwin TTSDarwin TTS

Qwen3-1.7B භාෂා ආකෘතිය මඟින් FFN බර සහිතව ක්‍රමාංකනය කරන ලද Qwen3-TTS වර්ගය වඩාත් තීව්‍ර බහුභාෂා ක්ලෝන කිරීම සඳහා මිශ්‍ර කර ඇත.

භාෂා: en, ko, ja, zh

හඬ ක්ලෝන කරන්න

MOSS-TTSDMOSS-TTSD

බහු-කථික සංවාදය දිගටම ආකෘතිය - දක්වා5කථිකයන් හා 60 මිනිත්තු සමගාමී ශ්‍රව්‍ය සමග පොඩ්කාස්ට්-ශෛලිය සංවාදයක් ජනනය.

භාෂා: en, zh

හඬ ක්ලෝන කරන්න

Ming-Omni TTSMing-Omni TTS

0.5B සම්මත-මෝඩල් කථා ආකෘතිය ඉහළ විශ්වාසනීයත්වය 44.1kHz ප්රතිදානය සහ ශුන්‍ය-ෂොට් හඬ ක්ලෝන කිරීම සමග inclusionAI සිට සංයුක්ත.

භාෂා: en, zh

හඬ ක්ලෝන කරන්න

MOSS-TTS NanoMOSS-TTS Nano

100M MOSS-TTS විකල්පය - සමාන ගෘහ නිර්මාණ ශිල්පය, 80x කුඩා, නිදහස්-පන්තියේ ප්‍රමාදයක්.

භාෂා: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

හඬ ක්ලෝන කරන්න

සංවර්ධක- පළමු API

OpenAI අනුකූල REST API. එක් අවසන් ස්ථානයක්, 22+ ආකෘති. සැබෑ-කාලීන යෙදුම් සඳහා ප් රවාහනය සහාය.

  • OpenAI අනුකූල සංයුතිය
  • සත්‍ය කාලීන යෙදුම් සඳහා TTS ප්රවාහනය
  • විශාල වැඩ සඳහා බැච් සැකසීම
  • Webhook දැනුම්දීම්
API ලේඛන බලන්න
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

සරල, විනිවිද මිල ගණන්

නිදහස් ආරම්භ කරන්න. ඔබ වර්ධනය ලෙස පරිමාණය.

නිදහස්

$0

15,000 අක්ෂර + 5,000/දින

  • Kokoro ඇතුළු 7නිදහස් ආකෘති
  • පරම්පරාවකට අකුරු 5,000
  • API ප්රවේශය ඇතුළත්
නොමිලේ ලියාපදිංචි

ආරම්භකයා

$9/මිනිත්තු

500 ණය / මාස

  • සියලු 22+ ආකෘති
  • පරම්පරාවකට අකුරු 100,000
  • හඬ ක්ලෝන කිරීම
ආරම්භ කරන්න
ජනප්‍රියම

ප්‍රො

$29/මිනිත්තු

2,000 ණය / මාස

  • ආරම්භකයේ ඇති සියල්ල
  • API පිවිසුම
  • ප්‍රමුඛතාව සැකසීම
වෘත්තීය ලබා ගන්න

ව්යාපාර

$99/මිනිත්තු

10,000 ණය / මාස

  • හැම දෙයක්ම Pro
  • තොග API
  • ප්‍රමුඛතා පෙළ
ව්යාපාර ලබා ගන්න

ණය පැකේජ ඇතුළු සියලු සැලසුම් බලන්න →

නිතර අසන ප්රශ්න

TTS.ai වඩාත් පුළුල් AI හඬ වේදිකාව, 22+ පෙළ-කතා ආකෘති, හඬ ක්ලෝන, කථා-පෙළ, සහ ශ්රව්ය මෙවලම් ලබා දෙයි. සියලුම ආකෘති කිසිදු විකුණුම්කරු අගුලු සමග විවෘත මූලාශ්රය වේ.

ඔව්! TTS.ai Kokoro සමග නොමිලේ පෙළ-කතා ඉදිරිපත් කරයි, Piper, VITS, සහ MeloTTS ආකෘති. ගිණුමක් අවශ්ය නැත. ලබා ගැනීමට ලියාපදිංචි වන්න 15 නොමිලේ ණය සහ සියලු ආකෘති ප්රවේශ. ගෙවන සැලසුම් $9/month දී ආරම්භ.

වේගය සඳහා, Kokoro හෝ Piper භාවිතා කරන්න. ගුණාත්මක සඳහා, CosyVoice2හෝ StyleTTS2හෝ භාවිතා කරන්න. හඬ ක්ලෝන කිරීම සඳහා, Chatterbox හෝ GPT-SoVITS භාවිතා කරන්න. සංවාදය සඳහා, Dia TTS භාවිතා කරන්න. සසඳා බැලීමට එකම පෙළ මත බහු ආකෘති උත්සාහ කරන්න.

ඔව්. TTS සඳහා OpenAI-සමකල හැකි REST API, STT, හඬ ක්ලෝන කිරීම සහ ශ්රව්ය මෙවලම්. නිදහස් ඇතුළු සෑම සැලැස්මකම ඇතුළත්, ස්ථරය විසින් පරිමාණය කරන අනුපාත සීමා සමඟ (නිදහස්: 10 req / min, Lite: 20, ආරම්භක: 30, Pro: 60, ව්යාපාර: 300). tts.ai/api/ හි ලේඛන බලන්න.

හඬ ගුණාත්මකභාවය ආකෘතිය අනුව වෙනස් වේ. CosyVoice වැනි වාරික ආකෘති2, StyleTTS2, සහ Chatterbox ස්වභාවික intonation හා හැඟීම් සමග ආසන්න-මානව ගුණාත්මක භාවය කථාව නිෂ්පාදනය. Kokoro වැනි නිදහස් ආකෘති බොහෝ භාවිතය නඩු සඳහා විශිෂ්ට ගුණාත්මක ඉදිරිපත් කරයි.

TTS.ai එහි ආකෘතිය පුස්තකාලය පුරා 30+ භාෂා සහාය. ඉංග්රීසි පුළුල්තම ආකෘතිය සහාය ඇත, නමුත් CosyVoice වැනි ආකෘති2චීන, ජපන්, සහ කොරියානු ආවරණය; GPT-SoVITS චීන, ජපන්, කොරියානු, සහ ඉංග්රීසි හැසිරවීම; සහ MeloTTS ඉංග්රීසි, ස්පාඤ්ඤ, ප්රංශ, චීන, ජපන්, සහ කොරියානු සහාය.

ඔව්. සියලු සැකසුම් අපගේ කැප GPU සේවාදායක මත සිදු වේ. අපි භාරදීමෙන් පසු ඔබේ පෙළ ආදාන හෝ ජනනය ශ්රව්ය ගබඩා කරන්නේ නැහැ. ක්ලෝන සඳහා උඩුගත හඬ සාම්පල වත්මන් සැසිය සඳහා පමණක් භාවිතා වන අතර, රඳවා නොමැත. අපි තෙවන පාර්ශවයන් සමඟ ඔබේ දත්ත හුවමාරු හෝ ආකෘති පුහුණු කිරීමට එය භාවිතා කරන්නේ නැහැ.

ඔව්. TTS.ai මත ජනනය කරන ලද සියලු ශ්රව්ය වාණිජමය ලෙස භාවිතා කිරීමට ඔබේ ය, YouTube වීඩියෝ සඳහා ඇතුළු, පොඩ්කාස්ට්, ශ්රව්ය පොත්, යෙදුම්, දැන්වීම්, සහ නිෂ්පාදන. අපගේ ආකෘති ඉඩ බලපත්ර යටතේ විවෘත මූලාශ්රය වේ (MIT, Apache 2.0). කිසිදු රාජකීයතා හෝ හිමිකම් අවශ්ය.

TTS.ai උපරිම ගුණාත්මකභාවය සඳහා පෙරනිමියෙන් WAV ආකෘතිය ශ්රව්ය ජනනය. ඔබ MP3 බවට පරිවර්තනය කළ හැකිය, FLAC, OGG, හෝ M4A අපගේ නිදහස් ශ්රව්ය Converter මෙවලම භාවිතා. මෙම API ඉල්ලීම ඔබේ ප්රියතම ප්රතිදානය ආකෘතිය සෘජුවම සඳහන් සහාය.

ඔබ ක්ලෝන කිරීමට අවශ්ය හඬ කෙටි ශ්රව්ය සාම්පලයක් (අඩු ලෙස5තත්පර) උඩුගත, ඉන්පසු එම හඬ කථාව ජනනය කිරීමට ඕනෑම පෙළ වර්ග. Chatterbox වැනි ආකෘති, GPT-SoVITS, හා CosyVoice2හඬ ක්ලෝන සහාය. ක්ලෝන හඬ ටෝන් අල්ලා, උච්චාරණය, හා කතා ශෛලිය.

නිදහස් ආකෘති (Kokoro, Piper, VITS, MeloTTS) කිසිදු ගිණුමක් අවශ්ය හා ශුන්‍ය ණය වියදම. සම්මත ආකෘති (2 ණය / 1K අක්ෂර) බර්ක් ඇතුළත්, CosyVoice2, F5-TTS, හා Dia. ප් රදාන ආකෘති (4 ණය / 1K අක්ෂර) OpenVoice ඇතුළත්, Chatterbox, StyleTTS2, හා Tortoise. ගෙවන ආකෘති සාමාන්යයෙන් ඉහළ ගුණාත්මක බවින්, වැඩි හඬ, හා හඬ ක්ලෝන වැනි අමතර විශේෂාංග ලබා.

ඔව්. මෙම API කථාව පෙළ විශාල පරිමාණ පරිවර්තනය සඳහා කණ්ඩායම් සැකසීම සහාය. බහු ඉල්ලීම් ඉදිරිපත් හා රැකියා UUIDs භාවිතා කරමින් අසමකාලීනව ප්රතිඵල ලබා ගන්න. ව්යාපාර සැලැස්ම ($99/mo) හා ඉහළ වේගවත් කණ්ඩායම් සැකසීම සඳහා ප්රමුඛතාවය පේලි ප්රවේශය ඇතුළත්. ශ්රව්ය පොත් නිෂ්පාදනය සඳහා පරිපූර්ණ, පාඨමාලාව අන්තර්ගතය, සහ විශාල ප්රමාණයක් voiceover ව්යාපෘති.
4.1/5 (42)

අපි වැඩි දියුණු කළ හැකි දේ? ඔබේ ප්රතිචාරය අපට ගැටළු විසඳීමට උපකාරී වේ.

අද AI හඬ භාවිතා ආරම්භ

නිර්මාණකරුවන් එක්වන්න, සංවර්ධකයින්, සහ ව්යාපාර භාවිතා TTS.ai