නිදහස් AI පෙළ සිට කථාවName

31+ විවෘත මූලාශ්රය ආකෘති, 231+ හඬවල්, 34+ භාෂා. ගිණුමක් අවශ්ය නැත.

8K+
නිර්මාණකරුවන්
32K+
පරම්පරා
31+
AI ආකෘති
231+
හඬ
0/500 අකුරු · Sign up for 5,000 per generation → නිදහස්
TTS.ai ආදරය? ඔබේ මිතුරන්ට කියන්න!

හඬ AI සඳහා ඔබට අවශ්ය සියලු

30+ විවෘත මූලාශ්රය AI ආකෘති මගින් බලගැන්වෙන මෙවලම්

31+ AI හඬ ආකෘති

එක් වේදිකාවක් තුළ විවෘත මූලාශ්රය TTS ආකෘති වඩාත් පුළුල් එකතුව

KokoroKokoro Free

Kokoro යනු එහි බර පන්තියට වඩා හොඳින් පීඩනය කරන 82 මිලියන පරාමිතික පෙළ-කථා ආකෘතියකි. එහි කුඩා ප් රමාණයට පටහැනිව, එය විශිෂ්ට ස්වාභාවික හා ප් රකාශාත්මක කථාව නිපදවයි. Kokoro ඉංග් රීසි, ජපන්, චීන, සහ කොරියානු ඇතුළු විවිධ භාෂා සඳහා සහාය දක්වයි. එය අතිශයින් වේගවත්ව ක් රියාත්මක වේ - GPU මත සැබෑ කාලයට වඩා 100x වේගයෙන් ශ් රව් ය ජනනය කරයි.

සඳහා හොඳම: අවම ප්රමාදයක් සහිත උසස් තත්ත්වයේ TTS, ප්රවාහ යෙදුම්

නිදහස් උත්සාහ කරන්න

PiperPiper Free

Piper යනු VITS සහ larynx ගෘහ නිර්මාණ ශිල්ප භාවිතා කරන Rhasspy විසින් සංවර්ධනය කරන ලද සැහැල්ලු පෙළ-කථා එන්ජිමකි. එය සම්පූර්ණයෙන්ම CPU මත ධාවනය වන අතර, එය අගල් උපාංග, ගෘහ ස්වයංක් රීයකරණ සහ ඔෆ්ලයින් TTS අවශ් ය වන යෙදුම් සඳහා පරිපූර්ණ කරයි. 30+ භාෂා හරහා 100 හඬවල් කට වඩා වැඩි, Piper රාස්ප්බෙරි පයි මත පවා තත්පරයට ස්වභාවික හඬක් ඇති කථාව ලබා දෙයි4.

සඳහා හොඳම: ඉක්මන් පූර්‍වදසුන, පිවිසුම් හැකියාව, සහ තිළැලි යෙදුම්Name

නිදහස් උත්සාහ කරන්න

VITSVITS Free

VITS (අවසන්-අවසන් පෙළ-කථාව සඳහා විරුද්ධාභාස ඉගෙනීම සමග විචලනය උපකල්පනය) වත්මන් අදියර දෙකක් ආකෘති වඩා ස්වභාවික ශබ්ද ශ්රව්ය ජනනය කරන සමාන්තර අවසන්-අවසන් TTS ක්රමයකි. එය ස්වභාවිකත්වය සැලකිය යුතු දියුණුවක් ලබා ගැනීම සඳහා, සාමාන්යකරණය ප්රවාහයන් හා විරුද්ධාභාස පුහුණු ක්රියාවලිය සමග වැඩි දියුණු කරන ලද විචලනය උපකල්පනය අනුගමනය කරයි.

සඳහා හොඳම: ස්වභාවික කටහඬ සහිත පොදු අරමුණු පෙළ- සිට- කථාවName

නිදහස් උත්සාහ කරන්න

MeloTTSMeloTTS Free

MyShell.ai විසින් MeloTTS ඉංග්රීසි සහාය බහුභාෂා TTS පුස්තකාලයක් (ඇමරිකානු, බ්‍රිතාන්‍ය, ඉන්දියානු, ඕස්ට් රේලියානු), ස්පාඤ්ඤ, ප්රංශ, චීන, ජපන්, සහ කොරියානු. එය ඉතා වේගවත්, CPU පමණක් මත සමීප තත්කාලීන වේගයෙන් පෙළ සැකසීම. MeloTTS නිෂ්පාදනය භාවිතා කිරීම සඳහා නිර්මාණය කර ඇති අතර CPU සහ GPU නිගමනය දෙකම සහාය.

සඳහා හොඳම: වේගවත්, බහුභාෂා TTS අවශ්ය නිෂ්පාදන යෙදුම්

නිදහස් උත්සාහ කරන්න

OuteTTSOuteTTS Free

OuteTTS මූලික ගෘහ නිර්මාණ ශිල්පය ආරක්ෂා කරමින් පෙළ-කථාව හැකියාවන් සමග විශාල භාෂා ආකෘති දීර්ඝ කරයි. එය llama.cpp (CPU / GPU) ඇතුළු බහු backends සහාය, හග් ෆේස් ට් රාන්ස්ෆෝමර්ස්, ExLlamaV2, VLLM, සහ Transformers.js හරහා බ්රවුසරයේ නිගමනය පවා.

සඳහා හොඳම: Edge යෙදවීම, බ්රවුසර-පාදක TTS, අඩු සම්පත් පරිසර

නිදහස් උත්සාහ කරන්න

Pocket TTSPocket TTS Free

Kyutai විසින් පොකට් TTS (Moshi නිර්මාණකරුවන්) එහි බර ඉක්මවා යන සංයුක්ත 100M පරාමිතික පෙළ-කථා ආකෘතියකි. එය CPU මත කාර්යක්ෂමව ක් රියාත්මක වන අතර, තනි ශ්රව්ය සාම්පලයකින් ශුන්‍ය-ෂොට් හඬ ක්ලෝන කිරීම සහ ස්වාභාවික හඬක් ඇති කථාව නිපදවයි. කුඩා ආකෘති ප් රමාණයෙන් එය අගුළු දැමීම සහ අඩු සම්පත් පරිසර සඳහා පරිපූර්ණ වේ.

සඳහා හොඳම: සැහැල්ලු යෙදවීම, CPU-එකම පරිසර, ඉක්මන් හඬ ක්ලෝන

නිදහස් උත්සාහ කරන්න

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

සඳහා හොඳම: Fast lightweight TTS, edge deployment, low-latency applications

නිදහස් උත්සාහ කරන්න

BarkBark Standard

පරිවර්තනය මත පදනම් වූ ලේඛන-ශ්‍රවණ ආකෘතිය, යථාර්ථවාදී කථාව, සංගීතය සහ ශබ්ද බලපෑම් ජනනය කරයි.

සංවර්‍ධක: Suno · බලපත්‍රය: MIT

උත්සහ කරන්න.

Bark SmallBark Small Standard

සරල රේඛීය ශ්‍රිතයක් සරල රේඛීය ශ්‍රිතයක් හා අඩු ශ්‍රිතයක් ලෙසද හැඳින්වේ.

සංවර්‍ධක: Suno · බලපත්‍රය: MIT

උත්සහ කරන්න.

CosyVoice 2CosyVoice 2 Standard

අලිබාබාගේ පරිමාණගත ශ්‍රව්‍ය-දෘශ්‍ය TTS මානව-පාරිශුද්ධ ස්වභාවය සහ ශුන්‍ය ආසන්න පරතරය සමග.

සංවර්‍ධක: Alibaba (Tongyi Lab) · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

Dia TTSDia TTS Standard

සන්නිවේදන ක්‍රමවේදයන්ගේ සංකීර්ණතාවය නිසා විවිධ සංස්කෘතීන් අතර සංවාදයන් ඇති වේ.

සංවර්‍ධක: Nari Labs · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

Parler TTSParler TTS Standard

ස්වභාවික භාෂාවෙන් ඔබට අවශ්ය හඬ විස්තර සහ Parler ගැලපෙන කථාව ජනනය කරයි.

සංවර්‍ධක: Hugging Face · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

GLM-TTSGLM-TTS Standard

ටෙස්ට් ක්‍රිකට් ඉතිහාසයේ අඩුම ලකුණු ලබාගත් පිතිකරුවා ලෙසින් වාර්තාවක් තබයි.

සංවර්‍ධක: Zhipu AI · බලපත්‍රය: GLM-4 License

උත්සහ කරන්න.

IndexTTS-2IndexTTS-2 Standard

ඝන-අංශු හැඟීම් පාලනය සහ ඉහළ ප්‍රකාශනශීලීත්වය සමග ශුන්‍ය-ෂොට් TTS.

සංවර්‍ධක: Index Team · බලපත්‍රය: Bilibili Model License

උත්සහ කරන්න.

Spark TTSSpark TTS Standard

හඬ ක්ලෝන TTS පාලනය කළ හැකි හැඟීම් සහ ඉල්ලීම් හරහා කතා ශෛලිය.

සංවර්‍ධක: SparkAudio · බලපත්‍රය: CC BY-NC-SA 4.0

උත්සහ කරන්න.

GPT-SoVITSGPT-SoVITS Standard

හුදෙක් ශ්රව්ය තත්පර5ක ඕනෑම හඬක් අනුපිටපත් කරන හඬ කිහිපයක්-ෂොට් ක්ලෝන TTS.

සංවර්‍ධක: RVC-Boss · බලපත්‍රය: MIT

උත්සහ කරන්න.

OrpheusOrpheus Standard

100000 කට අධික සංඛ්‍යාවක මනෝවිද්‍යාත්මක දත්ත මත පදනම්ව සකස් කරන ලද මානව මට්ටමේ හැඟීම් සන්නිවේදන ආකෘතියකි.

සංවර්‍ධක: Canopy Labs · බලපත්‍රය: Llama 3.2 Community

උත්සහ කරන්න.

Qwen3 TTSQwen3 TTS Standard

හඬ ක්ලෝන, පෙරනිමි හඬ, සහ පෙළ සිට හඬ සැලසුම් සමග අලිබාබා බහුභාෂා TTS.

සංවර්‍ධක: Alibaba (Qwen) · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

Chatterbox TurboChatterbox Turbo Standard

සිනහව සඳහා උප-200ms කල් ඉකුත්වීම සහ paralinguistic ටැග් සමග වේගවත් Chatterbox, කැස්ස, සහ තවත්.

සංවර්‍ධක: Resemble AI · බලපත්‍රය: MIT

උත්සහ කරන්න.

Dia 2Dia 2 Standard

1.සංවාදාත්මක සන්නිවේදනය - සංවාදාත්මක සන්නිවේදනය යනු සන්නිවේදනය හා සංවාදය අතර ඇති සම්බන්ධතාවයයි.

සංවර්‍ධක: Nari Labs · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

VoxCPMVoxCPM Standard

Tokenizer-නිදහස් TTS 44.1kHz ශ්රව්ය සන්දර්භය-දැනුවත් පරිච්ඡේදය සමග අනුකූලතාවයක් නිෂ්පාදනය.

සංවර්‍ධක: OpenBMB · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

TADATADA Standard

ශුන්‍ය-හීනමාන TTS පෙළ-ශබ්ද ද්විත්ව අනුකූලතාවය සමග, 5x සසඳන LLM TTS වඩා වේගවත්.

සංවර්‍ධක: Hume AI · බලපත්‍රය: MIT

උත්සහ කරන්න.

VibeVoiceVibeVoice Standard

මයික්‍රොසොෆ්ට් ආකෘතිය පොඩ්කාස්ට් සහ ශ්‍රව්‍ය පොත් වැනි දිගු ආකෘති බහු-කථික අන්තර්ගතය සඳහා.

සංවර්‍ධක: Microsoft · බලපත්‍රය: MIT

උත්සහ කරන්න.

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

සංවර්‍ධක: Alibaba (FunAudioLLM) · බලපත්‍රය: Apache 2.0

උත්සහ කරන්න.

ChatterboxChatterbox Premium

මනෝවිද්‍යාවේදී, මනෝවිශ්ලේෂණය යනු මනෝවිද්‍යාවේ මනෝවිද්‍යාව පිළිබඳ අධ්‍යයනයයි.

තත්ත්ව:

උත්සහ කරන්න.

Tortoise TTSTortoise TTS Premium

ව්‍යවහාරික භාෂා විද්‍යාව යනු භාෂාවන්හි ව්‍යවහාරික ගුණාංග පිළිබඳ අධ්‍යයනයයි.

තත්ත්ව:

උත්සහ කරන්න.

StyleTTS 2StyleTTS 2 Premium

මනෝවිද්‍යාව යනු මනෝවිද්‍යාවේ හා මනෝවිද්‍යාව සම්බන්ධ විෂය ක්ෂේත්‍රයකි.

තත්ත්ව:

උත්සහ කරන්න.

OpenVoiceOpenVoice Premium

ශෛලිය, හැඟීම්, සහ උච්චාරණය මත කැටිති පාලනය සමග ක්ෂණික හඬ ක්ලෝන.

තත්ත්ව:

උත්සහ කරන්න.

Sesame CSMSesame CSM Premium

ස්වභාවික සංසිද්ධි හා සංකල්ප අතර ඇති සම්බන්ධතාවය තේරුම් ගැනීමේ දී මනෝවිද්‍යාව වැදගත් වේ.

තත්ත්ව:

උත්සහ කරන්න.

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

තත්ත්ව:

උත්සහ කරන්න.

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

තත්ත්ව:

උත්සහ කරන්න.

CosyVoice 2CosyVoice 2

අලිබාබාගේ පරිමාණගත ශ්‍රව්‍ය-දෘශ්‍ය TTS මානව-පාරිශුද්ධ ස්වභාවය සහ ශුන්‍ය ආසන්න පරතරය සමග.

භාෂා: en, zh, ja, ko, fr, de, it, es

හඬ ක්ලෝන කරන්න

GLM-TTSGLM-TTS

ටෙස්ට් ක්‍රිකට් ඉතිහාසයේ අඩුම ලකුණු ලබාගත් පිතිකරුවා ලෙසින් වාර්තාවක් තබයි.

භාෂා: en, zh

හඬ ක්ලෝන කරන්න

IndexTTS-2IndexTTS-2

ඝන-අංශු හැඟීම් පාලනය සහ ඉහළ ප්‍රකාශනශීලීත්වය සමග ශුන්‍ය-ෂොට් TTS.

භාෂා: en, zh

හඬ ක්ලෝන කරන්න

Spark TTSSpark TTS

හඬ ක්ලෝන TTS පාලනය කළ හැකි හැඟීම් සහ ඉල්ලීම් හරහා කතා ශෛලිය.

භාෂා: en, zh

හඬ ක්ලෝන කරන්න

GPT-SoVITSGPT-SoVITS

හුදෙක් ශ්රව්ය තත්පර5ක ඕනෑම හඬක් අනුපිටපත් කරන හඬ කිහිපයක්-ෂොට් ක්ලෝන TTS.

භාෂා: en, zh, ja, ko

හඬ ක්ලෝන කරන්න

ChatterboxChatterbox

මනෝවිද්‍යාවේදී, මනෝවිශ්ලේෂණය යනු මනෝවිද්‍යාවේ මනෝවිද්‍යාව පිළිබඳ අධ්‍යයනයයි.

භාෂා: en

හඬ ක්ලෝන කරන්න

Tortoise TTSTortoise TTS

ව්‍යවහාරික භාෂා විද්‍යාව යනු භාෂාවන්හි ව්‍යවහාරික ගුණාංග පිළිබඳ අධ්‍යයනයයි.

භාෂා: en

හඬ ක්ලෝන කරන්න

OpenVoiceOpenVoice

ශෛලිය, හැඟීම්, සහ උච්චාරණය මත කැටිති පාලනය සමග ක්ෂණික හඬ ක්ලෝන.

භාෂා: en, zh, ja, ko, fr, de, es, it

හඬ ක්ලෝන කරන්න

Qwen3 TTSQwen3 TTS

හඬ ක්ලෝන, පෙරනිමි හඬ, සහ පෙළ සිට හඬ සැලසුම් සමග අලිබාබා බහුභාෂා TTS.

භාෂා: en, zh, ja, ko, de, fr, ru, pt, es, it

හඬ ක්ලෝන කරන්න

Chatterbox TurboChatterbox Turbo

සිනහව සඳහා උප-200ms කල් ඉකුත්වීම සහ paralinguistic ටැග් සමග වේගවත් Chatterbox, කැස්ස, සහ තවත්.

භාෂා: en

හඬ ක්ලෝන කරන්න

VoxCPMVoxCPM

Tokenizer-නිදහස් TTS 44.1kHz ශ්රව්ය සන්දර්භය-දැනුවත් පරිච්ඡේදය සමග අනුකූලතාවයක් නිෂ්පාදනය.

භාෂා: en, zh

හඬ ක්ලෝන කරන්න

OuteTTSOuteTTS

LLM-පාදක TTS CPU, GPU, හෝ lama.cpp සහ Transformers.js හරහා බ්‍රව්සරයේ ධාවනය වේ.

භාෂා: en

හඬ ක්ලෝන කරන්න

Pocket TTSPocket TTS

100M පරාමිති ආකෘතිය Kyutai විසින් තනි සාම්පලයකින් හඬ ක්ලෝන කිරීම.

භාෂා: en, fr

හඬ ක්ලෝන කරන්න

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

භාෂා: en, zh, ja, ko, de, es, fr, it, ru

හඬ ක්ලෝන කරන්න

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

භාෂා: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

හඬ ක්ලෝන කරන්න

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

භාෂා: en, zh

හඬ ක්ලෝන කරන්න

සංවර්ධක- පළමු API

OpenAI අනුකූල REST API. එක් අවසන් ස්ථානයක්, 22+ ආකෘති. සැබෑ-කාලීන යෙදුම් සඳහා ප් රවාහනය සහාය.

  • OpenAI අනුකූල සංයුතිය
  • සත්‍ය කාලීන යෙදුම් සඳහා TTS ප්රවාහනය
  • විශාල වැඩ සඳහා බැච් සැකසීම
  • Webhook දැනුම්දීම්
API ලේඛන බලන්න
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

සරල, විනිවිද මිල ගණන්

නිදහස් ආරම්භ කරන්න. ඔබ වර්ධනය ලෙස පරිමාණය.

නිදහස්

$0

15 ණය

  • Kokoro, Piper, VITS, MeloTTS
  • අකුරු සීමා 500
  • 3 gen / පැය (ගැණුම්කරුවන් නැත)
නොමිලේ ලියාපදිංචි

ආරම්භකයා

$9/මිනිත්තු

500 ණය / මාස

  • සියලු 22+ ආකෘති
  • පරම්පරාවකට අකුරු 100,000
  • හඬ ක්ලෝන කිරීම
ආරම්භ කරන්න
ජනප්‍රියම

ප්‍රො

$29/මිනිත්තු

2,000 ණය / මාස

  • ආරම්භකයේ ඇති සියල්ල
  • API පිවිසුම
  • ප්‍රමුඛතාව සැකසීම
වෘත්තීය ලබා ගන්න

ව්යාපාර

$99/මිනිත්තු

10,000 ණය / මාස

  • හැම දෙයක්ම Pro
  • තොග API
  • ප්‍රමුඛතා පෙළ
ව්යාපාර ලබා ගන්න

ණය පැකේජ ඇතුළු සියලු සැලසුම් බලන්න →

නිතර අසන ප්රශ්න

TTS.ai වඩාත් පුළුල් AI හඬ වේදිකාව, 22+ පෙළ-කතා ආකෘති, හඬ ක්ලෝන, කථා-පෙළ, සහ ශ්රව්ය මෙවලම් ලබා දෙයි. සියලුම ආකෘති කිසිදු විකුණුම්කරු අගුලු සමග විවෘත මූලාශ්රය වේ.

ඔව්! TTS.ai Kokoro සමග නොමිලේ පෙළ-කතා ඉදිරිපත් කරයි, Piper, VITS, සහ MeloTTS ආකෘති. ගිණුමක් අවශ්ය නැත. ලබා ගැනීමට ලියාපදිංචි වන්න 15 නොමිලේ ණය සහ සියලු ආකෘති ප්රවේශ. ගෙවන සැලසුම් $9/month දී ආරම්භ.

වේගය සඳහා, Kokoro හෝ Piper භාවිතා කරන්න. ගුණාත්මක සඳහා, CosyVoice2හෝ StyleTTS2හෝ භාවිතා කරන්න. හඬ ක්ලෝන කිරීම සඳහා, Chatterbox හෝ GPT-SoVITS භාවිතා කරන්න. සංවාදය සඳහා, Dia TTS භාවිතා කරන්න. සසඳා බැලීමට එකම පෙළ මත බහු ආකෘති උත්සාහ කරන්න.

ඔව්. TTS සඳහා OpenAI-සමකල හැකි REST API, STT, හඬ ක්ලෝන, සහ ශ්රව්ය මෙවලම්. Pro ($29/mo) සහ Enterprise ($99/mo) සැලසුම් මත ලබා ගත හැකිය. tts.ai/api/ හි ලේඛන බලන්න.

හඬ ගුණාත්මකභාවය ආකෘතිය අනුව වෙනස් වේ. CosyVoice වැනි වාරික ආකෘති2, StyleTTS2, සහ Chatterbox ස්වභාවික intonation හා හැඟීම් සමග ආසන්න-මානව ගුණාත්මක භාවය කථාව නිෂ්පාදනය. Kokoro වැනි නිදහස් ආකෘති බොහෝ භාවිතය නඩු සඳහා විශිෂ්ට ගුණාත්මක ඉදිරිපත් කරයි.

TTS.ai එහි ආකෘතිය පුස්තකාලය පුරා 30+ භාෂා සහාය. ඉංග්රීසි පුළුල්තම ආකෘතිය සහාය ඇත, නමුත් CosyVoice වැනි ආකෘති2චීන, ජපන්, සහ කොරියානු ආවරණය; GPT-SoVITS චීන, ජපන්, කොරියානු, සහ ඉංග්රීසි හැසිරවීම; සහ MeloTTS ඉංග්රීසි, ස්පාඤ්ඤ, ප්රංශ, චීන, ජපන්, සහ කොරියානු සහාය.

ඔව්. සියලු සැකසුම් අපගේ කැප GPU සේවාදායක මත සිදු වේ. අපි භාරදීමෙන් පසු ඔබේ පෙළ ආදාන හෝ ජනනය ශ්රව්ය ගබඩා කරන්නේ නැහැ. ක්ලෝන සඳහා උඩුගත හඬ සාම්පල වත්මන් සැසිය සඳහා පමණක් භාවිතා වන අතර, රඳවා නොමැත. අපි තෙවන පාර්ශවයන් සමඟ ඔබේ දත්ත හුවමාරු හෝ ආකෘති පුහුණු කිරීමට එය භාවිතා කරන්නේ නැහැ.

ඔව්. TTS.ai මත ජනනය කරන ලද සියලු ශ්රව්ය වාණිජමය ලෙස භාවිතා කිරීමට ඔබේ ය, YouTube වීඩියෝ සඳහා ඇතුළු, පොඩ්කාස්ට්, ශ්රව්ය පොත්, යෙදුම්, දැන්වීම්, සහ නිෂ්පාදන. අපගේ ආකෘති ඉඩ බලපත්ර යටතේ විවෘත මූලාශ්රය වේ (MIT, Apache 2.0). කිසිදු රාජකීයතා හෝ හිමිකම් අවශ්ය.

TTS.ai උපරිම ගුණාත්මකභාවය සඳහා පෙරනිමියෙන් WAV ආකෘතිය ශ්රව්ය ජනනය. ඔබ MP3 බවට පරිවර්තනය කළ හැකිය, FLAC, OGG, හෝ M4A අපගේ නිදහස් ශ්රව්ය Converter මෙවලම භාවිතා. මෙම API ඉල්ලීම ඔබේ ප්රියතම ප්රතිදානය ආකෘතිය සෘජුවම සඳහන් සහාය.

ඔබ ක්ලෝන කිරීමට අවශ්ය හඬ කෙටි ශ්රව්ය සාම්පලයක් (අඩු ලෙස5තත්පර) උඩුගත, ඉන්පසු එම හඬ කථාව ජනනය කිරීමට ඕනෑම පෙළ වර්ග. Chatterbox වැනි ආකෘති, GPT-SoVITS, හා CosyVoice2හඬ ක්ලෝන සහාය. ක්ලෝන හඬ ටෝන් අල්ලා, උච්චාරණය, හා කතා ශෛලිය.

නිදහස් ආකෘති (Kokoro, Piper, VITS, MeloTTS) කිසිදු ගිණුමක් අවශ්ය හා ශුන්‍ය ණය වියදම. සම්මත ආකෘති (2 ණය / 1K අක්ෂර) බර්ක් ඇතුළත්, CosyVoice2, F5-TTS, හා Dia. ප් රදාන ආකෘති (4 ණය / 1K අක්ෂර) OpenVoice ඇතුළත්, Chatterbox, StyleTTS2, හා Tortoise. ගෙවන ආකෘති සාමාන්යයෙන් ඉහළ ගුණාත්මක බවින්, වැඩි හඬ, හා හඬ ක්ලෝන වැනි අමතර විශේෂාංග ලබා.

ඔව්. මෙම API කතා කිරීමට පෙළ විශාල පරිමාවක් පරිවර්තනය කිරීම සඳහා කණ්ඩායම් සැකසීම සහාය. බහු ඉල්ලීම් ඉදිරිපත් හා රැකියා UUIDs භාවිතා කරමින් සමමුහුර්තව ප්රතිඵල ලබා ගන්න. ව්යාපාර සැලසුම් ($99/mo) වේගවත් කණ්ඩායම් සැකසීම සඳහා ප්රමුඛතාවය පෝලිම ප්රවේශය ඇතුළත්. ශ්රව්ය පොත් නිෂ්පාදනය සඳහා පරිපූර්ණ, පාඨමාලාව අන්තර්ගතය, සහ විශාල ප්රමාණයක් voiceover ව්යාපෘති.
4.0/5 (22)

අපි වැඩි දියුණු කළ හැකි දේ? ඔබේ ප්රතිචාරය අපට ගැටළු විසඳීමට උපකාරී වේ.

අද AI හඬ භාවිතා ආරම්භ

නිර්මාණකරුවන් එක්වන්න, සංවර්ධකයින්, සහ ව්යාපාර භාවිතා TTS.ai