Report Bug / Feature Request

තත්පර තුළ ඕනෑම හඬක් ක්ලෝන්

හුදෙක් සදහන් ශ්රව්ය තත්පර5ක්ලෝන ඕනෑම හඬ. Chatterbox, CosyVoice2, GPT-SoVITS, සහ OpenVoice ඇතුළු9විවෘත මූලාශ්රය හඬ ක්ලෝන ආකෘති. කිසිදු පුහුණුව අවශ්ය ශූරතා ක්ලෝන - සාම්පලයක් උඩුගත හා වහාම කථාව ජනනය. සියලු ආකෘති වාණිජ බලපත්ර ලබා දී ඇත.

සැබෑ- කාලය 5-තත්පර සාම්පල 9 ක්ලෝන ආකෘති විවෘත මූලාශ්‍ර 17+ භාෂා හැඟීම් පාලනය

තත්කාලීන හඬ ක්ලෝනකරණ විශේෂාංග

රාජ්ය-of-the-art AI සමග ක්ෂණිකව ක්ලෝන් හඬ - කිසිදු පුහුණු, කිසිදු දත්ත, කිසිදු බලා

ශූන්‍ය- ෂොට් ක්ලෝන කිරීම

කිසිදු පුහුණුවක්, කිසිදු මනා-සංශෝධනය, කිසිදු දත්ත එකතුවක්. ශ්රව්ය තත්පර5පෝස්ට් හා වහාම ක්ලෝන හඬ ලබා ගන්න. AI සත්‍ය කාලීනව කථානායක ලක්ෂණ උපුටා.

9 ක්ලෝන ආකෘති

Chatterbox සිට තෝරා, CosyVoice2, GPT-SoVITS, OpenVoice, ස්පාර්ක්, IndexTTS-2, GLM-TTS, Qwen3-TTS, හා කුරුල්ලන්. එක් එක් ආකෘතිය ගුණාත්මක සඳහා විවිධ ශක්තිමත්, වේගය, හා භාෂාව.

ක්රෝස්- භාෂා ක්ලෝන කිරීම

ඉංග්රීසි හඬ ක්ලෝන හා චීන, ජපන්, කොරියානු, සහ තවත් කතා ජනනය. CosyVoice2සහ Qwen3-TTS හරහා හඬ අනන්යතාව පවත්වා 17+ භාෂා.

හැඟීම් පාලනය

Chatterbox, OpenVoice, සහ GLM-TTS හැඟීම්-සංවේදී පරම්පරාව සහාය. විවිධ හැඟීම් සමග එම පෙළ ජනනය - සතුටින්, දුක, තරහ, මුමුණමින් - ක්ලෝන හඬ තබා.

විවෘත මූලාශ්රය සහ වාණිජ

සෑම ක්ලෝන ආකෘතිය MIT හෝ Apache 2.0 බලපත්ර යටතේ විවෘත මූලාශ්රය වේ. කිසිදු රාජ්ය නොවන අන්තර්ගතය සඳහා වාණිජමය ක්ලෝන හඬ භාවිතා, නිෂ්පාදන, සහ යෙදුම්.

ක්ලෝන API

වැඩසටහන් හඬ ක්ලෝන කිරීම සඳහා REST API. උපුටා දැක්වීම ශ්රව්ය, පෙළ සඳහන්, සහ ක්ලෝන කතා ලැබේ. Python සහ JavaScript සඳහා SDKs. ඉහළ පරිමාව වැඩ ප්රවාහ සඳහා බැච් ක්ලෝන.

හඬ ක්ලෝන ආකෘති

සෑම ක්ලෝන භාවිතා කිරීම සඳහා9විවෘත මූලාශ්ර ආකෘති

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: හොඳම සමස්ත ගුණාත්මක - 5-තත්පර සාම්පල, හැඟීම් පාලනය, MIT බලපත්ර

උත්සහ කරන්න Chatterbox

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: හොඳම බහුභාෂා ක්ලෝන - චීන හරහා හඬ පවත්වා ගනී, ඉංග්රීසි, ජපන්, කොරියානු

උත්සහ කරන්න CosyVoice 2

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: හැඟීම් හා ශෛලිය මාරු සමග වේගවත් ටෝන් වර්ණ පරිවර්තනය

උත්සහ කරන්න OpenVoice

Spark TTSSpark TTS

Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Medium 4/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: වේගවත්ම ක්ලෝන ආකෘතිය - ~ 12 තත්පර ප්රතිඵල

උත්සහ කරන්න Spark TTS

IndexTTS-2IndexTTS-2

Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Medium 4/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: ඉහළ කථානායක සමානත්වය සමග විශිෂ්ට චීන-ඉංග්රීසි ක්ලෝන

උත්සහ කරන්න IndexTTS-2

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: ශ්රව්ය-ගුණාත්මක ප්රතිඵල - ශ්රව්ය පොත් සහ වාරික කථාව සඳහා හොඳම

උත්සහ කරන්න Tortoise TTS

රියල්-ටයිම් හඬ ක්ලෝන වැඩ කරන්නේ කෙසේද

කෙටි ශ්රව්ය සාම්පලයක් සිට සීමා රහිත ක්ලෝන කතා

1

උපුටාගැනීම් ශ්‍රව්‍ය

ඔබ ක්ලෝන් කිරීමට අවශ්ය හඬ සිට පැහැදිලි කථාව තත්පර 5-30 පටිගත හෝ උඩුගත කරන්න. WAV, MP3, හෝ ඔබේ බ්රවුසරය තුළ සෘජුවම වාර්තා.

2

ක්ලෝන ආකෘතිය තෝරන්න

ඔබේ අවශ්යතා ගැලපෙන ආකෘතිය තෝරන්න - ගුණාත්මක සඳහා Chatterbox, වේගය සඳහා ස්පාර්ක්, බහුභාෂා සඳහා CosyVoice2.

3

ඔබේ පෙළ ඇතුළත් කරන්න

ක්ලෝන හඬට කතා කිරීමට ඔබට අවශ්ය පෙළ යතුරු ලියනය කරන්න හෝ ඇලවීම. ආකෘතිය විසින් සහාය දක්වන ඕනෑම භාෂාවක් වැඩ කරයි.

4

බාගත කිරීම්

ක්ලික් කරන්න උත්පාදනය සහ 10-25 තත්පර ඔබේ ක්ලෝන හඬ ඇසීමට. වහාම භාවිතා කිරීම සඳහා WAV හෝ MP3 ලෙස බාගත.

ශූරතාවය-ෂොට් හඬ ක්ලෝන වැඩ කරන්නේ කෙසේද

කිසිදු මනා-සංශෝධනය, කිසිදු දත්ත එකතුවක් - පමණක් උඩුගත හා ක්ලෝන්

කථානායක embedding වෙන්කර ගැනීම

මෙම AI කථානායක embedding උපුටා ගැනීමට ඔබේ උපුටා ශ්රව්ය විශ්ලේෂණය - පන්දු ඇතුළු හඬේ සුවිශේෂී ලක්ෂණ සංයුක්ත ගණිතමය නියෝජනය, timbre, කතා රිද්මය, සහ ශ්රව්ය ව්යුහය. මෙම යටතේ සිදු 1 තත්පර.

  • ශ්රව්ය තත්පර5ක් තරම් කුඩා ලෙස වැඩ
  • පීට්, ටිම්බර්, සහ කතා කරන ශෛලිය අල්ලා ගනී
  • පුහුණු හෝ හොඳින් ගැලපීම අවශ්ය නැත
  • ශ්‍රව්‍ය කිසිවිටෙකත් ස්ථිරව ගබඩා නොවේ

කොන්දේසිගත කථා සංස්ලේෂණයName

TTS ආකෘතිය කථානායක embedding මත කොන්දේසි නව කථාව ජනනය. ප්රතිඵලය ඔබේ පෙළ කියන උපුටා කථානායක වගේ සද්දෙ - ස්වභාවික prosody සමග, සුදුසු අවධාරණය, හා මුල් හඬ ගේ චරිතය ඕනෑම භාෂාවක් හෝ අන්තර්ගතය පුරා සංරක්ෂණය.

  • තනි සාම්පලයක් සිට සීමා රහිත කථාව ජනනය කරන්න
  • හරස්-භාෂා ක්ලෝන (උදාහරණයක් ලෙස භාෂා කතා නොකරයි)
  • හැඟීම් සහ ශෛලිය මාරු
  • තත්පර 10-25 ප්රතිඵල

හඬ ක්ලෝන ආකෘතිය සංසන්දනය

ඔබේ ක්ලෝන භාවිතය සඳහා සුදුසු ආකෘතිය තෝරන්න

ආකෘතිය අවම. උපුටා දැක්වීම වේගය ගුණාත්මකභාවය භාෂා හැඟීම බලපත්‍රය
Chatterbox 5s ~21s හොඳම EN MIT
CosyVoice 2 5s ~20s විශිෂ්ටයි CN, EN, JP, KO+ Apache 2.0
GPT-SoVITS 5s ~16s විශිෂ්ටයි CN, EN, JP, KO MIT
OpenVoice 5s ~15s හොඳයි ඉංග්රීසි, චීන, ස්පාඤ්ඤ, ප්‍රංශ + MIT
Spark TTS 5s ~12s හොඳයි CN, EN Apache 2.0
IndexTTS-2 5s ~18s විශිෂ්ටයි CN, EN Apache 2.0
GLM-TTS 5s ~25s විශිෂ්ටයි CN, EN Apache 2.0
Qwen3-TTS 5s ~16s විශිෂ්ටයි CN, EN, JP, KO+ Apache 2.0
Tortoise 15s ~60s ස්ටූඩියෝ EN Apache 2.0

ජනතාව සඳහා තත්කාලීන හඬ ක්ලෝන භාවිතා කරන්නේ කුමක්ද

අන්තර්ගත නිර්මාණය සිට ප්රවේශ වීම - හඬ ක්ලෝන කිරීම අවසන් නොවන අයදුම්පත් ඇත

ශ්‍රව්‍ය පොත් විස්තරය

කතුවරුන් ඔවුන්ගේම හඬ ක්ලෝන සහ පටිගත කිරීම් බූට් පැය ගත නොකර මුළු ශ්රව්ය පොත් ජනනය. නැවත පටිගත කිරීම වෙනුවට තනි වාක්‍ය පුනර්ජනනය කිරීමෙන් වැරදි සංස්කරණය කරන්න.

වීඩියෝ

CosyVoice2සහ Qwen3-TTS වැනි හුවමාරු භාෂා ආකෘති චීන, ඉංග්රීසි, ජපන් සහ කොරියානු හරහා හඬ අනන්යතාව පවත්වා ගනිමින්.

අන්තර්ගත නිර්මාණය

YouTubers, podcasters, සහ TikTok නිර්මාණකරුවන් අනුකූල වෙළඳ නාමකරණයක් සඳහා ඔවුන්ගේ හඬ ක්ලෝන කරයි. පටිගත කිරීමකින් තොරව නව අන්තර්ගතයන් සඳහා වොයිස් ඔවර්ස් ජනනය කරන්න, හෝ දැනට පවතින වීඩියෝවල විකල්ප භාෂා අනුවාද නිර්මාණය කරන්න.

පිවිසුම් හැකියාව

රෝග හෝ ශල්යකර්ම නිසා ඔවුන්ගේ හඬ අහිමි කර ඇති ජනතාව පැරණි පටිගත කිරීම් සිට ක්ලෝන කිරීමෙන් එය සංරක්ෂණය කළ හැකිය. ක්ලෝන හඬ ඔවුන්ට පෙළ-කථාව හරහා ඔවුන්ගේම හඬ සන්නිවේදනය කිරීමට ඉඩ දෙයි.

ක්රීඩා සංවර්ධනය

හඬ නළු ක්ලෝන් සහ ස්ටූඩියෝ කාලය සටහන් තැබීම තොරව සීමා රහිත සංවාද විචලනයන් ජනනය. සෑම රේඛාවක් නැවත පටිගත කිරීම ක්රියාත්මක නොවන ඉන්දීය ක්රීඩා, mods සඳහා පරිපූර්ණ, සහ මූලාකෘති.

IVR & දුරකථන පද්ධති

දුරකථන මෙනු සහ ස්වයංක්රීය ප්රතිචාර සඳහා ඔබේ සමාගම ප් රකාශකයා හඬ ක්ලෝන. හඬ නළුවෙකු වෙන්කර තොරව ක්ෂණිකව IVR ප්රශ්න යාවත්කාලීන - නව පෙළ පමණක් වර්ග හා ජනනය.

TTS.ai වෙනත් හඬ ක්ලෝන විසඳුම් එරෙහිව

ඇයි9ආකෘති තනි විවෘත මූලාශ්රය ව්යාපෘතිය පරාජය

විශේෂාංග TTS.ai SV2TTS ElevenLabs Resemble AI
ආකෘති ක්ලෝන කිරීම 9 1 1 1
අවම. උපුටාගැනීම් ශ්‍රව්‍ය 5 sec 5 sec 30 sec 3 min
පුහුණුව අවශ්ය නෑ නෑ නෑ ඔව්
ශ්රව්ය ගුණාත්මක (2025) ස්ටූඩියෝ- ශ්‍රේණිය දිනය විශිෂ්ටයි විශිෂ්ටයි
හැඟීම් පාලනය
ක්රෝස්- භාෂා ක්ලෝන කිරීම
විවෘත මූලාශ්‍ර
GPU අවශ්ය වේ වලාකුළ ඔව් වලාකුළ වලාකුළ
API පිවිසුම
නිදහස් ස්ථරය 15 ණය ස්ව- ධාරකය සීමාසහිත

හඬ ක්ලෝන API

අපේ REST API සමඟ වැඩසටහන්ගතව ක්ලෝන් හඬ

Python - හඬ ක්ලෝන කිරීම REST API
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")

# Clone a voice from a 5-second sample
result = client.clone_voice(
    name="My Cloned Voice",
    file="reference.wav",       # 5-30 seconds of clear speech
    model="chatterbox",         # or cosyvoice2, openvoice, spark...
    text="Hello! This is my cloned voice speaking new text.",
)

# Download the cloned audio
audio = client.poll_result(result.uuid)
with open("cloned_output.wav", "wb") as f:
    f.write(audio)
cURL — හඬ ක්ලෝන REST API
curl -X POST https://api.tts.ai/v1/voice-clone \
  -H "Authorization: Bearer sk-tts-YOUR_KEY" \
  -F "reference=@voice_sample.wav" \
  -F "text=This is my cloned voice." \
  -F "model=chatterbox"

හොඳම හඬ ක්ලෝන ප්රතිඵල සඳහා ඉඟි

මෙම පටිගත කිරීමේ මාර්ගෝපදේශ සමඟ වඩාත් නිවැරදි හඬ ක්ලෝන් ලබා ගන්න

නිහඬ පරිසරය

අවම පසුබිම් ශබ්ද සමග නිහඬ කාමරයේ පටිගත. AI පිරිසිදු ශ්රව්ය සිට හඬ ලක්ෂණ වඩා නිවැරදිව උපුටා.

තත්පර 10-30

5 තත්පර ක්රියා කරන අතර, 10-30 තත්පර සැලකිය යුතු ලෙස වඩා හොඳ ප්රතිඵල ලබා දෙයි. AI ඇසෙන වඩාත් ස්වභාවික කථාව, වඩා නිවැරදි ක්ලෝන.

ස්වභාවික කථාව

ස්වභාවිකව කතා, monotone නොවේ. විවිධ intonation හා pacing ඇතුළත්. මෙම AI ඔබේ ස්වභාවික කතා ශෛලිය අල්ලා, විරාම සහ අවධාරණය ඇතුළු.

තනි කථානායක

කතා කරන එක් පුද්ගලයෙකු පමණක් සමග සාම්පලයක් භාවිතා කරන්න. බහු හඬ කථානායක embedding අවුල් සහ මිශ්ර ප්රතිඵල නිපදවයි.

අද ක්ලෝන හඬ ආරම්භ කරන්න

5 තත්පර ශ්රව්ය ප්රවේශ හා යටතේ ඔබේ ක්ලෝන හඬ ඇසීමට 30 තත්පර. උත්සාහ කිරීමට නිදහස්.

දැන් හඬක් ක්ලෝන කරන්න API ලේඛන

නිතර අසන ප්රශ්න

තත්කාලීන හඬ ක්ලෝන ගැන පොදු ප්රශ්න

TTS.ai විවිධ හඬ ක්ලෝන ආකෘති9ක් ලබා දෙයි. ගුණාත්මකභාවය, වේගය සහ භාෂා සහාය සඳහා විවිධ ශක්තිමත් බවක් සහිත එක් එක් එකක්. TTS.ai ක්ලෝන ආකෘති9ක් ලබා දෙයි. TTS.ai ක්ලෝන ආකෘති9ක් ලබා දෙයි. TTS.ai ක්ලෝන ආකෘති9ක් ලබා දෙයි. TTS.ai ක්ලෝන ආකෘති9ක් ලබා දෙයි.

මෙන් කුඩා5තත්පර බොහෝ ආකෘති සමග වැඩ (Chatterbox, CosyVoice2, විදුලි සැර, GPT-SoVITS, OpenVoice). කුරුල්ලන් හොඳම ප්රතිඵල සඳහා 15+ තත්පර අවශ්ය. සියලු ආකෘති හරහා ප්රමාණවත් ගුණාත්මක සඳහා, පැහැදිලි 10-30 තත්පර, තනි කථානායක ශ්රව්ය නිර්දේශ කෙරේ. ශ්රව්ය පසුබිම් ශබ්ද හා සංගීතය නිදහස් විය යුතුය.

කටහඬ ක්ලෝන තාක්ෂණය නීතිමය වේ. කෙසේ වෙතත්, ඔබ භාවිතා කිරීමට අවසර ඇති හඬ පමණක් ක්ලෝන කළ යුතුය - ඔබේම හඬ, ඔබ සඳහා ඍජු අනුමැතිය ඇති හඬ, හෝ මහජන වසම තුළ හඬ. අනුමැතිය නොමැතිව කෙනෙකුගේ චරිතය නිරූපණය කිරීමට කටහඬ ක්ලෝන භාවිතා කිරීම, වංචාව සිදු කිරීම හෝ අවුල් සහගත අන්තර්ගතයක් නිර්මාණය කිරීම බොහෝ අධිකරණ බල ප්‍රදේශවල නීති විරෝධී ය. TTS.ai හි කොන්දේසි ඔබ ක්ලෝන කරන ඕනෑම හඬකට හිමිකම් ඇති බව අවශ් ය වේ.

එය ඔබේ භාවිතය මත රඳා පවතී. Chatterbox හැඟීම් පාලනය සමග ඉංග්රීසි ක්ලෝන උසස් තත්ත්වයේ නිෂ්පාදනය කරයි. CosyVoice2බහුභාෂා ක්ලෝන සඳහා හොඳම වේ (චීන, ඉංග්රීසි, ජපන්, කොරියානු). ස්පාර්ක් ~ 12 තත්පර වේගවත්ම වේ. Tortoise ස්ටූඩියෝ-ගුණාත්මක ප්රතිඵල නිෂ්පාදනය නමුත් මන්දගාමී වේ. GPT-SoVITS චීන හඬ ක්ලෝන දී විශිෂ්ට. ඔබේ හඬ සඳහා හොඳම ගැලපීම සොයා ගැනීමට ආකෘති කිහිපයක් උත්සාහ.

ඔව් - මෙය හඳුන්වන්නේ අන්තර් භාෂා හඬ ක්ලෝන කිරීමයි. CosyVoice2, Qwen3-TTS සහ OpenVoice එයට සහාය දක්වයි. උදාහරණයක් ලෙස, ඔබට ඉංග් රීසි හඬ සාම්පලයක් උඩුගත කර චීන, ජපන් හෝ කොරියානු භාෂාවෙන් කථාව ජනනය කළ හැකිය. කථිකයාගේ ශ් රව්ය ලක්ෂණ පවත්වා ගනිමින්. ගුණාත්මකභාවය ආකෘතිය සහ භාෂා යුගලය අනුව වෙනස් වේ.

CorentinJ / Real-Time-Voice-Cloning GitHub ව් යාපෘතිය (60K + තරු) SV2TTS, 2019 ගෘහ නිර්මාණ ශිල්පය භාවිතා කරයි. එම කාලයේ දී ප්රමුඛතම වන අතර, චැටර්බොක්ස්, කොසිවොයිස්2සහ GPT-සෝවිට්ස් වැනි නූතන ආකෘති වඩා හොඳ කථානායක සමානතාවයක් සහිත වඩා හොඳ ශ්රව්ය ගුණාත්මකභාවයක් ලබා දෙයි. TTS.ai9රාජ්ය-of-the-art ආකෘති ධාවනය කරයි (SV2TTS හි එක්) සහ GPU ස්ථාපනය අවශ්ය නොවේ - හුදෙක් උඩුගත කිරීම සහ ක්ලෝන කිරීම.

ඔව්. TTS.ai හඬ ක්ලෝන කිරීම සඳහා REST API සපයයි. උපුටා දැක්වීම ශ්රව්ය හා පෙළ, ආකෘතිය තෝරා, සහ ක්ලෝන කතා ලැබේ. Python SDK (`pip ttsai` ස්ථාපනය), ජාවාස්ක් රිප්ට් SDK (`npm install @ttsainpm/ttsai`), හෝ සෘජු HTTP ඉල්ලීම් හරහා ලබා ගත හැකිය. එකම ක්ලෝන හඬ සමඟ බහු පෙළ සැකසීම සඳහා කණ්ඩායම් ක්ලෝන සහාය.

ඔව්. ක්ලෝන කිරීමෙන් පසු, ඔබේ ගිණුමට හඬ සුරැකීමට සහ සබැඳි ශ් රව් ය නැවත-පූරණය නොකර සීමා රහිත පරම්පරාවන් පුරා එය නැවත භාවිතා කිරීමට. සුරැකූ හඬ හඬ ක්ලෝන කිරීම පිටුවේ ඔබේ හඬ පුස්තකාලයේ පෙනී ගොස් API හරහා ප්රවේශ විය හැකිය.

WAV, MP3, OGG, FLAC, සහ WebM සියලු සහාය දක්වයි. ඔබ ද තනන ලද මයික්රෆෝනය පටිගත කිරීම භාවිතා කරමින් ඔබේ බ්රවුසරයේ සෘජුවම වාර්තා කළ හැකිය. හොඳම ප්රතිඵල සඳහා, 16kHz හෝ ඊට වැඩි අහිමි WAV ආකෘතිය භාවිතා කරන්න. AI ස්වයංක්රීයව ආදාන ආකෘතිය නොසලකා ශ්රව්ය preprocesses (resampling, ශබ්ද පෙරහන්).

පරම්පරා කාලය ආකෘතිය අනුව වෙනස් වේ: ස්පාර්ක් ~ 12 තත්පර වේගවත්ම වේ, OpenVoice ~ 15 තත්පර, GPT-SoVITS ~ 16 තත්පර, CosyVoice2~ 20 තත්පර, Chatterbox ~ 21 තත්පර, හා Tortoise ~ 60 තත්පර. මෙම කාලය සාමාන්ය වාක්‍ය දිග පෙළ සඳහා වේ. දිගු පෙළ අනුපාත දිගු ගත.

ඔව්. සියලු9TTS.ai මත ක්ලෝන ආකෘති වාණිජමය භාවිතය සඳහා අවසර දෙන විවෘත මූලාශ්රය බලපත්ර භාවිතා (MIT හෝ Apache 2.0). ඔබ YouTube වීඩියෝ, පොඩ්කාස්ට්, ශ්රව්ය පොත්, යෙදුම්, ක්රීඩා, දුරකථන පද්ධති, සහ වෙනත් ඕනෑම වාණිජ යෙදුම ක්ලෝන ශ්රව්ය භාවිතා කළ හැකිය - ඔබ මූලාශ්රය හඬ අයිතිවාසිකම් ඇති බව සපයයි.

ඔව්. අපි ධාවනය කරන සෑම ආකෘතියක්ම විවෘත මූලාශ් රය වන අතර GitHub / HuggingFace හි ලබා ගත හැකිය. ඔබට ඔබේම GPU සේවාදායකය මත Chatterbox, CosyVoice2, GPT-SoVITS, OpenVoice, Spark, IndexTTS-2, GLM-TTS, Qwen3-TTS හෝ Tortoise ස්වයං-සත්කාරක කළ හැකිය. බොහෝ ආකෘතිවලට ආකෘතිය මත පදනම්ව 4-24GB VRAM සහිත NVIDIA GPU අවශ් ය වේ. TTS.ai සියලු යටිතල පහසුකම් පාලනය කරයි. එබැවින් ඔබට එය කළ යුතු නැත.
5.0/5 (1)

අපි වැඩි දියුණු කළ හැකි දේ? ඔබේ ප්රතිචාරය අපට ගැටළු විසඳීමට උපකාරී වේ.

තත්පර වලින් ඕනෑම හඬක් ක්ලෝන් කරන්න

9 විවෘත මූලාශ්රය හඬ ක්ලෝන ආකෘති. 5-තත්පර සාම්පල. කිසිදු පුහුණුව අවශ්ය. එය නොමිලේ උත්සාහ - ඔබේ ශ්රව්ය උඩුගත හා ක්ලෝන ක්ෂණිකව ඇසීමට.