තත්පර තුළ ඕනෑම හඬක් ක්ලෝන්

හුදෙක් සදහන් ශ්රව්ය තත්පර5ක්ලෝන ඕනෑම හඬ. Chatterbox, CosyVoice2, GPT-SoVITS, සහ OpenVoice ඇතුළු9විවෘත මූලාශ්රය හඬ ක්ලෝන ආකෘති. කිසිදු පුහුණුව අවශ්ය ශූරතා ක්ලෝන - සාම්පලයක් උඩුගත හා වහාම කථාව ජනනය. සියලු ආකෘති වාණිජ බලපත්ර ලබා දී ඇත.

සැබෑ- කාලය 5-තත්පර සාම්පල 9 ක්ලෝන ආකෘති විවෘත මූලාශ්‍ර 17+ භාෂා හැඟීම් පාලනය

නොමිලේ ආරම්භ කරන්න මිල දර්ශනය

තත්කාලීන හඬ ක්ලෝනකරණ විශේෂාංග

රාජ්ය-of-the-art AI සමග ක්ෂණිකව ක්ලෝන් හඬ - කිසිදු පුහුණු, කිසිදු දත්ත, කිසිදු බලා

ශූන්‍ය- ෂොට් ක්ලෝන කිරීම

කිසිදු පුහුණුවක්, කිසිදු මනා-සංශෝධනය, කිසිදු දත්ත එකතුවක්. ශ්රව්ය තත්පර5පෝස්ට් හා වහාම ක්ලෝන හඬ ලබා ගන්න. AI සත්‍ය කාලීනව කථානායක ලක්ෂණ උපුටා.

9 ක්ලෝන ආකෘති

Chatterbox සිට තෝරා, CosyVoice2, GPT-SoVITS, OpenVoice, ස්පාර්ක්, IndexTTS-2, GLM-TTS, Qwen3-TTS, හා කුරුල්ලන්. එක් එක් ආකෘතිය ගුණාත්මක සඳහා විවිධ ශක්තිමත්, වේගය, හා භාෂාව.

ක්රෝස්- භාෂා ක්ලෝන කිරීම

ඉංග්රීසි හඬ ක්ලෝන හා චීන, ජපන්, කොරියානු, සහ තවත් කතා ජනනය. CosyVoice2සහ Qwen3-TTS හරහා හඬ අනන්යතාව පවත්වා 17+ භාෂා.

හැඟීම් පාලනය

Chatterbox, OpenVoice, සහ GLM-TTS හැඟීම්-සංවේදී පරම්පරාව සහාය. විවිධ හැඟීම් සමග එම පෙළ ජනනය - සතුටින්, දුක, තරහ, මුමුණමින් - ක්ලෝන හඬ තබා.

විවෘත මූලාශ්රය සහ වාණිජ

සෑම ක්ලෝන ආකෘතිය MIT හෝ Apache 2.0 බලපත්ර යටතේ විවෘත මූලාශ්රය වේ. කිසිදු රාජ්ය නොවන අන්තර්ගතය සඳහා වාණිජමය ක්ලෝන හඬ භාවිතා, නිෂ්පාදන, සහ යෙදුම්.

ක්ලෝන API

වැඩසටහන් හඬ ක්ලෝන කිරීම සඳහා REST API. උපුටා දැක්වීම ශ්රව්ය, පෙළ සඳහන්, සහ ක්ලෝන කතා ලැබේ. Python සහ JavaScript සඳහා SDKs. ඉහළ පරිමාව වැඩ ප්රවාහ සඳහා බැච් ක්ලෝන.

හඬ ක්ලෝන ආකෘති

සෑම ක්ලෝන භාවිතා කිරීම සඳහා9විවෘත මූලාශ්ර ආකෘති

Chatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

මධ්‍යම 5/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: හොඳම සමස්ත ගුණාත්මක - 5-තත්පර සාම්පල, හැඟීම් පාලනය, MIT බලපත්ර

උත්සහ කරන්න Chatterbox

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

මධ්‍යම 5/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: හොඳම බහුභාෂා ක්ලෝන - චීන හරහා හඬ පවත්වා ගනී, ඉංග්රීසි, ජපන්, කොරියානු

උත්සහ කරන්න CosyVoice 2

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

මධ්‍යම 4/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: හැඟීම් හා ශෛලිය මාරු සමග වේගවත් ටෝන් වර්ණ පරිවර්තනය

උත්සහ කරන්න OpenVoice

Spark TTS

Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

මධ්‍යම 4/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: වේගවත්ම ක්ලෝන ආකෘතිය - ~ 12 තත්පර ප්රතිඵල

උත්සහ කරන්න Spark TTS

IndexTTS-2

Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

මධ්‍යම 4/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: ඉහළ කථානායක සමානත්වය සමග විශිෂ්ට චීන-ඉංග්රීසි ක්ලෝන

උත්සහ කරන්න IndexTTS-2

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

මන්දගාමී 5/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: ශ්රව්ය-ගුණාත්මක ප්රතිඵල - ශ්රව්ය පොත් සහ වාරික කථාව සඳහා හොඳම

උත්සහ කරන්න Tortoise TTS

රියල්-ටයිම් හඬ ක්ලෝන වැඩ කරන්නේ කෙසේද

කෙටි ශ්රව්ය සාම්පලයක් සිට සීමා රහිත ක්ලෝන කතා

1

උපුටාගැනීම් ශ්‍රව්‍ය

ඔබ ක්ලෝන් කිරීමට අවශ්ය හඬ සිට පැහැදිලි කථාව තත්පර 5-30 පටිගත හෝ උඩුගත කරන්න. WAV, MP3, හෝ ඔබේ බ්රවුසරය තුළ සෘජුවම වාර්තා.

2

ක්ලෝන ආකෘතිය තෝරන්න

ඔබේ අවශ්යතා ගැලපෙන ආකෘතිය තෝරන්න - ගුණාත්මක සඳහා Chatterbox, වේගය සඳහා ස්පාර්ක්, බහුභාෂා සඳහා CosyVoice2.

3

ඔබේ පෙළ ඇතුළත් කරන්න

ක්ලෝන හඬට කතා කිරීමට ඔබට අවශ්ය පෙළ යතුරු ලියනය කරන්න හෝ ඇලවීම. ආකෘතිය විසින් සහාය දක්වන ඕනෑම භාෂාවක් වැඩ කරයි.

4

බාගත කිරීම්

ක්ලික් කරන්න උත්පාදනය සහ 10-25 තත්පර ඔබේ ක්ලෝන හඬ ඇසීමට. වහාම භාවිතා කිරීම සඳහා WAV හෝ MP3 ලෙස බාගත.

ශූරතාවය-ෂොට් හඬ ක්ලෝන වැඩ කරන්නේ කෙසේද

කිසිදු මනා-සංශෝධනය, කිසිදු දත්ත එකතුවක් - පමණක් උඩුගත හා ක්ලෝන්

කථානායක embedding වෙන්කර ගැනීම

මෙම AI කථානායක embedding උපුටා ගැනීමට ඔබේ උපුටා ශ්රව්ය විශ්ලේෂණය - පන්දු ඇතුළු හඬේ සුවිශේෂී ලක්ෂණ සංයුක්ත ගණිතමය නියෝජනය, timbre, කතා රිද්මය, සහ ශ්රව්ය ව්යුහය. මෙම යටතේ සිදු 1 තත්පර.

ශ්රව්ය තත්පර5ක් තරම් කුඩා ලෙස වැඩ
පීට්, ටිම්බර්, සහ කතා කරන ශෛලිය අල්ලා ගනී
පුහුණු හෝ හොඳින් ගැලපීම අවශ්ය නැත
ශ්‍රව්‍ය කිසිවිටෙකත් ස්ථිරව ගබඩා නොවේ

කොන්දේසිගත කථා සංස්ලේෂණයName

TTS ආකෘතිය කථානායක embedding මත කොන්දේසි නව කථාව ජනනය. ප්රතිඵලය ඔබේ පෙළ කියන උපුටා කථානායක වගේ සද්දෙ - ස්වභාවික prosody සමග, සුදුසු අවධාරණය, හා මුල් හඬ ගේ චරිතය ඕනෑම භාෂාවක් හෝ අන්තර්ගතය පුරා සංරක්ෂණය.

තනි සාම්පලයක් සිට සීමා රහිත කථාව ජනනය කරන්න
හරස්-භාෂා ක්ලෝන (උදාහරණයක් ලෙස භාෂා කතා නොකරයි)
හැඟීම් සහ ශෛලිය මාරු
තත්පර 10-25 ප්රතිඵල

හඬ ක්ලෝන කිරීම උත්සාහ කරන්න

හඬ ක්ලෝන ආකෘතිය සංසන්දනය

ඔබේ ක්ලෝන භාවිතය සඳහා සුදුසු ආකෘතිය තෝරන්න

ආකෘතිය	අවම. උපුටා දැක්වීම	වේගය	ගුණාත්මකභාවය	භාෂා	බලපත්‍රය
Chatterbox	5s	~21s	හොඳම	EN	MIT
CosyVoice 2	5s	~20s	විශිෂ්ටයි	CN, EN, JP, KO+	Apache 2.0
GPT-SoVITS	5s	~16s	විශිෂ්ටයි	CN, EN, JP, KO	MIT
OpenVoice	5s	~15s	හොඳයි	ඉංග්රීසි, චීන, ස්පාඤ්ඤ, ප්‍රංශ +	MIT
Spark TTS	5s	~12s	හොඳයි	CN, EN	Apache 2.0
IndexTTS-2	5s	~18s	විශිෂ්ටයි	CN, EN	Apache 2.0
GLM-TTS	5s	~25s	විශිෂ්ටයි	CN, EN	Apache 2.0
Qwen3-TTS	5s	~16s	විශිෂ්ටයි	CN, EN, JP, KO+	Apache 2.0
Tortoise	15s	~60s	ස්ටූඩියෝ	EN	Apache 2.0

ආකෘති සසඳන්න

ජනතාව සඳහා තත්කාලීන හඬ ක්ලෝන භාවිතා කරන්නේ කුමක්ද

අන්තර්ගත නිර්මාණය සිට ප්රවේශ වීම - හඬ ක්ලෝන කිරීම අවසන් නොවන අයදුම්පත් ඇත

ශ්‍රව්‍ය පොත් විස්තරය

කතුවරුන් ඔවුන්ගේම හඬ ක්ලෝන සහ පටිගත කිරීම් බූට් පැය ගත නොකර මුළු ශ්රව්ය පොත් ජනනය. නැවත පටිගත කිරීම වෙනුවට තනි වාක්‍ය පුනර්ජනනය කිරීමෙන් වැරදි සංස්කරණය කරන්න.

වීඩියෝ

CosyVoice2සහ Qwen3-TTS වැනි හුවමාරු භාෂා ආකෘති චීන, ඉංග්රීසි, ජපන් සහ කොරියානු හරහා හඬ අනන්යතාව පවත්වා ගනිමින්.

අන්තර්ගත නිර්මාණය

YouTubers, podcasters, සහ TikTok නිර්මාණකරුවන් අනුකූල වෙළඳ නාමකරණයක් සඳහා ඔවුන්ගේ හඬ ක්ලෝන කරයි. පටිගත කිරීමකින් තොරව නව අන්තර්ගතයන් සඳහා වොයිස් ඔවර්ස් ජනනය කරන්න, හෝ දැනට පවතින වීඩියෝවල විකල්ප භාෂා අනුවාද නිර්මාණය කරන්න.

පිවිසුම් හැකියාව

රෝග හෝ ශල්යකර්ම නිසා ඔවුන්ගේ හඬ අහිමි කර ඇති ජනතාව පැරණි පටිගත කිරීම් සිට ක්ලෝන කිරීමෙන් එය සංරක්ෂණය කළ හැකිය. ක්ලෝන හඬ ඔවුන්ට පෙළ-කථාව හරහා ඔවුන්ගේම හඬ සන්නිවේදනය කිරීමට ඉඩ දෙයි.

ක්රීඩා සංවර්ධනය

හඬ නළු ක්ලෝන් සහ ස්ටූඩියෝ කාලය සටහන් තැබීම තොරව සීමා රහිත සංවාද විචලනයන් ජනනය. සෑම රේඛාවක් නැවත පටිගත කිරීම ක්රියාත්මක නොවන ඉන්දීය ක්රීඩා, mods සඳහා පරිපූර්ණ, සහ මූලාකෘති.

IVR & දුරකථන පද්ධති

දුරකථන මෙනු සහ ස්වයංක්රීය ප්රතිචාර සඳහා ඔබේ සමාගම ප් රකාශකයා හඬ ක්ලෝන. හඬ නළුවෙකු වෙන්කර තොරව ක්ෂණිකව IVR ප්රශ්න යාවත්කාලීන - නව පෙළ පමණක් වර්ග හා ජනනය.

දැන් හඬක් ක්ලෝන කරන්න

TTS.ai වෙනත් හඬ ක්ලෝන විසඳුම් එරෙහිව

ඇයි9ආකෘති තනි විවෘත මූලාශ්රය ව්යාපෘතිය පරාජය

විශේෂාංග	TTS.ai	SV2TTS	ElevenLabs	Resemble AI
ආකෘති ක්ලෝන කිරීම	9	1	1	1
අවම. උපුටාගැනීම් ශ්‍රව්‍ය	5 sec	5 sec	30 sec	3 min
පුහුණුව අවශ්ය	නෑ	නෑ	නෑ	ඔව්
ශ්රව්ය ගුණාත්මක (2025)	ස්ටූඩියෝ- ශ්‍රේණිය	දිනය	විශිෂ්ටයි	විශිෂ්ටයි
හැඟීම් පාලනය
ක්රෝස්- භාෂා ක්ලෝන කිරීම
විවෘත මූලාශ්‍ර
GPU අවශ්ය වේ	වලාකුළ	ඔව්	වලාකුළ	වලාකුළ
API පිවිසුම
නිදහස් ස්ථරය	15 ණය	ස්ව- ධාරකය	සීමාසහිත

එය නොමිලේ උත්සාහ කරන්න

හඬ ක්ලෝන API

අපේ REST API සමඟ වැඩසටහන්ගතව ක්ලෝන් හඬ

Python - හඬ ක්ලෝන කිරීම REST API

from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-...")

# Clone a voice from a 5-second sample
result = client.clone_voice(
    name="My Cloned Voice",
    file="reference.wav",       # 5-30 seconds of clear speech
    model="chatterbox",         # or cosyvoice2, openvoice, spark...
    text="Hello! This is my cloned voice speaking new text.",
)

# Download the cloned audio
audio = client.poll_result(result.uuid)
with open("cloned_output.wav", "wb") as f:
    f.write(audio)

cURL — හඬ ක්ලෝන REST API

curl -X POST https://api.tts.ai/v1/voice-clone \
  -H "Authorization: Bearer sk-tts-YOUR_KEY" \
  -F "reference=@voice_sample.wav" \
  -F "text=This is my cloned voice." \
  -F "model=chatterbox"

API ලේඛන බලන්න

හොඳම හඬ ක්ලෝන ප්රතිඵල සඳහා ඉඟි

මෙම පටිගත කිරීමේ මාර්ගෝපදේශ සමඟ වඩාත් නිවැරදි හඬ ක්ලෝන් ලබා ගන්න

නිහඬ පරිසරය

අවම පසුබිම් ශබ්ද සමග නිහඬ කාමරයේ පටිගත. AI පිරිසිදු ශ්රව්ය සිට හඬ ලක්ෂණ වඩා නිවැරදිව උපුටා.

තත්පර 10-30

5 තත්පර ක්රියා කරන අතර, 10-30 තත්පර සැලකිය යුතු ලෙස වඩා හොඳ ප්රතිඵල ලබා දෙයි. AI ඇසෙන වඩාත් ස්වභාවික කථාව, වඩා නිවැරදි ක්ලෝන.

ස්වභාවික කථාව

ස්වභාවිකව කතා, monotone නොවේ. විවිධ intonation හා pacing ඇතුළත්. මෙම AI ඔබේ ස්වභාවික කතා ශෛලිය අල්ලා, විරාම සහ අවධාරණය ඇතුළු.

තනි කථානායක

කතා කරන එක් පුද්ගලයෙකු පමණක් සමග සාම්පලයක් භාවිතා කරන්න. බහු හඬ කථානායක embedding අවුල් සහ මිශ්ර ප්රතිඵල නිපදවයි.

ක්ලෝනකරණය ආරම්භ කරන්න

අද ක්ලෝන හඬ ආරම්භ කරන්න

5 තත්පර ශ්රව්ය ප්රවේශ හා යටතේ ඔබේ ක්ලෝන හඬ ඇසීමට 30 තත්පර. උත්සාහ කිරීමට නිදහස්.

දැන් හඬක් ක්ලෝන කරන්න API ලේඛන

නිතර අසන ප්රශ්න

තත්කාලීන හඬ ක්ලෝන ගැන පොදු ප්රශ්න

TTS.ai විවිධ හඬ ක්ලෝන ආකෘති9ක් ලබා දෙයි. ගුණාත්මකභාවය, වේගය සහ භාෂා සහාය සඳහා විවිධ ශක්තිමත් බවක් සහිත එක් එක් එකක්. TTS.ai ක්ලෝන ආකෘති9ක් ලබා දෙයි. TTS.ai ක්ලෝන ආකෘති9ක් ලබා දෙයි. TTS.ai ක්ලෝන ආකෘති9ක් ලබා දෙයි. TTS.ai ක්ලෝන ආකෘති9ක් ලබා දෙයි.

මෙන් කුඩා5තත්පර බොහෝ ආකෘති සමග වැඩ (Chatterbox, CosyVoice2, විදුලි සැර, GPT-SoVITS, OpenVoice). කුරුල්ලන් හොඳම ප්රතිඵල සඳහා 15+ තත්පර අවශ්ය. සියලු ආකෘති හරහා ප්රමාණවත් ගුණාත්මක සඳහා, පැහැදිලි 10-30 තත්පර, තනි කථානායක ශ්රව්ය නිර්දේශ කෙරේ. ශ්රව්ය පසුබිම් ශබ්ද හා සංගීතය නිදහස් විය යුතුය.

කටහඬ ක්ලෝන තාක්ෂණය නීතිමය වේ. කෙසේ වෙතත්, ඔබ භාවිතා කිරීමට අවසර ඇති හඬ පමණක් ක්ලෝන කළ යුතුය - ඔබේම හඬ, ඔබ සඳහා ඍජු අනුමැතිය ඇති හඬ, හෝ මහජන වසම තුළ හඬ. අනුමැතිය නොමැතිව කෙනෙකුගේ චරිතය නිරූපණය කිරීමට කටහඬ ක්ලෝන භාවිතා කිරීම, වංචාව සිදු කිරීම හෝ අවුල් සහගත අන්තර්ගතයක් නිර්මාණය කිරීම බොහෝ අධිකරණ බල ප්‍රදේශවල නීති විරෝධී ය. TTS.ai හි කොන්දේසි ඔබ ක්ලෝන කරන ඕනෑම හඬකට හිමිකම් ඇති බව අවශ් ය වේ.

එය ඔබේ භාවිතය මත රඳා පවතී. Chatterbox හැඟීම් පාලනය සමග ඉංග්රීසි ක්ලෝන උසස් තත්ත්වයේ නිෂ්පාදනය කරයි. CosyVoice2බහුභාෂා ක්ලෝන සඳහා හොඳම වේ (චීන, ඉංග්රීසි, ජපන්, කොරියානු). ස්පාර්ක් ~ 12 තත්පර වේගවත්ම වේ. Tortoise ස්ටූඩියෝ-ගුණාත්මක ප්රතිඵල නිෂ්පාදනය නමුත් මන්දගාමී වේ. GPT-SoVITS චීන හඬ ක්ලෝන දී විශිෂ්ට. ඔබේ හඬ සඳහා හොඳම ගැලපීම සොයා ගැනීමට ආකෘති කිහිපයක් උත්සාහ.

ඔව් - මෙය හඳුන්වන්නේ අන්තර් භාෂා හඬ ක්ලෝන කිරීමයි. CosyVoice2, Qwen3-TTS සහ OpenVoice එයට සහාය දක්වයි. උදාහරණයක් ලෙස, ඔබට ඉංග් රීසි හඬ සාම්පලයක් උඩුගත කර චීන, ජපන් හෝ කොරියානු භාෂාවෙන් කථාව ජනනය කළ හැකිය. කථිකයාගේ ශ් රව්ය ලක්ෂණ පවත්වා ගනිමින්. ගුණාත්මකභාවය ආකෘතිය සහ භාෂා යුගලය අනුව වෙනස් වේ.

CorentinJ / Real-Time-Voice-Cloning GitHub ව් යාපෘතිය (60K + තරු) SV2TTS, 2019 ගෘහ නිර්මාණ ශිල්පය භාවිතා කරයි. එම කාලයේ දී ප්රමුඛතම වන අතර, චැටර්බොක්ස්, කොසිවොයිස්2සහ GPT-සෝවිට්ස් වැනි නූතන ආකෘති වඩා හොඳ කථානායක සමානතාවයක් සහිත වඩා හොඳ ශ්රව්ය ගුණාත්මකභාවයක් ලබා දෙයි. TTS.ai9රාජ්ය-of-the-art ආකෘති ධාවනය කරයි (SV2TTS හි එක්) සහ GPU ස්ථාපනය අවශ්ය නොවේ - හුදෙක් උඩුගත කිරීම සහ ක්ලෝන කිරීම.

ඔව්. TTS.ai හඬ ක්ලෝන කිරීම සඳහා REST API සපයයි. උපුටා දැක්වීම ශ්රව්ය හා පෙළ, ආකෘතිය තෝරා, සහ ක්ලෝන කතා ලැබේ. Python SDK (`pip ttsai` ස්ථාපනය), ජාවාස්ක් රිප්ට් SDK (`npm install @ttsainpm/ttsai`), හෝ සෘජු HTTP ඉල්ලීම් හරහා ලබා ගත හැකිය. එකම ක්ලෝන හඬ සමඟ බහු පෙළ සැකසීම සඳහා කණ්ඩායම් ක්ලෝන සහාය.

ඔව්. ක්ලෝන කිරීමෙන් පසු, ඔබේ ගිණුමට හඬ සුරැකීමට සහ සබැඳි ශ් රව් ය නැවත-පූරණය නොකර සීමා රහිත පරම්පරාවන් පුරා එය නැවත භාවිතා කිරීමට. සුරැකූ හඬ හඬ ක්ලෝන කිරීම පිටුවේ ඔබේ හඬ පුස්තකාලයේ පෙනී ගොස් API හරහා ප්රවේශ විය හැකිය.

WAV, MP3, OGG, FLAC, සහ WebM සියලු සහාය දක්වයි. ඔබ ද තනන ලද මයික්රෆෝනය පටිගත කිරීම භාවිතා කරමින් ඔබේ බ්රවුසරයේ සෘජුවම වාර්තා කළ හැකිය. හොඳම ප්රතිඵල සඳහා, 16kHz හෝ ඊට වැඩි අහිමි WAV ආකෘතිය භාවිතා කරන්න. AI ස්වයංක්රීයව ආදාන ආකෘතිය නොසලකා ශ්රව්ය preprocesses (resampling, ශබ්ද පෙරහන්).

පරම්පරා කාලය ආකෘතිය අනුව වෙනස් වේ: ස්පාර්ක් ~ 12 තත්පර වේගවත්ම වේ, OpenVoice ~ 15 තත්පර, GPT-SoVITS ~ 16 තත්පර, CosyVoice2~ 20 තත්පර, Chatterbox ~ 21 තත්පර, හා Tortoise ~ 60 තත්පර. මෙම කාලය සාමාන්ය වාක්‍ය දිග පෙළ සඳහා වේ. දිගු පෙළ අනුපාත දිගු ගත.

ඔව්. සියලු9TTS.ai මත ක්ලෝන ආකෘති වාණිජමය භාවිතය සඳහා අවසර දෙන විවෘත මූලාශ්රය බලපත්ර භාවිතා (MIT හෝ Apache 2.0). ඔබ YouTube වීඩියෝ, පොඩ්කාස්ට්, ශ්රව්ය පොත්, යෙදුම්, ක්රීඩා, දුරකථන පද්ධති, සහ වෙනත් ඕනෑම වාණිජ යෙදුම ක්ලෝන ශ්රව්ය භාවිතා කළ හැකිය - ඔබ මූලාශ්රය හඬ අයිතිවාසිකම් ඇති බව සපයයි.

ඔව්. අපි ධාවනය කරන සෑම ආකෘතියක්ම විවෘත මූලාශ් රය වන අතර GitHub / HuggingFace හි ලබා ගත හැකිය. ඔබට ඔබේම GPU සේවාදායකය මත Chatterbox, CosyVoice2, GPT-SoVITS, OpenVoice, Spark, IndexTTS-2, GLM-TTS, Qwen3-TTS හෝ Tortoise ස්වයං-සත්කාරක කළ හැකිය. බොහෝ ආකෘතිවලට ආකෘතිය මත පදනම්ව 4-24GB VRAM සහිත NVIDIA GPU අවශ් ය වේ. TTS.ai සියලු යටිතල පහසුකම් පාලනය කරයි. එබැවින් ඔබට එය කළ යුතු නැත.

තත්පර වලින් ඕනෑම හඬක් ක්ලෝන් කරන්න

9 විවෘත මූලාශ්රය හඬ ක්ලෝන ආකෘති. 5-තත්පර සාම්පල. කිසිදු පුහුණුව අවශ්ය. එය නොමිලේ උත්සාහ - ඔබේ ශ්රව්ය උඩුගත හා ක්ලෝන ක්ෂණිකව ඇසීමට.

නොමිලේ ලියාපදිංචි මිල දර්ශනය

තත්පර තුළ ඕනෑම හඬක් ක්ලෝන්

තත්කාලීන හඬ ක්ලෝනකරණ විශේෂාංග

ශූන්‍ය- ෂොට් ක්ලෝන කිරීම

9 ක්ලෝන ආකෘති

ක්රෝස්- භාෂා ක්ලෝන කිරීම

හැඟීම් පාලනය

විවෘත මූලාශ්රය සහ වාණිජ

ක්ලෝන API

හඬ ක්ලෝන ආකෘති

Chatterbox

CosyVoice 2

OpenVoice

Spark TTS

IndexTTS-2

Tortoise TTS

රියල්-ටයිම් හඬ ක්ලෝන වැඩ කරන්නේ කෙසේද

උපුටාගැනීම් ශ්‍රව්‍ය

ක්ලෝන ආකෘතිය තෝරන්න

ඔබේ පෙළ ඇතුළත් කරන්න

බාගත කිරීම්

ශූරතාවය-ෂොට් හඬ ක්ලෝන වැඩ කරන්නේ කෙසේද

කථානායක embedding වෙන්කර ගැනීම

කොන්දේසිගත කථා සංස්ලේෂණයName

හඬ ක්ලෝන ආකෘතිය සංසන්දනය

ජනතාව සඳහා තත්කාලීන හඬ ක්ලෝන භාවිතා කරන්නේ කුමක්ද

ශ්‍රව්‍ය පොත් විස්තරය

වීඩියෝ

අන්තර්ගත නිර්මාණය

පිවිසුම් හැකියාව

ක්රීඩා සංවර්ධනය

IVR & දුරකථන පද්ධති

TTS.ai වෙනත් හඬ ක්ලෝන විසඳුම් එරෙහිව

හඬ ක්ලෝන API

හොඳම හඬ ක්ලෝන ප්රතිඵල සඳහා ඉඟි

නිහඬ පරිසරය

තත්පර 10-30

ස්වභාවික කථාව

තනි කථානායක

අද ක්ලෝන හඬ ආරම්භ කරන්න

නිතර අසන ප්රශ්න

සත්ය-කාලීන හඬ ක්ලෝන කිරීම යනු කුමක්ද?

හඬක් ක්ලෝන කරන්න මට කොච්චර ශ්‍රව්‍ය දත්ත ප්‍රමාණයක් අවශ්‍යද?

හඬ ක්ලෝන කිරීම නීතිගතද?

මොන හඬ ක්ලෝන ආකෘතිය හොඳම?

මට හඬක් ක්ලෝන කර වෙනත් භාෂාවකින් කතා කරන්න පුළුවන්ද?

TTS.ai සැබෑ-කාලය-හඬ-ක්ලෝන (SV2TTS) සමග සසඳන ආකාරය?

හඬ ක්ලෝන API තිබේද?

මට ක්ලෝන හඬක් සුරකින්න සහ නැවත භාවිතා කරන්න පුලුවන්ද?

උපුටා දැක්වීම් සාම්පල සඳහා වැඩ කරන ශ්රව්ය ආකෘති මොනවාද?

කොච්චර කාලයක් යයිද හඬ ක්ලෝන කිරීම?

ක්ලෝන හඬවල් වාණිජමය වශයෙන් භාවිතා කළ හැකිද?

මට කටහඬ ක්ලෝන ආකෘති ස්වයං-සත්කාරක විය හැකිද?

තත්පර වලින් ඕනෑම හඬක් ක්ලෝන් කරන්න