තත්පර තුළ ඕනෑම හඬක් ක්ලෝන්
හුදෙක් සදහන් ශ්රව්ය තත්පර5ක්ලෝන ඕනෑම හඬ. Chatterbox, CosyVoice2, GPT-SoVITS, සහ OpenVoice ඇතුළු9විවෘත මූලාශ්රය හඬ ක්ලෝන ආකෘති. කිසිදු පුහුණුව අවශ්ය ශූරතා ක්ලෝන - සාම්පලයක් උඩුගත හා වහාම කථාව ජනනය. සියලු ආකෘති වාණිජ බලපත්ර ලබා දී ඇත.
තත්කාලීන හඬ ක්ලෝනකරණ විශේෂාංග
රාජ්ය-of-the-art AI සමග ක්ෂණිකව ක්ලෝන් හඬ - කිසිදු පුහුණු, කිසිදු දත්ත, කිසිදු බලා
ශූන්ය- ෂොට් ක්ලෝන කිරීම
කිසිදු පුහුණුවක්, කිසිදු මනා-සංශෝධනය, කිසිදු දත්ත එකතුවක්. ශ්රව්ය තත්පර5පෝස්ට් හා වහාම ක්ලෝන හඬ ලබා ගන්න. AI සත්ය කාලීනව කථානායක ලක්ෂණ උපුටා.
9 ක්ලෝන ආකෘති
Chatterbox සිට තෝරා, CosyVoice2, GPT-SoVITS, OpenVoice, ස්පාර්ක්, IndexTTS-2, GLM-TTS, Qwen3-TTS, හා කුරුල්ලන්. එක් එක් ආකෘතිය ගුණාත්මක සඳහා විවිධ ශක්තිමත්, වේගය, හා භාෂාව.
ක්රෝස්- භාෂා ක්ලෝන කිරීම
ඉංග්රීසි හඬ ක්ලෝන හා චීන, ජපන්, කොරියානු, සහ තවත් කතා ජනනය. CosyVoice2සහ Qwen3-TTS හරහා හඬ අනන්යතාව පවත්වා 17+ භාෂා.
හැඟීම් පාලනය
Chatterbox, OpenVoice, සහ GLM-TTS හැඟීම්-සංවේදී පරම්පරාව සහාය. විවිධ හැඟීම් සමග එම පෙළ ජනනය - සතුටින්, දුක, තරහ, මුමුණමින් - ක්ලෝන හඬ තබා.
විවෘත මූලාශ්රය සහ වාණිජ
සෑම ක්ලෝන ආකෘතිය MIT හෝ Apache 2.0 බලපත්ර යටතේ විවෘත මූලාශ්රය වේ. කිසිදු රාජ්ය නොවන අන්තර්ගතය සඳහා වාණිජමය ක්ලෝන හඬ භාවිතා, නිෂ්පාදන, සහ යෙදුම්.
ක්ලෝන API
වැඩසටහන් හඬ ක්ලෝන කිරීම සඳහා REST API. උපුටා දැක්වීම ශ්රව්ය, පෙළ සඳහන්, සහ ක්ලෝන කතා ලැබේ. Python සහ JavaScript සඳහා SDKs. ඉහළ පරිමාව වැඩ ප්රවාහ සඳහා බැච් ක්ලෝන.
හඬ ක්ලෝන ආකෘති
සෑම ක්ලෝන භාවිතා කිරීම සඳහා9විවෘත මූලාශ්ර ආකෘති
Chatterbox
Premium
State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.
සඳහා හොඳම: හොඳම සමස්ත ගුණාත්මක - 5-තත්පර සාම්පල, හැඟීම් පාලනය, MIT බලපත්ර
උත්සහ කරන්න Chatterbox
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
සඳහා හොඳම: හොඳම බහුභාෂා ක්ලෝන - චීන හරහා හඬ පවත්වා ගනී, ඉංග්රීසි, ජපන්, කොරියානු
උත්සහ කරන්න CosyVoice 2
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
සඳහා හොඳම: හැඟීම් හා ශෛලිය මාරු සමග වේගවත් ටෝන් වර්ණ පරිවර්තනය
උත්සහ කරන්න OpenVoice
Spark TTS
Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
සඳහා හොඳම: වේගවත්ම ක්ලෝන ආකෘතිය - ~ 12 තත්පර ප්රතිඵල
උත්සහ කරන්න Spark TTS
IndexTTS-2
Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
සඳහා හොඳම: ඉහළ කථානායක සමානත්වය සමග විශිෂ්ට චීන-ඉංග්රීසි ක්ලෝන
උත්සහ කරන්න IndexTTS-2
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
සඳහා හොඳම: ශ්රව්ය-ගුණාත්මක ප්රතිඵල - ශ්රව්ය පොත් සහ වාරික කථාව සඳහා හොඳම
උත්සහ කරන්න Tortoise TTSරියල්-ටයිම් හඬ ක්ලෝන වැඩ කරන්නේ කෙසේද
කෙටි ශ්රව්ය සාම්පලයක් සිට සීමා රහිත ක්ලෝන කතා
උපුටාගැනීම් ශ්රව්ය
ඔබ ක්ලෝන් කිරීමට අවශ්ය හඬ සිට පැහැදිලි කථාව තත්පර 5-30 පටිගත හෝ උඩුගත කරන්න. WAV, MP3, හෝ ඔබේ බ්රවුසරය තුළ සෘජුවම වාර්තා.
ක්ලෝන ආකෘතිය තෝරන්න
ඔබේ අවශ්යතා ගැලපෙන ආකෘතිය තෝරන්න - ගුණාත්මක සඳහා Chatterbox, වේගය සඳහා ස්පාර්ක්, බහුභාෂා සඳහා CosyVoice2.
ඔබේ පෙළ ඇතුළත් කරන්න
ක්ලෝන හඬට කතා කිරීමට ඔබට අවශ්ය පෙළ යතුරු ලියනය කරන්න හෝ ඇලවීම. ආකෘතිය විසින් සහාය දක්වන ඕනෑම භාෂාවක් වැඩ කරයි.
බාගත කිරීම්
ක්ලික් කරන්න උත්පාදනය සහ 10-25 තත්පර ඔබේ ක්ලෝන හඬ ඇසීමට. වහාම භාවිතා කිරීම සඳහා WAV හෝ MP3 ලෙස බාගත.
ශූරතාවය-ෂොට් හඬ ක්ලෝන වැඩ කරන්නේ කෙසේද
කිසිදු මනා-සංශෝධනය, කිසිදු දත්ත එකතුවක් - පමණක් උඩුගත හා ක්ලෝන්
කථානායක embedding වෙන්කර ගැනීම
මෙම AI කථානායක embedding උපුටා ගැනීමට ඔබේ උපුටා ශ්රව්ය විශ්ලේෂණය - පන්දු ඇතුළු හඬේ සුවිශේෂී ලක්ෂණ සංයුක්ත ගණිතමය නියෝජනය, timbre, කතා රිද්මය, සහ ශ්රව්ය ව්යුහය. මෙම යටතේ සිදු 1 තත්පර.
- ශ්රව්ය තත්පර5ක් තරම් කුඩා ලෙස වැඩ
- පීට්, ටිම්බර්, සහ කතා කරන ශෛලිය අල්ලා ගනී
- පුහුණු හෝ හොඳින් ගැලපීම අවශ්ය නැත
- ශ්රව්ය කිසිවිටෙකත් ස්ථිරව ගබඩා නොවේ
කොන්දේසිගත කථා සංස්ලේෂණයName
TTS ආකෘතිය කථානායක embedding මත කොන්දේසි නව කථාව ජනනය. ප්රතිඵලය ඔබේ පෙළ කියන උපුටා කථානායක වගේ සද්දෙ - ස්වභාවික prosody සමග, සුදුසු අවධාරණය, හා මුල් හඬ ගේ චරිතය ඕනෑම භාෂාවක් හෝ අන්තර්ගතය පුරා සංරක්ෂණය.
- තනි සාම්පලයක් සිට සීමා රහිත කථාව ජනනය කරන්න
- හරස්-භාෂා ක්ලෝන (උදාහරණයක් ලෙස භාෂා කතා නොකරයි)
- හැඟීම් සහ ශෛලිය මාරු
- තත්පර 10-25 ප්රතිඵල
හඬ ක්ලෝන ආකෘතිය සංසන්දනය
ඔබේ ක්ලෝන භාවිතය සඳහා සුදුසු ආකෘතිය තෝරන්න
| ආකෘතිය | අවම. උපුටා දැක්වීම | වේගය | ගුණාත්මකභාවය | භාෂා | හැඟීම | බලපත්රය |
|---|---|---|---|---|---|---|
| Chatterbox | 5s | ~21s | හොඳම | EN | MIT | |
| CosyVoice 2 | 5s | ~20s | විශිෂ්ටයි | CN, EN, JP, KO+ | Apache 2.0 | |
| GPT-SoVITS | 5s | ~16s | විශිෂ්ටයි | CN, EN, JP, KO | MIT | |
| OpenVoice | 5s | ~15s | හොඳයි | ඉංග්රීසි, චීන, ස්පාඤ්ඤ, ප්රංශ + | MIT | |
| Spark TTS | 5s | ~12s | හොඳයි | CN, EN | Apache 2.0 | |
| IndexTTS-2 | 5s | ~18s | විශිෂ්ටයි | CN, EN | Apache 2.0 | |
| GLM-TTS | 5s | ~25s | විශිෂ්ටයි | CN, EN | Apache 2.0 | |
| Qwen3-TTS | 5s | ~16s | විශිෂ්ටයි | CN, EN, JP, KO+ | Apache 2.0 | |
| Tortoise | 15s | ~60s | ස්ටූඩියෝ | EN | Apache 2.0 |
ජනතාව සඳහා තත්කාලීන හඬ ක්ලෝන භාවිතා කරන්නේ කුමක්ද
අන්තර්ගත නිර්මාණය සිට ප්රවේශ වීම - හඬ ක්ලෝන කිරීම අවසන් නොවන අයදුම්පත් ඇත
ශ්රව්ය පොත් විස්තරය
කතුවරුන් ඔවුන්ගේම හඬ ක්ලෝන සහ පටිගත කිරීම් බූට් පැය ගත නොකර මුළු ශ්රව්ය පොත් ජනනය. නැවත පටිගත කිරීම වෙනුවට තනි වාක්ය පුනර්ජනනය කිරීමෙන් වැරදි සංස්කරණය කරන්න.
වීඩියෝ
CosyVoice2සහ Qwen3-TTS වැනි හුවමාරු භාෂා ආකෘති චීන, ඉංග්රීසි, ජපන් සහ කොරියානු හරහා හඬ අනන්යතාව පවත්වා ගනිමින්.
අන්තර්ගත නිර්මාණය
YouTubers, podcasters, සහ TikTok නිර්මාණකරුවන් අනුකූල වෙළඳ නාමකරණයක් සඳහා ඔවුන්ගේ හඬ ක්ලෝන කරයි. පටිගත කිරීමකින් තොරව නව අන්තර්ගතයන් සඳහා වොයිස් ඔවර්ස් ජනනය කරන්න, හෝ දැනට පවතින වීඩියෝවල විකල්ප භාෂා අනුවාද නිර්මාණය කරන්න.
පිවිසුම් හැකියාව
රෝග හෝ ශල්යකර්ම නිසා ඔවුන්ගේ හඬ අහිමි කර ඇති ජනතාව පැරණි පටිගත කිරීම් සිට ක්ලෝන කිරීමෙන් එය සංරක්ෂණය කළ හැකිය. ක්ලෝන හඬ ඔවුන්ට පෙළ-කථාව හරහා ඔවුන්ගේම හඬ සන්නිවේදනය කිරීමට ඉඩ දෙයි.
ක්රීඩා සංවර්ධනය
හඬ නළු ක්ලෝන් සහ ස්ටූඩියෝ කාලය සටහන් තැබීම තොරව සීමා රහිත සංවාද විචලනයන් ජනනය. සෑම රේඛාවක් නැවත පටිගත කිරීම ක්රියාත්මක නොවන ඉන්දීය ක්රීඩා, mods සඳහා පරිපූර්ණ, සහ මූලාකෘති.
IVR & දුරකථන පද්ධති
දුරකථන මෙනු සහ ස්වයංක්රීය ප්රතිචාර සඳහා ඔබේ සමාගම ප් රකාශකයා හඬ ක්ලෝන. හඬ නළුවෙකු වෙන්කර තොරව ක්ෂණිකව IVR ප්රශ්න යාවත්කාලීන - නව පෙළ පමණක් වර්ග හා ජනනය.
TTS.ai වෙනත් හඬ ක්ලෝන විසඳුම් එරෙහිව
ඇයි9ආකෘති තනි විවෘත මූලාශ්රය ව්යාපෘතිය පරාජය
| විශේෂාංග | TTS.ai | SV2TTS | ElevenLabs | Resemble AI |
|---|---|---|---|---|
| ආකෘති ක්ලෝන කිරීම | 9 | 1 | 1 | 1 |
| අවම. උපුටාගැනීම් ශ්රව්ය | 5 sec | 5 sec | 30 sec | 3 min |
| පුහුණුව අවශ්ය | නෑ | නෑ | නෑ | ඔව් |
| ශ්රව්ය ගුණාත්මක (2025) | ස්ටූඩියෝ- ශ්රේණිය | දිනය | විශිෂ්ටයි | විශිෂ්ටයි |
| හැඟීම් පාලනය | ||||
| ක්රෝස්- භාෂා ක්ලෝන කිරීම | ||||
| විවෘත මූලාශ්ර | ||||
| GPU අවශ්ය වේ | වලාකුළ | ඔව් | වලාකුළ | වලාකුළ |
| API පිවිසුම | ||||
| නිදහස් ස්ථරය | 15 ණය | ස්ව- ධාරකය | සීමාසහිත |
හඬ ක්ලෝන API
අපේ REST API සමඟ වැඩසටහන්ගතව ක්ලෝන් හඬ
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-...")
# Clone a voice from a 5-second sample
result = client.clone_voice(
name="My Cloned Voice",
file="reference.wav", # 5-30 seconds of clear speech
model="chatterbox", # or cosyvoice2, openvoice, spark...
text="Hello! This is my cloned voice speaking new text.",
)
# Download the cloned audio
audio = client.poll_result(result.uuid)
with open("cloned_output.wav", "wb") as f:
f.write(audio)
curl -X POST https://api.tts.ai/v1/voice-clone \
-H "Authorization: Bearer sk-tts-YOUR_KEY" \
-F "reference=@voice_sample.wav" \
-F "text=This is my cloned voice." \
-F "model=chatterbox"
හොඳම හඬ ක්ලෝන ප්රතිඵල සඳහා ඉඟි
මෙම පටිගත කිරීමේ මාර්ගෝපදේශ සමඟ වඩාත් නිවැරදි හඬ ක්ලෝන් ලබා ගන්න
නිහඬ පරිසරය
අවම පසුබිම් ශබ්ද සමග නිහඬ කාමරයේ පටිගත. AI පිරිසිදු ශ්රව්ය සිට හඬ ලක්ෂණ වඩා නිවැරදිව උපුටා.
තත්පර 10-30
5 තත්පර ක්රියා කරන අතර, 10-30 තත්පර සැලකිය යුතු ලෙස වඩා හොඳ ප්රතිඵල ලබා දෙයි. AI ඇසෙන වඩාත් ස්වභාවික කථාව, වඩා නිවැරදි ක්ලෝන.
ස්වභාවික කථාව
ස්වභාවිකව කතා, monotone නොවේ. විවිධ intonation හා pacing ඇතුළත්. මෙම AI ඔබේ ස්වභාවික කතා ශෛලිය අල්ලා, විරාම සහ අවධාරණය ඇතුළු.
තනි කථානායක
කතා කරන එක් පුද්ගලයෙකු පමණක් සමග සාම්පලයක් භාවිතා කරන්න. බහු හඬ කථානායක embedding අවුල් සහ මිශ්ර ප්රතිඵල නිපදවයි.
අද ක්ලෝන හඬ ආරම්භ කරන්න
5 තත්පර ශ්රව්ය ප්රවේශ හා යටතේ ඔබේ ක්ලෝන හඬ ඇසීමට 30 තත්පර. උත්සාහ කිරීමට නිදහස්.
දැන් හඬක් ක්ලෝන කරන්න API ලේඛනනිතර අසන ප්රශ්න
තත්කාලීන හඬ ක්ලෝන ගැන පොදු ප්රශ්න
අපි වැඩි දියුණු කළ හැකි දේ? ඔබේ ප්රතිචාරය අපට ගැටළු විසඳීමට උපකාරී වේ.
තත්පර වලින් ඕනෑම හඬක් ක්ලෝන් කරන්න
9 විවෘත මූලාශ්රය හඬ ක්ලෝන ආකෘති. 5-තත්පර සාම්පල. කිසිදු පුහුණුව අවශ්ය. එය නොමිලේ උත්සාහ - ඔබේ ශ්රව්ය උඩුගත හා ක්ලෝන ක්ෂණිකව ඇසීමට.