د ریښتیني وخت غږ کلونینګ - په ثانیو کې هر غږ کلون کړئ
د 9 خلاص سرچینې غږ کلون کولو ماډلونه په شمول د Chatterbox، CosyVoice 2، GPT-SoVITS، او OpenVoice. د هیڅ ډول روزنې سره صفر-شوټ کلونینګ - د نمونې پورته کول او د خبرو اترو تولید کول سمدلاسه. ټول ماډلونه په سوداګریز ډول جواز لري.
د رښتينې مهال غږ کلوننګ ځانګړتياوې
د ای ای سره د ای ای سره سمدلاسه د ای ای سره سمدلاسه غږونه - هیڅ روزنه ، هیڅ ډیټا ، هیڅ انتظار
زېرمه-شوت کلوننګ
نه روزنه، نه fine-tuning، نه dataset ټولګه. د غږ 5 ثانیې پورته او په فوري توګه د کلون شوي غږ ترلاسه کړئ. د AI په ریښتیني وخت کې د ویناوال ځانګړتیاوې استخراجوي.
9 کلونينګ ماډلونه
د Chatterbox، CosyVoice 2، GPT-SoVITS، OpenVoice، Spark، IndexTTS-2، GLM-TTS، Qwen3-TTS، او Tortoise څخه غوره کړئ. هر ماډل د کیفیت، سرعت او ژبې لپاره مختلف قوتونه لري.
ژبني نقلونه
په انګلیسي ژبه کې د غږ کلون او په چينايي، جاپاني، كوريايي، او نور خبرې توليد. CosyVoice 2 او Qwen3-TTS په 17+ ژبو غږ هويت ساتي.
احساس کنټرول
Chatterbox، OpenVoice، او GLM-TTS د احساساتو شرایطو نسل ملاتړ کوي. د مختلفو احساساتو سره ورته متن رامینځته کړئ - خوښ، خفه، غصه، غږ - پداسې حال کې چې د کلون شوي غږ ساتل.
خلاص سرچينه او سوداګريز
هر کلونینګ ماډل د MIT یا Apache 2.0 جوازونو لاندې خلاص سرچینه ده. د محتوا، محصولاتو او غوښتنلیکونو لپاره د سوداګرۍ لپاره د کلون شوي غږونو کارول.
API نقلول
د پروګرام کولو غږ کلون کولو لپاره REST API. د حوالې آډیو پورته کړئ، متن مشخص کړئ، او د کلون شوي وینا ترلاسه کړئ. د پایټن او جاواسکریپټ لپاره SDKs. د لوړ حجم کارونو لپاره د ډله کلون کول.
د غږ د نقلولو بېلګه
د هر کلونینګ کارولو قضیې لپاره 9 خلاص سرچینې ماډلونه
Chatterbox
Premium
State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.
د: لپاره غوره غوره عمومي کیفیت - د 5 ثانیو نمونې، احساس کنترول، MIT جواز
هڅه Chatterbox
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
د: لپاره غوره غوره څو ژبه کلون - په ټول چينايي، انګليسي، جاپاني، كوريايي غږ ساتي
هڅه CosyVoice 2
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
د: لپاره غوره د احساس او د ډول انتقال سره د چټک ټون رنګ بدلون
هڅه OpenVoice
Spark TTS
Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
د: لپاره غوره چټک کلون کولو ماډل - په ~ 12 ثانیو کې پایلې
هڅه Spark TTS
IndexTTS-2
Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
د: لپاره غوره د لوړ غږونکي ورته والی سره د چینايي-انګلیسي غوره کلونینګ
هڅه IndexTTS-2
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
د: لپاره غوره د سټوډیو کیفیت پایلې - د آډیو کتابونو او پریمیم کیسې لپاره غوره
هڅه Tortoise TTSڅنګه د ریښتیني وخت غږ کلونینګ کار کوي
له يوې لنډې غږيزې نمونې نه تر بې حده کلون شويو خبرو
مرجع غږيز لېښل
د غږ څخه چې تاسو غواړئ کلون کړئ د واضح وینا 5-30 ثانیې ثبت یا پورته کړئ. WAV، MP3، یا په مستقیم ډول په خپل بریښنالیک کې ثبت کړئ.
د نقل کولو بېلګه وټاکﺉ
د ماډل غوره کړئ چې ستاسو اړتیاوې پوره کوي - د کیفیت لپاره Chatterbox، د سرعت لپاره Spark، د څو ژبو لپاره CosyVoice 2.
ليکنه وليکﺉ
. هغه ليکنه وليکﺉ يا يې سرته ورسو چې غواړﺉ په نقل شوي غږ کې ووايي. کومه ژبه چې د ماډل له خوا ملاتړ کيږي کار کوي
رالېښنې
کلیک تولید او په 10-25 ثانیو کې خپل کلون شوي غږ واورېدل. د فوري کارولو لپاره د WAV یا MP3 په توګه ډاونلوډ کړئ.
څنګه د Zero-Shot غږ کلونینګ کار کوي
نه fine-tuning، نه dataset ټولګه - یوازې پورته او کلون
غږونکی نغوتې استخراجول
AI ستاسو د حوالې آډیو تحلیل کوي ترڅو د غږ غږولو لپاره د غږ غږولو لپاره - د غږ یو کمپیکٹ ریاضی استازیتوب
- د غږ د 5 ثانیو په څیر لږ کار کوي
- د غږ، ټيمبر او خبرې کولو ډول نیول
- نه روزنه یا fine-tuning اړین
- غږ هېڅکله هم تل لپاره نه ساتل کيږي
د خبرو اترو سمون
د TTS ماډل د نوي وینا په ویناوال embedding شرط تولیدوي. د پایلې په څیر د حوالې د ویناوال ستاسو د متن وايي غږونه - سره د طبیعي prosody، مناسب ټینګار، او د اصلي غږ
- له يوې بېلګه نه بې حده وينا توليدول
- د کراس-لغوي کلوننګ (په ژبو کې د حوالې didn خبرې
- احساس او ډول لیږد
- په 10-25 ثانیو کې پایلې
د غږ د کلون کولو ماډل پرتله کول
د خپل کلون استعمال حالت لپاره سم ماډل وټاکئ
| بېلګه | لږترلږه اخځ | چټکتيا | :څرنګوالی | ژبې | احساس | منښتليک |
|---|---|---|---|---|---|---|
| Chatterbox | 5s | ~21s | غوره | EN | MIT | |
| CosyVoice 2 | 5s | ~20s | ښه | چين، انګلستان، جاپان، کوريا | Apache 2.0 | |
| GPT-SoVITS | 5s | ~16s | ښه | CN، EN، JP، KO | MIT | |
| OpenVoice | 5s | ~15s | ښه | انګليسي، چيني، اسپانيايي، فرانسوي | MIT | |
| Spark TTS | 5s | ~12s | ښه | چين | Apache 2.0 | |
| IndexTTS-2 | 5s | ~18s | ښه | چين | Apache 2.0 | |
| GLM-TTS | 5s | ~25s | ښه | چين | Apache 2.0 | |
| Qwen3-TTS | 5s | ~16s | ښه | چين، انګلستان، جاپان، کوريا | Apache 2.0 | |
| Tortoise | 15s | ~60s | سټېډيو | EN | Apache 2.0 |
څه خلک د ریښتیني وخت غږ کلونینګ لپاره کاروي
د محتوا جوړولو څخه د لاسرسي وړتيا - د غږ کلونينګ بې پایلې غوښتنلیکونه لري
غږيز کتاب لنډيز
لیکوالان د خپل ځان غږ کلون کوي او په یوه ریکارډ بوټ کې ساعتونه لګولو پرته ټول آډیو کتابونه رامینځته کوي. د بیا ثبت کولو پرځای د یو واحد جملو رامینځته کولو سره غلطۍ بدل کړئ.
ويډيو ډبلنګ
په نورو ژبو کې د اصلي غږونکي ساتلو په حال کې د ویډیوګانو ډب کول
منځپانګې جوړول
یوټیوبران، پوډکاسټران، او د ټیک ټاک جوړونکي د دوامداره برانڈ کولو لپاره خپل غږ کلون کوي. د نوي موادو لپاره د غږونو تولید پرته له ثبت کولو څخه، یا د موجوده ویډیوګانو بدیل ژبې نسخې رامینځته کړئ.
لاسرسی
خلک چې د ناروغۍ یا جراحي له امله خپل غږ له لاسه ورکړی شي کولی شي د پخوانیو ریکارډونو څخه د کلون کولو له لارې ساتل شي. د کلون شوي غږ دوی ته اجازه ورکوي چې د متن څخه د وینا له لارې په خپل غږ کې اړیکه ونیسي.
لوبې پرمختيا
د غږ لوبغاړي کلون کړئ او د سټوډیو وخت پرته د ټاکل شوي وخت پرته د خبرو اترو بې حده بدلونونه رامینځته کړئ. د انډی لوبو، موډونو، او پروټوټایپ لپاره مثالی چیرې چې هر کرښه بیا ثبت کول نه
IVR & د ټېلېفون سیستمونه
د خپل شرکت ویاند کلون کړئ
TTS.ai د نورو غږ کلون کولو حلونو پروړاندې
ولې د 9 ماډلونه د یو واحد خلاص سرچینې پروژې ماتوي
| ځانګړنه | TTS.ai | SV2TTS | ElevenLabs | Resemble AI |
|---|---|---|---|---|
| بېلګه نقلول | 9 | 1 | 1 | 1 |
| لږترلږه. ارشيو غږيز | 5 sec | 5 sec | 30 sec | 3 min |
| روزنه اړينه ده | نه | نه | نه | هو |
| غږيز کیفیت (۲۰۲۵) | سټېډيو کچ | نېټه | ښه | ښه |
| احساس کنټرول | ||||
| ژبني نقلونه | ||||
| پرانيستل شوی سرچينه | ||||
| اړين GPU | بادل | هو | بادل | بادل |
| لاسرسی API | ||||
| وړیا کچ | ۱۵ کرېډیټونه | ځان کوربه | محدود |
غږ کلوننګ API
د REST API سره د پروګرام کولو غږونه کلون کړئ
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-...")
# Clone a voice from a 5-second sample
result = client.clone_voice(
name="My Cloned Voice",
file="reference.wav", # 5-30 seconds of clear speech
model="chatterbox", # or cosyvoice2, openvoice, spark...
text="Hello! This is my cloned voice speaking new text.",
)
# Download the cloned audio
audio = client.poll_result(result.uuid)
with open("cloned_output.wav", "wb") as f:
f.write(audio)
curl -X POST https://api.tts.ai/v1/voice-clone \
-H "Authorization: Bearer sk-tts-YOUR_KEY" \
-F "reference=@voice_sample.wav" \
-F "text=This is my cloned voice." \
-F "model=chatterbox"
د غوره غږ کلونينګ پایلو لپاره لارښوونې
د دې ثبت لارښوونو سره د ټولو دقیق غږ کلون ترلاسه کړئ
خاموش چاپېريال
په يو آرام خونه کې د لږ تر لږه د پس منظر د شور ریکارډ. د AI د پاک غږ څخه د غږ ځانګړتیاوې په دقیق ډول استخراجوي.
10-30 ثانیې
پداسې حال کې چې د 5 ثانیو کار کوي، 10-30 ثانیې په پام کې نیولو سره ښه پایلې ورکوي. د AI ډیر طبیعي وینا اوریدل کیږي، د کلون ډیر دقیق.
طبیعي وينا
په طبیعي توګه خبرې وکړئ، نه په یو monotone کې. د مختلفو intonation او pacing شامل کړئ. د AI ستاسو د طبیعي خبرې کولو سټایل نیولی، په شمول د وقفو او ټینګار.
يو غږونکی
د يوې نمونې سره يوازې يو شخص خبرې کوله وکاروئ. څو غږونه د غږونکي embedding ګډوډ او مخلوط پایلې تولیدوي.
نن د غږونو نقلول پېل کړئ
د غږ 5 ثانیې پورته کړئ او ستاسو د کلون شوي غږ په 30 ثانیو کې اوریدل. وړیا هڅه وکړئ.
اوس غږ نقلول لاسوندونهډېرې پوښتنې
د رښتينې وخت غږ کلون کولو په اړه عام پوښتنې
What could we improve? Your feedback helps us fix issues.
په سېکېنډونو کې کوم غږ نقلول
9 د خلاصې سرچینې غږ کلون کولو ماډلونه. د 5 ثانیو نمونې. هیڅ روزنه نه اړتیا لري. دا وړیا هڅه وکړئ - خپل غږ پورته کړئ او سمدلاسه کلون اوریدل.