وړیا AI ليکنه وينا ته
20+ خلاص سرچینه ماډلونه، 107+ غږونه، 32+ ژبې. نه حساب ته اړتيا ده.
هرڅه چې تاسو د غږ AI لپاره اړتیا لرئ
30+ وسیلې د خلاص سرچینې AI ماډلونو لخوا چلول کیږي
20+ AI غږ نمونې
په یوه پلیټ فارم کې د خلاصې سرچینې TTS ماډلونو ترټولو پراخه ټولګه
Kokoro Free
کوکورو د 82 ملیون پارامتر متن-to-speech ماډل دی چې د خپل وزن ټولګي څخه پورته ښه ټوټې کوي. د دې کوچني اندازې سره سره، دا د پام وړ طبیعي او څرګند وینا تولیدوي. کوکورو د انګلیسي، جاپاني، چینایي، او کوریایي په شمول ډیری ژبې ملاتړ کوي چې د څرګندو غږونو سره مختلف دي. دا په حیرانتیا سره چټک دی - په GPU کې د ریښتیني وخت څخه نږدې 100x غږ تولیدوي.
د: لپاره غوره د لوړ کیفیت TTS د لږترلږه latency سره، د جریان غوښتنلیکونه
ازموېل وړیا
Piper Free
پیپر د Rhasspy لخوا رامینځته شوی یو لږ وزن لرونکی متن دی چې د VITS او larynx معمارۍ کاروي. دا په بشپړ ډول په CPU کې چلیږي، دا د edge وسیلو، کور اتومات، او غوښتنلیکونو لپاره مثالی کوي چې آفلاین TTS ته اړتیا لري. د 30 + ژبو په اوږدو کې د 100 غږونو سره، پیپر حتی د Raspberry Pi 4 کې د ریښتیني وخت سرعت کې طبیعي غږیز وینا وړاندې کوي.
د: لپاره غوره چټکې مخليدنې، لاسرسي، او نښلول شوي کاريالونه
ازموېل وړیا
VITS Free
VITS (د پای څخه تر پای پورې د متن څخه د خبرو اترو لپاره د مقابلې زده کړې سره توپیر) یو موازي پای ته رسیدلی TTS میتود دی چې د اوسني دوه مرحلو ماډلونو په پرتله ډیر طبیعي غږیز غږ رامینځته کوي. دا د عادي جریانونو او د مقابلې روزنې پروسې سره د توپیر استنباط غوره کوي، په طبیعي کې د پام وړ ښه والی ترلاسه کوي.
د: لپاره غوره د طبیعي پروسوډي سره عمومي موخه ليکنه- په- وينا
ازموېل وړیا
MeloTTS Free
د MyShell.ai لخوا MeloTTS یو څو ژبنی TTS کتابتون دی چې د انګلیسي (امریکایی، برتانوي، هند، آسټرالیا)، هسپانوي، فرانسوي، چینایي، جاپاني، او کوریایي ملاتړ کوي. دا خورا ګړندی دی، یوازې د CPU په نږدې ریښتیني وخت سرعت کې د متن پروسس کول. MeloTTS د تولید کارولو لپاره ډیزاین شوی او د CPU او GPU دواړو استنباط ملاتړ کوي.
د: لپاره غوره د تولید غوښتنلیکونه چې د چټک، څو ژبو TTS ته اړتیا لري
ازموېل وړیا
Bark Standard
د ترانسپورت پر بنسټ د متن څخه غږیز ماډل چې واقعیت لرونکي وینا، موسیقۍ او غږ اغېزې تولیدوي.
: جوړوونکی Suno · : منښتليک MIT
هڅه کول
Bark Small Standard
سره د چټک استنباط او د حافظې د کارولو کم د Bark روښانه نسخه.
: جوړوونکی Suno · : منښتليک MIT
هڅه کول
CosyVoice 2 Standard
د Alibaba's scaleable streaming TTS د انساني مساوات طبیعي او نږدې صفر latency سره.
: جوړوونکی Alibaba (Tongyi Lab) · : منښتليک Apache 2.0
هڅه کول
Dia TTS Standard
د څو ويناوالو د خبرو اترو نسل ماډل چې د ويناوالو ترمنځ طبیعي خبرې اترې رامینځته کوي.
: جوړوونکی Nari Labs · : منښتليک Apache 2.0
هڅه کول
Parler TTS Standard
تاسو په طبیعي ژبه کې غواړئ غږ تشریح کړئ او Parler د مطابقت وینا تولیدوي.
: جوړوونکی Hugging Face · : منښتليک Apache 2.0
هڅه کول
GLM-TTS Standard
د خلاصې سرچینې TTS ماډلونو تر منځ تر ټولو ټیټه کرکټر غلطۍ کچه ترلاسه کوي.
: جوړوونکی Zhipu AI · : منښتليک GLM-4 License
هڅه کول
IndexTTS-2 Standard
صفر-شوت TTS سره fine-grained احساس کنټرول او لوړ expressivity.
: جوړوونکی Index Team · : منښتليک Bilibili Model License
هڅه کول
Spark TTS Standard
د غږ کلونینګ TTS سره د کنټرول وړ احساس او د پیغامونو له لارې د خبرو کولو سټایل.
: جوړوونکی SparkAudio · : منښتليک CC BY-NC-SA 4.0
هڅه کول
GPT-SoVITS Standard
څو-شوټ غږ کلونینګ TTS چې د غږ له یوازې 5 ثانیو څخه هر غږ تکراروي.
: جوړوونکی RVC-Boss · : منښتليک MIT
هڅه کول
Orpheus Standard
د انساني کچې احساساتي TTS ماډل د وینا د معلوماتو په 100K ساعتونو کې روزل شوی.
: جوړوونکی Canopy Labs · : منښتليک Llama 3.2 Community
هڅه کول
Qwen3 TTS Standard
Alibaba's multilingual TTS سره د غږ کلونینګ، preset غږونه، او د متن څخه د غږ ډیزاین.
: جوړوونکی Alibaba (Qwen) · : منښتليک Apache 2.0
هڅه کول
CosyVoice 2
د Alibaba's scaleable streaming TTS د انساني مساوات طبیعي او نږدې صفر latency سره.
: ژبې en, zh, ja, ko, fr, de, it, es
غږ کلونول
GLM-TTS
د خلاصې سرچینې TTS ماډلونو تر منځ تر ټولو ټیټه کرکټر غلطۍ کچه ترلاسه کوي.
: ژبې en, zh
غږ کلونول
Spark TTS
د غږ کلونینګ TTS سره د کنټرول وړ احساس او د پیغامونو له لارې د خبرو کولو سټایل.
: ژبې en, zh
غږ کلونول
GPT-SoVITS
څو-شوټ غږ کلونینګ TTS چې د غږ له یوازې 5 ثانیو څخه هر غږ تکراروي.
: ژبې en, zh, ja, ko
غږ کلونول
Chatterbox
د Resemble AI څخه د احساس کنترول سره د state-of-the-art zero-shot غږ کلونینګ.
: ژبې en
غږ کلونول
OpenVoice
د ګړندي غږ کلونینګ د سټایل، احساس، او ټینګار په اړه د غوړ کنټرول سره.
: ژبې en, zh, ja, ko, fr, de, es, it
غږ کلونول
Qwen3 TTS
Alibaba's multilingual TTS سره د غږ کلونینګ، preset غږونه، او د متن څخه د غږ ډیزاین.
: ژبې en, zh, ja, ko, de, fr, ru, pt, es, it
غږ کلونولپرمخبيونکی لومړی API
OpenAI-متوافق REST API. یو پای ټکی، 22+ ماډلونه. د ریښتیني وخت غوښتنلیکونو لپاره د سټرینګ ملاتړ.
- OpenAI سره سمون لرونکی بڼه
- د رښتينې مهال کاريالونو لپاره ټي ټي اېس لېږل
- د لویو دندو لپاره ډله پروسس
- خبرتياوې Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ساده، شفاف قیمتونه
وړیا پیل کړئ. اندازه کړئ لکه څنګه چې تاسو وده کوئ.
وړیا
50 کرېډیټونه
- Kokoro, Piper, VITS, MeloTTS
- ۵۰۰ لوښه حد
- 3 جن / ساعت (هېڅ حساب)
پېلونکی
500 کریډیټونه / میاشت
- ټول 22+ ماډلونه
- 100,000 chars per generation
- غږ نقلول
پرو
2,000 کریډیټونه / میاشت
- په پېلوونکي کې هرڅه
- لاسرسی API
- لومړیتوب بهير
ډېرې پوښتنې
نن د AI غږ کارولو سره پیل کړئ
د TTS.ai په کارولو سره جوړونکي، جوړونکي، او سوداګرۍ سره یوځای شئ