وړیا AI ليکنه وينا ته
33+ خلاص سرچینه ماډلونه، 273+ غږونه، 33+ ژبې. نه حساب ته اړتيا ده.
هرڅه چې تاسو د غږ AI لپاره اړتیا لرئ
30+ وسیلې د خلاص سرچینې AI ماډلونو لخوا چلول کیږي
33+ AI غږ نمونې
په یوه پلیټ فارم کې د خلاصې سرچینې TTS ماډلونو ترټولو پراخه ټولګه
Kokoro وړیا
کوکورو د 82 ملیون پارامتر متن-to-speech ماډل دی چې د خپل وزن ټولګي څخه پورته ښه ټوټې کوي. د دې کوچني اندازې سره سره، دا د پام وړ طبیعي او څرګند وینا تولیدوي. کوکورو د انګلیسي، جاپاني، چینایي، او کوریایي په شمول ډیری ژبې ملاتړ کوي چې د څرګندو غږونو سره مختلف دي. دا په حیرانتیا سره چټک دی - په GPU کې د ریښتیني وخت څخه نږدې 100x غږ تولیدوي.
د: لپاره غوره د لوړ کیفیت TTS د لږترلږه latency سره، د جریان غوښتنلیکونه
ازموېل وړیا
Piper وړیا
پیپر د Rhasspy لخوا رامینځته شوی یو لږ وزن لرونکی متن دی چې د VITS او larynx معمارۍ کاروي. دا په بشپړ ډول په CPU کې چلیږي، دا د edge وسیلو، کور اتومات، او غوښتنلیکونو لپاره مثالی کوي چې آفلاین TTS ته اړتیا لري. د 30 + ژبو په اوږدو کې د 100 غږونو سره، پیپر حتی د Raspberry Pi 4 کې د ریښتیني وخت سرعت کې طبیعي غږیز وینا وړاندې کوي.
د: لپاره غوره چټکې مخليدنې، لاسرسي، او نښلول شوي کاريالونه
ازموېل وړیا
VITS وړیا
VITS (د پای څخه تر پای پورې د متن څخه د خبرو اترو لپاره د مقابلې زده کړې سره توپیر) یو موازي پای ته رسیدلی TTS میتود دی چې د اوسني دوه مرحلو ماډلونو په پرتله ډیر طبیعي غږیز غږ رامینځته کوي. دا د عادي جریانونو او د مقابلې روزنې پروسې سره د توپیر استنباط غوره کوي، په طبیعي کې د پام وړ ښه والی ترلاسه کوي.
د: لپاره غوره د طبیعي پروسوډي سره عمومي موخه ليکنه- په- وينا
ازموېل وړیا
MeloTTS وړیا
د MyShell.ai لخوا MeloTTS یو څو ژبنی TTS کتابتون دی چې د انګلیسي (امریکایی، برتانوي، هند، آسټرالیا)، هسپانوي، فرانسوي، چینایي، جاپاني، او کوریایي ملاتړ کوي. دا خورا ګړندی دی، یوازې د CPU په نږدې ریښتیني وخت سرعت کې د متن پروسس کول. MeloTTS د تولید کارولو لپاره ډیزاین شوی او د CPU او GPU دواړو استنباط ملاتړ کوي.
د: لپاره غوره د تولید غوښتنلیکونه چې د چټک، څو ژبو TTS ته اړتیا لري
ازموېل وړیا
Kani TTS 2 وړیا
Kani-TTS-2 د NineNineSix لخوا د 400M پارامتر ماډل دی چې د Nvidia NanoCodec سره د LiquidAI LFM2 بیکبون باندې جوړ شوی. دا یوازې په 3GB VRAM کې چلیږي او په ~ 2 ثانیو کې د وینا 10 ثانیې ترلاسه کوي (RTF 0.2).
د: لپاره غوره چټک نسل، ټیټ سرچینو چاپیریال، چټک مخکتنې
ازموېل وړیا
OuteTTS وړیا
OuteTTS د متن-to-speech وړتیاو سره د لوی ژبې ماډلونه پراخوي پداسې حال کې چې اصلي معمارۍ ساتي. دا د lama.cpp (CPU / GPU) ، د مخ د مخ ترمیم ، ExLlamaV2 ، VLLM ، او حتی د بریښنالیک بریښنالیک له لارې د بریښنالیک بریښنالیک له لارې د بریښنالیک بریښنالیک ملاتړ کوي.
د: لپاره غوره د edge پلي کول، د بریښنالیک پر بنسټ TTS، د ټیټ سرچینو چاپیریال
ازموېل وړیا
Pocket TTS وړیا
د Kyutai لخوا د پوک TTS (د Moshi جوړونکي) یو کمپیکٹ 100M پارامتر متن-to-speech ماډل دی چې د خپل وزن څخه پورته ښه پوښي. دا په CPU کې په موثره توګه چلیږي، د یو واحد آډیو نمونې څخه د صفر-شوت غږ کلونینګ ملاتړ کوي، او طبیعي غږیز وینا تولیدوي. د کوچني ماډل اندازه دا د څنډې ویش او ټیټ سرچینو چاپیریال لپاره مثالی کوي.
د: لپاره غوره د رڼا ویش، یوازې CPU چاپیریال، د غږ ګړندی کلونینګ
ازموېل وړیا
Kitten TTS وړیا
د KittenML لخوا Kitten TTS د ONNX په بنسټ جوړ شوی یو ډیر روښانه متن-to-speech ماډل دی. د 15M څخه 80M پارامترونو (په ډیسک کې 25-80 MB) ته د مختلفو سره، دا د GPU اړتیا پرته د CPU په اړه د لوړ کیفیت غږ ترکیب وړاندې کوي. د 8 جوړ شوي غږونه، د تنظیم وړ وینا سرعت، او د شمیرو، پیسو او واحدونو لپاره د متن پرمخ وړلو لپاره جوړ شوی. د څنډې پلي کولو او ټیټ-لاتینټ غوښتنلیکونو لپاره ایډیال.
د: لپاره غوره د چټک رڼا TTS، د څنډې ویش، د ټیټ-لاتینټ غوښتنلیکونه
ازموېل وړیا
Ming-Omni TTS وړیا
د شاملولو AI لخوا د Ming-omni-tts-0.5B یو کمپیکٹ Omni-modal وینا ماډل دی چې د BailingMM کثافت ستونځه سره د پیچ-by-Patch جریان مطابقت آډیو ډیکوډر سره جوړ شوی. د 44.1kHz محصول (د CD کیفیت ته نږدې) وړاندې کوي، د 3 + ثانوي حوالې څخه د صفر-شوت غږ کلونینګ ملاتړ کوي، او د JSON لارښوونو له لارې د احساس / ژبې / BGM کنټرول شامل دي. د چینایی معیارونو په اړه د 0.83٪ WER.
د: لپاره غوره د لوړ وفاداري دوه ژبه کیسه، احساس کنترول غږ اداکارۍ، د چين د آډیو کتاب محتوا
ازموېل وړیا
MOSS-TTS Nano وړیا
MOSS-TTS-Nano-100M is OpenMOSS's compact 100M-parameter variant of the MOSS-TTS family, sharing the delay-transformer architecture. Trades the 8B model's peak quality for ~80x smaller weights and dramatically lower per-request VRAM, making it suitable for free-tier and high-throughput deployments. Same 20-language reach.
د: لپاره غوره Free-tier TTS, high-volume production, low-latency interactive use
ازموېل وړیا
Bark تلواله
د ترانسپورت پر بنسټ د متن څخه غږیز ماډل چې واقعیت لرونکي وینا، موسیقۍ او غږ اغېزې تولیدوي.
: جوړوونکی Suno · : منښتليک MIT
هڅه کول
Bark Small تلواله
سره د چټک استنباط او د حافظې د کارولو کم د Bark روښانه نسخه.
: جوړوونکی Suno · : منښتليک MIT
هڅه کول
CosyVoice 2 تلواله
د Alibaba's scaleable streaming TTS د انساني مساوات طبیعي او نږدې صفر latency سره.
: جوړوونکی Alibaba (Tongyi Lab) · : منښتليک Apache 2.0
هڅه کول
Dia TTS تلواله
د څو ويناوالو د خبرو اترو نسل ماډل چې د ويناوالو ترمنځ طبیعي خبرې اترې رامینځته کوي.
: جوړوونکی Nari Labs · : منښتليک Apache 2.0
هڅه کول
Parler TTS تلواله
تاسو په طبیعي ژبه کې غواړئ غږ تشریح کړئ او Parler د مطابقت وینا تولیدوي.
: جوړوونکی Hugging Face · : منښتليک Apache 2.0
هڅه کول
IndexTTS-2 تلواله
صفر-شوت TTS سره fine-grained احساس کنټرول او لوړ expressivity.
: جوړوونکی Index Team · : منښتليک Bilibili Model License
هڅه کول
Spark TTS تلواله
د غږ کلونینګ TTS سره د کنټرول وړ احساس او د پیغامونو له لارې د خبرو کولو سټایل.
: جوړوونکی SparkAudio · : منښتليک CC BY-NC-SA 4.0
هڅه کول
GPT-SoVITS تلواله
څو-شوټ غږ کلونینګ TTS چې د غږ له یوازې 5 ثانیو څخه هر غږ تکراروي.
: جوړوونکی RVC-Boss · : منښتليک MIT
هڅه کول
Orpheus تلواله
د انساني کچې احساساتي TTS ماډل د وینا د معلوماتو په 100K ساعتونو کې روزل شوی.
: جوړوونکی Canopy Labs · : منښتليک Llama 3.2 Community
هڅه کول
Qwen3 TTS تلواله
Alibaba's multilingual TTS سره د غږ کلونینګ، preset غږونه، او د متن څخه د غږ ډیزاین.
: جوړوونکی Alibaba (Qwen) · : منښتليک Apache 2.0
هڅه کول
VieNeu-TTS-v2 تلواله
Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.
: جوړوونکی Phạm Nguyễn Ngọc Bảo · : منښتليک Apache 2.0
هڅه کول
Chatterbox Turbo تلواله
چټک Chatterbox د sub-200ms latency او paralinguistic توري د خندا، کولمو، او نور.
: جوړوونکی Resemble AI · : منښتليک MIT
هڅه کول
VoxCPM تلواله
د Tokenizer-Free TTS تولید 44.1kHz آډیو سره د متن-aware پاراګراف مطابقت.
: جوړوونکی OpenBMB · : منښتليک Apache 2.0
هڅه کول
VibeVoice تلواله
د مایکروسافټ ماډل د اوږدې بڼې څو-څرګندونکو محتوا لکه پوډکاسټونه او آډیو کتابونه.
: جوړوونکی Microsoft · : منښتليک MIT
هڅه کول
CosyVoice3 تلواله
د راتلونکي نسل څو ژبه TTS سره د bi-streaming، احساس کنټرول، او صفر-شوت غږ کلونينګ.
: جوړوونکی Alibaba (FunAudioLLM) · : منښتليک Apache 2.0
هڅه کول
NAMAA Saudi TTS تلواله
لومړی د سعودي عرب TTS. د Chatterbox-کیفیت غږ کلونینګ سره د سعودي ژبه.
: جوړوونکی NAMAA Space · : منښتليک MIT
هڅه کول
Darwin TTS تلواله
د FFN وزن سره د کراس-موډل Qwen3-TTS ډول د Qwen3-1.7B ژبې ماډل څخه د تیز څو ژبو کلون کولو لپاره مخلوط شوی.
: جوړوونکی FINAL-Bench · : منښتليک Apache 2.0
هڅه کول
MOSS-TTSD تلواله
د څو غږیز خبرو اترو دوام ماډل - د 5 غږیز غږونو او د 60 دقیقو سره د پوډکاسټ ډول خبرې اترې رامینځته کړئ.
: جوړوونکی OpenMOSS · : منښتليک Apache 2.0
هڅه کول
CosyVoice 2
د Alibaba's scaleable streaming TTS د انساني مساوات طبیعي او نږدې صفر latency سره.
: ژبې en, zh, ja, ko, fr, de, it, es
غږ کلونول
Spark TTS
د غږ کلونینګ TTS سره د کنټرول وړ احساس او د پیغامونو له لارې د خبرو کولو سټایل.
: ژبې en, zh
غږ کلونول
GPT-SoVITS
څو-شوټ غږ کلونینګ TTS چې د غږ له یوازې 5 ثانیو څخه هر غږ تکراروي.
: ژبې en, zh, ja, ko
غږ کلونول
Chatterbox
د Resemble AI څخه د احساس کنترول سره د state-of-the-art zero-shot غږ کلونینګ.
: ژبې en
غږ کلونول
OpenVoice
د ګړندي غږ کلونینګ د سټایل، احساس، او ټینګار په اړه د غوړ کنټرول سره.
: ژبې en, zh, ja, ko, fr, es
غږ کلونول
VieNeu-TTS-v2
Vietnamese + English code-switching TTS with 7 preset voices and zero-shot voice cloning. CPU-only, no GPU required.
: ژبې vi, en
غږ کلونول
Chatterbox Turbo
چټک Chatterbox د sub-200ms latency او paralinguistic توري د خندا، کولمو، او نور.
: ژبې en
غږ کلونول
VoxCPM
د Tokenizer-Free TTS تولید 44.1kHz آډیو سره د متن-aware پاراګراف مطابقت.
: ژبې en, zh
غږ کلونول
OuteTTS
د LLM پر بنسټ TTS چې د CPU، GPU، یا د مرورګر له لارې د llama.cpp او Transformers.js له لارې چلیږي.
: ژبې en
غږ کلونول
Pocket TTS
د Kyutai لخوا د یو واحد نمونې څخه د غږ کلون کولو سره د 100M پارامتر ماډل.
: ژبې en, fr
غږ کلونول
CosyVoice3
د راتلونکي نسل څو ژبه TTS سره د bi-streaming، احساس کنټرول، او صفر-شوت غږ کلونينګ.
: ژبې en, zh, ja, ko, de, es, fr, it, ru
غږ کلونول
NAMAA Saudi TTS
لومړی د سعودي عرب TTS. د Chatterbox-کیفیت غږ کلونینګ سره د سعودي ژبه.
: ژبې ar
غږ کلونول
Darwin TTS
د FFN وزن سره د کراس-موډل Qwen3-TTS ډول د Qwen3-1.7B ژبې ماډل څخه د تیز څو ژبو کلون کولو لپاره مخلوط شوی.
: ژبې en, ko, ja, zh
غږ کلونول
MOSS-TTSD
د څو غږیز خبرو اترو دوام ماډل - د 5 غږیز غږونو او د 60 دقیقو سره د پوډکاسټ ډول خبرې اترې رامینځته کړئ.
: ژبې en, zh
غږ کلونول
Ming-Omni TTS
د 0.5B د شاملولو AI څخه د 44.1kHz لوړ وفادارۍ او د صفر-شوټ غږ کلون کولو سره د 0.5B Omni-modal وینا ماډل.
: ژبې en, zh
غږ کلونول
MOSS-TTS Nano
Tiny 100M MOSS-TTS variant — same architecture, 80x smaller, free-tier latency.
: ژبې en, zh, de, es, fr, ja, it, ko, ru, ar, pt
غږ کلونولپرمخبيونکی لومړی API
OpenAI-متوافق REST API. یو پای ټکی، 22+ ماډلونه. د ریښتیني وخت غوښتنلیکونو لپاره د سټرینګ ملاتړ.
- OpenAI سره سمون لرونکی بڼه
- د رښتينې مهال کاريالونو لپاره ټي ټي اېس لېږل
- د لویو دندو لپاره ډله پروسس
- خبرتياوې Webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ساده، شفاف قیمتونه
وړیا پیل کړئ. اندازه کړئ لکه څنګه چې تاسو وده کوئ.
وړیا
15,000 کرکټر + 5,000 / ورځ
- د 7 وړیا ماډلونه په شمول د کوکورو
- په هر نسل کې ۵۰۰۰ کارتونه
- API لاسرسي شامل
پرو
2,000 کریډیټونه / میاشت
- په پېلوونکي کې هرڅه
- لاسرسی API
- لومړیتوب بهير
ډېرې پوښتنې
موږ څه کولای شي چې ښه شي؟ ستاسو د نظر موږ سره مرسته کوي د ستونزو د حل.
نن د AI غږ کارولو سره پیل کړئ
د TTS.ai په کارولو سره جوړونکي، جوړونکي، او سوداګرۍ سره یوځای شئ