وړیا AI ليکنه وينا ته

31+ خلاص سرچینه ماډلونه، 231+ غږونه، 34+ ژبې. نه حساب ته اړتيا ده.

8K+
جوړونکي
32K+
نسلونه
31+
مصنوعي استخباراتي ماډلونه
231+
غږونه
0/500 لوښه · Sign up for 5,000 per generation → وړیا
Love TTS.ai? Tell your friends!

هرڅه چې تاسو د غږ AI لپاره اړتیا لرئ

30+ وسیلې د خلاص سرچینې AI ماډلونو لخوا چلول کیږي

31+ AI غږ نمونې

په یوه پلیټ فارم کې د خلاصې سرچینې TTS ماډلونو ترټولو پراخه ټولګه

KokoroKokoro Free

کوکورو د 82 ملیون پارامتر متن-to-speech ماډل دی چې د خپل وزن ټولګي څخه پورته ښه ټوټې کوي. د دې کوچني اندازې سره سره، دا د پام وړ طبیعي او څرګند وینا تولیدوي. کوکورو د انګلیسي، جاپاني، چینایي، او کوریایي په شمول ډیری ژبې ملاتړ کوي چې د څرګندو غږونو سره مختلف دي. دا په حیرانتیا سره چټک دی - په GPU کې د ریښتیني وخت څخه نږدې 100x غږ تولیدوي.

د: لپاره غوره د لوړ کیفیت TTS د لږترلږه latency سره، د جریان غوښتنلیکونه

ازموېل وړیا

PiperPiper Free

پیپر د Rhasspy لخوا رامینځته شوی یو لږ وزن لرونکی متن دی چې د VITS او larynx معمارۍ کاروي. دا په بشپړ ډول په CPU کې چلیږي، دا د edge وسیلو، کور اتومات، او غوښتنلیکونو لپاره مثالی کوي چې آفلاین TTS ته اړتیا لري. د 30 + ژبو په اوږدو کې د 100 غږونو سره، پیپر حتی د Raspberry Pi 4 کې د ریښتیني وخت سرعت کې طبیعي غږیز وینا وړاندې کوي.

د: لپاره غوره چټکې مخليدنې، لاسرسي، او نښلول شوي کاريالونه

ازموېل وړیا

VITSVITS Free

VITS (د پای څخه تر پای پورې د متن څخه د خبرو اترو لپاره د مقابلې زده کړې سره توپیر) یو موازي پای ته رسیدلی TTS میتود دی چې د اوسني دوه مرحلو ماډلونو په پرتله ډیر طبیعي غږیز غږ رامینځته کوي. دا د عادي جریانونو او د مقابلې روزنې پروسې سره د توپیر استنباط غوره کوي، په طبیعي کې د پام وړ ښه والی ترلاسه کوي.

د: لپاره غوره د طبیعي پروسوډي سره عمومي موخه ليکنه- په- وينا

ازموېل وړیا

MeloTTSMeloTTS Free

د MyShell.ai لخوا MeloTTS یو څو ژبنی TTS کتابتون دی چې د انګلیسي (امریکایی، برتانوي، هند، آسټرالیا)، هسپانوي، فرانسوي، چینایي، جاپاني، او کوریایي ملاتړ کوي. دا خورا ګړندی دی، یوازې د CPU په نږدې ریښتیني وخت سرعت کې د متن پروسس کول. MeloTTS د تولید کارولو لپاره ډیزاین شوی او د CPU او GPU دواړو استنباط ملاتړ کوي.

د: لپاره غوره د تولید غوښتنلیکونه چې د چټک، څو ژبو TTS ته اړتیا لري

ازموېل وړیا

OuteTTSOuteTTS Free

OuteTTS د متن-to-speech وړتیاو سره د لوی ژبې ماډلونه پراخوي پداسې حال کې چې اصلي معمارۍ ساتي. دا د lama.cpp (CPU / GPU) ، د مخ د مخ ترمیم ، ExLlamaV2 ، VLLM ، او حتی د بریښنالیک بریښنالیک له لارې د بریښنالیک بریښنالیک له لارې د بریښنالیک بریښنالیک ملاتړ کوي.

د: لپاره غوره د edge پلي کول، د بریښنالیک پر بنسټ TTS، د ټیټ سرچینو چاپیریال

ازموېل وړیا

Pocket TTSPocket TTS Free

د Kyutai لخوا د پوک TTS (د Moshi جوړونکي) یو کمپیکٹ 100M پارامتر متن-to-speech ماډل دی چې د خپل وزن څخه پورته ښه پوښي. دا په CPU کې په موثره توګه چلیږي، د یو واحد آډیو نمونې څخه د صفر-شوت غږ کلونینګ ملاتړ کوي، او طبیعي غږیز وینا تولیدوي. د کوچني ماډل اندازه دا د څنډې ویش او ټیټ سرچینو چاپیریال لپاره مثالی کوي.

د: لپاره غوره د رڼا ویش، یوازې CPU چاپیریال، د غږ ګړندی کلونینګ

ازموېل وړیا

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

د: لپاره غوره Fast lightweight TTS, edge deployment, low-latency applications

ازموېل وړیا

BarkBark Standard

د ترانسپورت پر بنسټ د متن څخه غږیز ماډل چې واقعیت لرونکي وینا، موسیقۍ او غږ اغېزې تولیدوي.

: جوړوونکی Suno · : منښتليک MIT

هڅه کول

Bark SmallBark Small Standard

سره د چټک استنباط او د حافظې د کارولو کم د Bark روښانه نسخه.

: جوړوونکی Suno · : منښتليک MIT

هڅه کول

CosyVoice 2CosyVoice 2 Standard

د Alibaba's scaleable streaming TTS د انساني مساوات طبیعي او نږدې صفر latency سره.

: جوړوونکی Alibaba (Tongyi Lab) · : منښتليک Apache 2.0

هڅه کول

Dia TTSDia TTS Standard

د څو ويناوالو د خبرو اترو نسل ماډل چې د ويناوالو ترمنځ طبیعي خبرې اترې رامینځته کوي.

: جوړوونکی Nari Labs · : منښتليک Apache 2.0

هڅه کول

Parler TTSParler TTS Standard

تاسو په طبیعي ژبه کې غواړئ غږ تشریح کړئ او Parler د مطابقت وینا تولیدوي.

: جوړوونکی Hugging Face · : منښتليک Apache 2.0

هڅه کول

GLM-TTSGLM-TTS Standard

د خلاصې سرچینې TTS ماډلونو تر منځ تر ټولو ټیټه کرکټر غلطۍ کچه ترلاسه کوي.

: جوړوونکی Zhipu AI · : منښتليک GLM-4 License

هڅه کول

IndexTTS-2IndexTTS-2 Standard

صفر-شوت TTS سره fine-grained احساس کنټرول او لوړ expressivity.

: جوړوونکی Index Team · : منښتليک Bilibili Model License

هڅه کول

Spark TTSSpark TTS Standard

د غږ کلونینګ TTS سره د کنټرول وړ احساس او د پیغامونو له لارې د خبرو کولو سټایل.

: جوړوونکی SparkAudio · : منښتليک CC BY-NC-SA 4.0

هڅه کول

GPT-SoVITSGPT-SoVITS Standard

څو-شوټ غږ کلونینګ TTS چې د غږ له یوازې 5 ثانیو څخه هر غږ تکراروي.

: جوړوونکی RVC-Boss · : منښتليک MIT

هڅه کول

OrpheusOrpheus Standard

د انساني کچې احساساتي TTS ماډل د وینا د معلوماتو په 100K ساعتونو کې روزل شوی.

: جوړوونکی Canopy Labs · : منښتليک Llama 3.2 Community

هڅه کول

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS سره د غږ کلونینګ، preset غږونه، او د متن څخه د غږ ډیزاین.

: جوړوونکی Alibaba (Qwen) · : منښتليک Apache 2.0

هڅه کول

Chatterbox TurboChatterbox Turbo Standard

چټک Chatterbox د sub-200ms latency او paralinguistic توري د خندا، کولمو، او نور.

: جوړوونکی Resemble AI · : منښتليک MIT

هڅه کول

Dia 2Dia 2 Standard

د ډرایو-پنځم خبرو اترو TTS سره د څو ويناوالو خبرو اترو او paralinguistic cues.

: جوړوونکی Nari Labs · : منښتليک Apache 2.0

هڅه کول

VoxCPMVoxCPM Standard

د Tokenizer-Free TTS تولید 44.1kHz آډیو سره د متن-aware پاراګراف مطابقت.

: جوړوونکی OpenBMB · : منښتليک Apache 2.0

هڅه کول

TADATADA Standard

د متن-آکوستیک دوه ګونی ترتیب سره صفر-هلوسن TTS، د LLM TTS څخه 5x ګړندی.

: جوړوونکی Hume AI · : منښتليک MIT

هڅه کول

VibeVoiceVibeVoice Standard

د مایکروسافټ ماډل د اوږدې بڼې څو-څرګندونکو محتوا لکه پوډکاسټونه او آډیو کتابونه.

: جوړوونکی Microsoft · : منښتليک MIT

هڅه کول

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

: جوړوونکی Alibaba (FunAudioLLM) · : منښتليک Apache 2.0

هڅه کول

ChatterboxChatterbox Premium

د Resemble AI څخه د احساس کنترول سره د state-of-the-art zero-shot غږ کلونینګ.

:څرنګوالی

هڅه کول

Tortoise TTSTortoise TTS Premium

د څو غږونو متن-تر-غږ په کیفیت تمرکز کوي د اتوریګریفیک معمارۍ سره.

:څرنګوالی

هڅه کول

StyleTTS 2StyleTTS 2 Premium

د سټایل خپریدو او د مقابلې روزنې له لارې د انساني کچې متن څخه وینا ته.

:څرنګوالی

هڅه کول

OpenVoiceOpenVoice Premium

د ګړندي غږ کلونینګ د سټایل، احساس، او ټینګار په اړه د غوړ کنټرول سره.

:څرنګوالی

هڅه کول

Sesame CSMSesame CSM Premium

د خبرو اترو ماډل چې د مناسب وخت او احساس سره طبیعي خبرو اترو ته وده ورکوي.

:څرنګوالی

هڅه کول

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

:څرنګوالی

هڅه کول

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

:څرنګوالی

هڅه کول

CosyVoice 2CosyVoice 2

د Alibaba's scaleable streaming TTS د انساني مساوات طبیعي او نږدې صفر latency سره.

: ژبې en, zh, ja, ko, fr, de, it, es

غږ کلونول

GLM-TTSGLM-TTS

د خلاصې سرچینې TTS ماډلونو تر منځ تر ټولو ټیټه کرکټر غلطۍ کچه ترلاسه کوي.

: ژبې en, zh

غږ کلونول

IndexTTS-2IndexTTS-2

صفر-شوت TTS سره fine-grained احساس کنټرول او لوړ expressivity.

: ژبې en, zh

غږ کلونول

Spark TTSSpark TTS

د غږ کلونینګ TTS سره د کنټرول وړ احساس او د پیغامونو له لارې د خبرو کولو سټایل.

: ژبې en, zh

غږ کلونول

GPT-SoVITSGPT-SoVITS

څو-شوټ غږ کلونینګ TTS چې د غږ له یوازې 5 ثانیو څخه هر غږ تکراروي.

: ژبې en, zh, ja, ko

غږ کلونول

ChatterboxChatterbox

د Resemble AI څخه د احساس کنترول سره د state-of-the-art zero-shot غږ کلونینګ.

: ژبې en

غږ کلونول

Tortoise TTSTortoise TTS

د څو غږونو متن-تر-غږ په کیفیت تمرکز کوي د اتوریګریفیک معمارۍ سره.

: ژبې en

غږ کلونول

OpenVoiceOpenVoice

د ګړندي غږ کلونینګ د سټایل، احساس، او ټینګار په اړه د غوړ کنټرول سره.

: ژبې en, zh, ja, ko, fr, de, es, it

غږ کلونول

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS سره د غږ کلونینګ، preset غږونه، او د متن څخه د غږ ډیزاین.

: ژبې en, zh, ja, ko, de, fr, ru, pt, es, it

غږ کلونول

Chatterbox TurboChatterbox Turbo

چټک Chatterbox د sub-200ms latency او paralinguistic توري د خندا، کولمو، او نور.

: ژبې en

غږ کلونول

VoxCPMVoxCPM

د Tokenizer-Free TTS تولید 44.1kHz آډیو سره د متن-aware پاراګراف مطابقت.

: ژبې en, zh

غږ کلونول

OuteTTSOuteTTS

د LLM پر بنسټ TTS چې د CPU، GPU، یا د مرورګر له لارې د llama.cpp او Transformers.js له لارې چلیږي.

: ژبې en

غږ کلونول

Pocket TTSPocket TTS

د Kyutai لخوا د یو واحد نمونې څخه د غږ کلون کولو سره د 100M پارامتر ماډل.

: ژبې en, fr

غږ کلونول

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

: ژبې en, zh, ja, ko, de, es, fr, it, ru

غږ کلونول

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

: ژبې en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

غږ کلونول

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

: ژبې en, zh

غږ کلونول

پرمخبيونکی لومړی API

OpenAI-متوافق REST API. یو پای ټکی، 22+ ماډلونه. د ریښتیني وخت غوښتنلیکونو لپاره د سټرینګ ملاتړ.

  • OpenAI سره سمون لرونکی بڼه
  • د رښتينې مهال کاريالونو لپاره ټي ټي اېس لېږل
  • د لویو دندو لپاره ډله پروسس
  • خبرتياوې Webhook
لاسوندونه ښودل API
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ساده، شفاف قیمتونه

وړیا پیل کړئ. اندازه کړئ لکه څنګه چې تاسو وده کوئ.

وړیا

$0

50 کرېډیټونه

  • Kokoro, Piper, VITS, MeloTTS
  • ۵۰۰ لوښه حد
  • 3 جن / ساعت (هېڅ حساب)
په وړیا ډول راجستر شئ

پېلونکی

$9/مياشتې

500 کریډیټونه / میاشت

  • ټول 22+ ماډلونه
  • په هر نسل کې ۱۰۰۰۰۰ کرښې
  • غږ نقلول
پېل کول
تر ټولو مشهور

پرو

$29/مياشتې

2,000 کریډیټونه / میاشت

  • په پېلوونکي کې هرڅه
  • لاسرسی API
  • لومړیتوب بهير
پرو ترلاسه کول

سوداګري

$99/مياشتې

10,000 کریډیټونه / میاشت

  • په پرو کې هرڅه
  • ګڼ API
  • وړومبېتوب لړ
د سوداګرۍ ترلاسه کول

د کریډیټ بسته په شمول ټول پلانونه وګورئ →

ډېرې پوښتنې

TTS.ai تر ټولو پراخه AI غږ پلیټ فارم دی، چې د 22 + متن-to-speech ماډلونه، د غږ کلونینګ، د وینا-to-text، او آډیو وسیلې وړاندې کوي. ټول ماډلونه د وړیا سرچینې پرته د پلورونکي لاک-in سره خلاص دي.

هو! TTS.ai د کوکورو، پیپر، VITS، او MeloTTS ماډلونو سره وړیا متن-to-talk وړاندیز کوي. هیڅ حساب ته اړتیا نشته. د 15,000 وړیا کرکټرونو ترلاسه کولو او ټولو ماډلونو ته لاسرسی لپاره راجستر کړئ. د 9 / میاشتې په پیل کې د 9 پلانونه پیل کیږي.

د سرعت لپاره، Kokoro یا Piper وکاروئ. د کیفیت لپاره، CosyVoice 2 یا StyleTTS 2 هڅه وکړئ. د غږ کلون کولو لپاره، Chatterbox یا GPT-SoVITS وکاروئ. د خبرو اترو لپاره، Dia TTS وکاروئ. د پرتله کولو لپاره په ورته متن کې څو ماډلونه هڅه وکړئ.

هو. د TTS، STT، غږ کلونینګ، او آډیو وسیلو لپاره د OpenAI-متوافق REST API. د پرو ($ 29 / mo) او شرکت ($ 99 / mo) پلانونو کې شتون لري. په tts.ai / api / کې اسناد وګورئ.

د غږ کیفیت د ماډل لخوا توپیر لري. د CosyVoice 2، StyleTTS 2، او Chatterbox په څیر پریم ماډلونه د طبیعي intonation او احساس سره نږدې د انسان کیفیت وینا تولیدوي. د Kokoro په څیر وړیا ماډلونه د ډیری کارونې قضیو لپاره غوره کیفیت وړاندې کوي.

TTS.ai د خپل ماډل کتابتون په اوږدو کې د 30 + ژبو ملاتړ کوي. انګلیسي ترټولو پراخه ماډل ملاتړ لري، مګر د CosyVoice 2 په څیر ماډلونه چینایي، جاپاني او کوریایي پوښي؛ GPT-SoVITS چینایي، جاپاني، کوریایي او انګلیسي اداره کوي؛ او MeloTTS انګلیسي، هسپانوي، فرانسوي، چینایي، جاپاني او کوریایي ملاتړ کوي.

هو. ټول پروسس زموږ د وقف شوي GPU سرورونو کې پیښیږي. موږ ستاسو د متن ننوتلو یا د تحویلي وروسته تولید شوي غږ ذخیره نه کوو. د کلون کولو لپاره پورته شوي غږ نمونې یوازې د اوسني غونډې لپاره کارول کیږي او نه ساتل کیږي. موږ هیڅکله ستاسو معلومات د دریم ګوندونو سره شریک نه کوو یا یې د موټرو ماډلونو لپاره وکاروئ.

هو. ټول آډیو چې په TTS.ai کې رامینځته کیږي ستاسو د سوداګرۍ لپاره کارول کیږي ، پشمول د یوټیوب ویډیوګانو ، پوډکاسټونو ، آډیو کتابونو ، غوښتنلیکونو ، اعلاناتو ، او محصولاتو لپاره. زموږ ماډلونه د اجازه لرونکي جوازونو (MIT ، Apache 2.0) لاندې خلاص سرچینه ده.

TTS.ai په WAV بڼه د تل لپاره د اعظمي کیفیت لپاره غږ تولیدوي. تاسو کولی شئ MP3، FLAC، OGG، یا M4A زموږ د وړيا غږ Converter وسیله په کارولو سره بدل کړي. د API په غوښتنه کې په مستقیم ډول ستاسو د غوره محصول بڼه مشخص ملاتړ کوي.

د غږ یوه لنډه غږیزه نمونه (د 5 ثانیو په څیر لږ) پورته کړئ چې تاسو یې غواړئ کلون کړئ ، بیا په هغه غږ کې د وینا تولید کولو لپاره کوم متن ولیکئ. د Chatterbox ، GPT-SoVITS ، او CosyVoice 2 په څیر ماډلونه د غږ کلون کولو ملاتړ کوي. د کلون شوي غږ غږ ، غږ ، او خبرې کولو سټایل نیولي.

وړیا ماډلونه (Kokoro، Piper، VITS، MeloTTS) هیڅ حساب ته اړتیا نلري او د صفر کریډیټ لګښت لري. معیاري ماډلونه (2 کریډیټونه / 1K کریډیټونه) کې د Bark، CosyVoice 2، F5-TTS، او Dia شامل دي. د پریمیم ماډلونه (4 کریډیټونه / 1K کریډیټونه) کې د OpenVoice، Chatterbox، StyleTTS 2، او Tortoise شامل دي. د تادیې ماډلونه عموما لوړ کیفیت، ډیر غږونه او د غږ کلون کولو په څیر اضافي ب featuresې وړاندې کوي.

هو. د API د خبرو اترو لپاره د متن لوی حجم بدلولو لپاره د ډله پروسس ملاتړ کوي. څو غوښتنې وړاندې کړئ او د کاري UUIDs په کارولو سره د ناڅرګندتیا پایلې ترلاسه کړئ. د شرکت پلانونه ($ 99 / mo) د چټکه ډله پروسس لپاره د لومړیتوب قطار لاسرسی شامل دي. د آډیوبوک تولید، کورس مینځپانګې، او د لوی پیمانه ویزو پروژو لپاره ایډیال.
4.0/5 (22)

What could we improve? Your feedback helps us fix issues.

نن د AI غږ کارولو سره پیل کړئ

د TTS.ai په کارولو سره جوړونکي، جوړونکي، او سوداګرۍ سره یوځای شئ