مفت AI تحریر سے کلام

22+ اوپن سورس ماڈل، 100+ آوازیں، 32+ زبانیں. کوئی اکاؤنٹ ضروری نہیں.

0/500 حروف مفت
کوئی کریڈٹ کارڈ نہیں 50 مفت کریڈٹس 32+ زبانیں تجارتی استعمال ٹھیک ہے
0:00 / 0:00
آڈیو ڈاؤن لوڈ کریں رابطہ 24 گھنٹوں میں ختم ہو جاتا ہے
TTS.ai کی طرح؟ اپنے دوستوں کو بتاو!

آواز AI کے ليے جو آپ کو ضرورت هے

24+ اوپن سورس AI ماڈلز سے طاقتور 26 ٹولز

22+ AI آواز ماڈل

ایک پلیٹ فارم میں اوپن سورس TTS ماڈلز کا سب سے وسیع مجموعہ

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

بہترین: High-quality TTS with minimal latency, streaming applications

مفت آزمائیں

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

بہترین: Quick previews, accessibility, and embedded applications

مفت آزمائیں

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

بہترین: General-purpose text-to-speech with natural prosody

مفت آزمائیں

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

بہترین: پروڈکشن ایپلیکیشنز کو تیز، متعدد زبانوں کے TTS کی ضرورت ہے

مفت آزمائیں

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

ڈیولپر: Suno · لائسنس: MIT

اس کی کوشش کرو

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

ڈیولپر: Suno · لائسنس: MIT

اس کی کوشش کرو

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

ڈیولپر: Alibaba (Tongyi Lab) · لائسنس: Apache 2.0

اس کی کوشش کرو

Dia TTSDia TTS Standard

ملٹی اسپیکر ڈائیلاگ جنریشن ماڈل جو اسپیکرز کے درمیان قدرتی گفتگو بناتا ہے.

ڈیولپر: Nari Labs · لائسنس: Apache 2.0

اس کی کوشش کرو

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

ڈیولپر: Hugging Face · لائسنس: Apache 2.0

اس کی کوشش کرو

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

ڈیولپر: Index Team · لائسنس: Apache 2.0

اس کی کوشش کرو

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

ڈیولپر: SparkAudio · لائسنس: Apache 2.0

اس کی کوشش کرو

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

ڈیولپر: RVC-Boss · لائسنس: MIT

اس کی کوشش کرو

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

ڈیولپر: Canopy Labs · لائسنس: Llama 3.2 Community

اس کی کوشش کرو

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

ڈیولپر: Alibaba (Qwen) · لائسنس: Apache 2.0

اس کی کوشش کرو

ChatterboxChatterbox Premium

حالت-of-the-آرٹ صفر-شٹ آواز کلوننگ Resemble AI سے جذباتی کنٹرول کے ساتھ.

معیار:

اس کی کوشش کرو

Tortoise TTSTortoise TTS Premium

کثیر آواز ٹیکس-ٹو-سپیچ خودکار واپسی فن تعمیر کے ساتھ معیار پر توجہ مرکوز.

معیار:

اس کی کوشش کرو

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

معیار:

اس کی کوشش کرو

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

معیار:

اس کی کوشش کرو

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

زبانیں: en, zh, ja, ko, fr, de, it, es

آواز کلون کریں

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

زبانیں: en, zh

آواز کلون کریں

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

زبانیں: en, zh

آواز کلون کریں

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

زبانیں: en, zh, ja, ko

آواز کلون کریں

ChatterboxChatterbox

حالت-of-the-آرٹ صفر-شٹ آواز کلوننگ Resemble AI سے جذباتی کنٹرول کے ساتھ.

زبانیں: en

آواز کلون کریں

Tortoise TTSTortoise TTS

کثیر آواز ٹیکس-ٹو-سپیچ خودکار واپسی فن تعمیر کے ساتھ معیار پر توجہ مرکوز.

زبانیں: en

آواز کلون کریں

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

زبانیں: en, zh, ja, ko, fr, de, es, it

آواز کلون کریں

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

زبانیں: en, zh, ja, ko, de, fr, ru, pt, es, it

آواز کلون کریں

ڈیولپر-پہلی API

OpenAI-مطابق REST API. ایک انتہا پوائنٹ، 22+ ماڈل. ریل-ٹائم ایپلیکیشنز کے لئے اسٹریمنگ سہولت.

  • OpenAI سازگار فارمیٹ
  • ریئل ٹائم ایپلیکیشنز کے لیے TTS اسٹریمنگ
  • بڑے کاموں کے لیے بیچ پروسیسنگ
  • Webhook اطلاعیں
API دستاویزات دیکھیں
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

سادہ، شفافیت قیمتوں

آزاد شروع. آپ کو بڑھتے ہوئے پیمانے.

مفت

$0

50 کریڈٹ

  • Kokoro, Piper, VITS, MeloTTS
  • 500 حروف کی حد
  • 3 جن / گھنٹہ (کوئی اکاؤنٹ نہیں)
مفت میں رجسٹر کریں

شروع

$9/ميگا بائٹ

500 کریڈٹ / ماہ

  • تمام 22+ ماڈل
  • 5000 حروف کی حد
  • آواز کا کلوننگ
شروع کریں
سب سے زیادہ مقبول

پرو

$29/ميگا بائٹ

2000 کریڈٹس/مہينا

  • شروع کرنے میں سب کچھ
  • API رسائی
  • ترجیحی پروسیسنگ
پرو حاصل کریں

انٹرپرائز

$99/ميگا بائٹ

10,000 کریڈٹس / ماہ

  • پرو میں سب کچھ
  • بلک API
  • ترجیحی قطار
سیلز کا رابطہ

View all plans including credit packs →

بار بار پوچھے گئے سوالات

TTS.ai سب سے وسیع AI آواز پلیٹ فارم ہے، 22+ متن سے کلام ماڈل، آواز کلوننگ، کلام سے متن، اور آڈیو ٹولز فراہم کرتا ہے.

جی ہاں! TTS.ai Kokoro، Piper، VITS، اور MeloTTS ماڈلز کے ساتھ مفت متن سے کلام کی پیشکش کرتا ہے۔ کوئی اکاؤنٹ ضروری نہیں ہے۔ 50 مفت کریڈٹ حاصل کرنے اور تمام ماڈلز تک رسائی حاصل کرنے کے لئے رجسٹر کریں۔ ادا کردہ منصوبے $9/مئی سے شروع ہوتے ہیں۔

رفتار کے ليے Kokoro يا Piper استعمال کريں معيار کے ليے CosyVoice 2 يا StyleTTS 2 استعمال کريں آواز کي کلوننگ کے ليے Chatterbox يا GPT-SoVITS استعمال کريں ديالوگ کے ليے Dia TTS استعمال کريں

ہاں۔ TTS، STT، وائٹ کلونینگ، اور آڈیو ٹولز کے لئے OpenAI-compatible REST API۔ پرو ($29/month) اور انٹرپرائز ($99/month) منصوبوں پر دستیاب۔ tts.ai/api/ پر دستاویزات دیکھیں۔

آواز کی کیفیت ماڈل کے مطابق مختلف ہوتی ہے۔ CosyVoice 2، StyleTTS 2، اور Chatterbox جیسے پرائم ماڈل انسانی معیار کے قریب کی باتیں پیدا کرتے ہیں۔ Kokoro جیسے مفت ماڈل اکثر استعمال کے حالات کے لئے بہترین کیفیت فراہم کرتے ہیں۔

TTS.ai اسکے ماڈل لائبريري ميں 30+ زبانوں کو سپورٽ کر تا هے ۔ انگريزي ميں سب سے وسیع ماڈل سپورٽ هے ، مگر CosyVoice 2 جیسے ماڈل چيني ، جاپاني اور کو رياني کو سمیٹ کر تا هے ۔ GPT-SoVITS چيني ، جاپاني ، کو رياني اور انگريزي کو ہینڈل کر تا هے ۔ اور MeloTTS انگريزي ، اسپينش ، فرانسيسي ، چيني ، جاپاني اور کو رياني کو سمیٹ کر تا هے ۔

جی ہاں. تمام پروسیسنگ ہمارے وقف GPU سرور پر ہوتا ہے. ہم آپ کے ٹیکس اینٹپ یا فراہمی کے بعد پیدا کی گئی آڈیو کو محفوظ نہیں کرتے. کلوننگ کے لیے اپ لوڈ کیے گئے آواز کے نمونے صرف جاری سیشن کے لیے استعمال کیے جاتے ہیں اور محفوظ نہیں کیے جاتے. ہم آپ کے ڈیٹا کو کبھی بھی تیسری پارٹیوں کے ساتھ شریک نہیں کرتے یا اسے ماڈلز کو تربیت دینے کے لیے استعمال نہیں کرتے.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai حداکثر معیار کے لیے WAV فارمیٹ میں ڈیفالٹ سے آڈیو پیدا کرتا ہے آپ MP3، FLAC، OGG، یا M4A میں تبدیل کر سکتے ہیں ہمارے مفت آڈیو کنورٹر ٹول کے استعمال سے. API آپ کی پسندیدہ آؤٹ پٹ فارمیٹ کو براہ راست درخواست میں بیان کرنے کی حمایت کرتا ہے.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

مفت ماڈلز (Kokoro, Piper, VITS, MeloTTS) کو کوئی اکاؤنٹ نہیں چاہیے اور صفر کریڈٹ کی قیمت ہے۔ معیاری ماڈلز (2 کریڈٹ / 1K حروف) میں Bark، CosyVoice 2، F5-TTS، اور Dia شامل ہیں۔ پرائم ماڈلز (4 کریڈٹ / 1K حروف) میں OpenVoice، Chatterbox، StyleTTS 2، اور Tortoise شامل ہیں۔ ادا کئے گئے ماڈلز عام طور پر بہتر کیفیت، زیادہ آوازیں، اور اضافی خصوصیات جیسے آواز کلوننگ پیش کرتے ہیں۔

جی ہاں، API بٹچ پروسیسنگ کی حمایت کرتا ہے جس سے بڑے پیمانے پر متن کو بولنے میں تبدیل کیا جاسکتا ہے۔ متعدد درخواستیں پیش کر سکتے ہیں اور UUIDs کے استعمال سے نتائج کو غیر ہم آہنگ طور پر حاصل کر سکتے ہیں۔ انٹرپرائز پلان ($99/month) میں تیز بٹچ پروسیسنگ کے لئے ترجیحاتی قطار رسائی شامل ہے۔ آڈیو بک پروڈکشن، کورس مواد، اور بڑے پیمانے پر وائٹ اوور پروجیکٹوں کے لئے بہترین۔
5.0/5 (1)

آج AI آواز استعمال کرنا شروع کریں

TTS.ai استعمال کر کے تخلیق کاروں، ڈیولپروں اور کاروباروں میں شامل ہوں