مفت AI تحریر سے کلام
22+ اوپن سورس ماڈل، 100+ آوازیں، 32+ زبانیں. کوئی اکاؤنٹ ضروری نہیں.
آواز AI کے ليے جو آپ کو ضرورت هے
24+ اوپن سورس AI ماڈلز سے طاقتور 26 ٹولز
22+ AI آواز ماڈل
ایک پلیٹ فارم میں اوپن سورس TTS ماڈلز کا سب سے وسیع مجموعہ
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
بہترین: High-quality TTS with minimal latency, streaming applications
مفت آزمائیں
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
بہترین: Quick previews, accessibility, and embedded applications
مفت آزمائیں
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
بہترین: General-purpose text-to-speech with natural prosody
مفت آزمائیں
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
بہترین: پروڈکشن ایپلیکیشنز کو تیز، متعدد زبانوں کے TTS کی ضرورت ہے
مفت آزمائیں
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
ڈیولپر: Suno · لائسنس: MIT
اس کی کوشش کرو
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
ڈیولپر: Suno · لائسنس: MIT
اس کی کوشش کرو
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ڈیولپر: Alibaba (Tongyi Lab) · لائسنس: Apache 2.0
اس کی کوشش کرو
Dia TTS Standard
ملٹی اسپیکر ڈائیلاگ جنریشن ماڈل جو اسپیکرز کے درمیان قدرتی گفتگو بناتا ہے.
ڈیولپر: Nari Labs · لائسنس: Apache 2.0
اس کی کوشش کرو
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
ڈیولپر: Hugging Face · لائسنس: Apache 2.0
اس کی کوشش کرو
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
ڈیولپر: Index Team · لائسنس: Apache 2.0
اس کی کوشش کرو
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
ڈیولپر: SparkAudio · لائسنس: Apache 2.0
اس کی کوشش کرو
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
ڈیولپر: RVC-Boss · لائسنس: MIT
اس کی کوشش کرو
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
ڈیولپر: Canopy Labs · لائسنس: Llama 3.2 Community
اس کی کوشش کرو
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
ڈیولپر: Alibaba (Qwen) · لائسنس: Apache 2.0
اس کی کوشش کرو
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
زبانیں: en, zh, ja, ko, fr, de, it, es
آواز کلون کریں
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
زبانیں: en, zh
آواز کلون کریں
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
زبانیں: en, zh
آواز کلون کریں
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
زبانیں: en, zh, ja, ko
آواز کلون کریں
Chatterbox
حالت-of-the-آرٹ صفر-شٹ آواز کلوننگ Resemble AI سے جذباتی کنٹرول کے ساتھ.
زبانیں: en
آواز کلون کریں
Tortoise TTS
کثیر آواز ٹیکس-ٹو-سپیچ خودکار واپسی فن تعمیر کے ساتھ معیار پر توجہ مرکوز.
زبانیں: en
آواز کلون کریں
OpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
زبانیں: en, zh, ja, ko, fr, de, es, it
آواز کلون کریں
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
زبانیں: en, zh, ja, ko, de, fr, ru, pt, es, it
آواز کلون کریںڈیولپر-پہلی API
OpenAI-مطابق REST API. ایک انتہا پوائنٹ، 22+ ماڈل. ریل-ٹائم ایپلیکیشنز کے لئے اسٹریمنگ سہولت.
- OpenAI سازگار فارمیٹ
- ریئل ٹائم ایپلیکیشنز کے لیے TTS اسٹریمنگ
- بڑے کاموں کے لیے بیچ پروسیسنگ
- Webhook اطلاعیں
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
سادہ، شفافیت قیمتوں
آزاد شروع. آپ کو بڑھتے ہوئے پیمانے.
مفت
50 کریڈٹ
- Kokoro, Piper, VITS, MeloTTS
- 500 حروف کی حد
- 3 جن / گھنٹہ (کوئی اکاؤنٹ نہیں)
پرو
2000 کریڈٹس/مہينا
- شروع کرنے میں سب کچھ
- API رسائی
- ترجیحی پروسیسنگ
بار بار پوچھے گئے سوالات
آج AI آواز استعمال کرنا شروع کریں
TTS.ai استعمال کر کے تخلیق کاروں، ڈیولپروں اور کاروباروں میں شامل ہوں