اوپن سورس ٹیکس سے اسپیکینگ ماڈلز

ہمارے پلیٹ فارم پر ہر ٹی ٹی ایس ماڈل تجارتی دوستانہ لائسنس کے ساتھ اوپن سورس ہے ۔ ایم آئی ٹی ، اپاچی 2.0 — کوئی مختصہ لاک ان ، کوئی استعمال کی پابندیاں ، کوئی حیرت انگیز لائسنس فیس ۔ انہیں ہمارے ہوسٹ API کے ذریعے استعمال کریں ، یا انہیں اپنے بنیادی ڈھانچے پر مکمل کنٹرول کے ساتھ خود ہوسٹ کریں ۔

اوپن سورس ایم آئی ٹی لائسنس آپاچی خود مہمان گیٹ ہب

اب کوشش کریں

Kokoro, Piper, VITS, MeloTTS کے ساتھ مفت
آپ کی پیدا کی گئی آڈیو یہاں دکھائی دے گی
پیدا کیا گیا
ڈاؤن لوڈ
TTS.ai سے محبت؟ اپنے دوستوں کو بتائیں!

اوپن سورس TTS کے فائدے

آپ کے پروجیکٹ کے لئے اوپن سورس ماڈلز کی اہمیت کیوں ہے

تمام اوپن سورس لائسنس

TTS.ai پر ہر ماڈل ایک اجازت نامہ کھلے-سورس لائسنس استعمال کرتا ہے. کوئی مختص بلیک باکس، کوئی ونڈر لاک-ان، کوئی غیر متوقع لائسنس فیس.

ایم آئی ٹی / اپاچی 2.0

ماڈل MIT يا Apache 2.0 کے تحت لائسنس کیے گئے ہیں ، سب سے زیادہ اجازت دینے والے اوپن سورس لائسنس تجارتي طور پر استعمال کریں ، بدلیں ، دوبارہ تقسیم کریں - کوئی پابندي نہیں

خود مہمان

کوئی ماڈل ڈاؤن لوڈ کریں اور اسے اپنے ہیڈریڈر پر چلائیں. اپنے ڈیٹا، لیٹی سی اور بنیادی ڈھانچے پر مکمل کنٹرول. کوئی کلاؤڈ انحصار ضروری نہیں.

GPU بہتری

ماڈل NVIDIA GPUs کے ليے CUDA سپورٹ کے ساتھ مطلوبه هے پيپر صرف سي پي يو پر چلتا هے اکثر ماڈل کو موثر انفرا نسی کے ليے 2-8GB VRAM کا احتياج هے

کمونٹی محفوظ

فعال اوپن سورس کمیونٹیز ان ماڈلز کو برقرار رکھتے اور بہتر کرتے ہیں۔ تعاون کا استقبال کیا جاتا ہے – بگ، بہتری اور گیٹ ہاب پر نئی آوازیں پیش کریں۔

تجارتی استعمال ٹھیک ہے

تمام ماڈل اپنے لائسنس کے تحت تجارتی استعمال کی اجازت دیتے ہیں۔ مصنوعات بناؤ، سروسز فروخت کرو، اور تجارتی مواد بناؤ بغیر کوئی روایات یا استعمال کی فیس۔

ہمارا اوپن سورس ماڈل کتلا گ

ہر ماڈل، اس کی لائسنس، اور یہ سب سے بہتر کیا کرتا ہے

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

بہترین: آپاچی 2.0 — بہترین کیفیت کا مفت ماڈل، 82M پارامٹس، خود مہمان بنانے میں آسان

کوشش کریں Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

بہترین: MIT — CPU-only, ایج ڈیوائس اور embedded self-hosting کے لئے بہترین

کوشش کریں Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

بہترین: ایم آئی ٹی - بنیادی فن تعمیر جو بہت سے ڈاؤنسٹریم ماڈلز کے ذریعے استعمال کی جاتی ہے

کوشش کریں VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

بہترین: ایم آئی ٹی - معیاری TTS سے باہر منفرد آڈیو پیدا کرنے کی صلاحیتیں

کوشش کریں Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 آواز کا کلوننگ

بہترین: آپاچی 2.0 - حداکثر کیفیت، وسیع طور پر مطالعہ کیا گیا حوالہ نفاذ

کوشش کریں Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 آواز کا کلوننگ

بہترین: MIT — اوپن سورس وائٹ کلونینگ گرينل سٹیل کنٹرول کے ساتھ

کوشش کریں OpenVoice

اوپن سورس TTS استعمال کرنا

ہمارے مہمان API استعمال کریں یا خود ماڈل چلائیں

1

اوپن سورس ماڈلز کا مطالعہ کریں

20+ اوپن سورس TTS ماڈلز کے ہمارے کتلا گ براؤز کریں. ہر ماڈل صفحہ لائسنس، فن تعمیر، صلاحیتوں اور خود مہمانداری کی ضرورتوں کو دکھاتا ہے.

2

اپنے براؤزر میں کوشش کریں

TTS.ai پر براہ راست کوئی ماڈل جانچیں بغیر کسی چیز کو انسٹال کرنے کے۔ ہمارے GPU سرور پروسیسنگ کو ہینڈل کرتے ہیں تاکہ آپ خود مہمانداری کے لئے عہد کرنے سے پہلے معیار کا اندازہ لگا سکتے ہیں۔

3

خود مہمان یا ہماری API استعمال کریں

GitHub سے کلون ماڈل ریپو اور مقامی طور پر چلاؤ، یا پیداوار کے لیے ہماری ہوسٹڈ API استعمال کریں. خود ہوسٹڈ مکمل کنٹرول دیتا ہے؛ ہمارا API انتظامی ڈھانچے فراہم کرتا ہے.

4

آپ کا ایپلیکیشن بنائیں

اپنے مصنوعات میں TTS کو خود مہماندار ماڈلز یا ہمارے REST API کے استعمال سے شامل کریں. تمام ماڈلز لائسنس کی فیس یا روایات کے بغیر تجارتی طور پر استعمال کرنے کے قابل ہیں.

لائسنس موازنہ

TTS.ai پر تمام ماڈل تجارتی دوستانہ اوپن سورس لائسنس استعمال کرتے ہیں

ماڈل لائسنس تجارتي استعمال تبدیل خود کار میزبان مختص
Kokoro Apache 2.0 ضروری
Piper MIT اختیاری
VITS MIT اختیاری
MeloTTS MIT اختیاری
Chatterbox MIT اختیاری
Tortoise TTS Apache 2.0 ضروری
StyleTTS 2 MIT اختیاری
OpenVoice MIT اختیاری
Sesame CSM Apache 2.0 ضروری
Orpheus Llama 3.2 "Built with Llama"

خود مہمان vs مہمان API

ماڈل خود چلو یا ہمیں بنیادی ڈھانچے کا انتظام کرنے دو

آپ کے ہارڈ ویئر پر خود میزبان

TTS.ai پر ہر ماڈل گٹ ہب يا حوا نگ فيس پر اوپن سورس پروجیکٹ کے طور پر دستياب هے وزن ڈائون لوڈ کريں ، وابستگياں انسٹال کريں ، اور اپنے GPUs پر انفريشن چلايں آپ کے پاس لا ٹنسي ، پرائيو ائيٹي اور سکيلينگ پر مکمل کنٹرول هے

  • مکمل ڈیٹا پرائیویٹی - آڈیو آپ کے سرور کو کبھی نہیں چھوڑتی
  • ابتدائي ترتیب کے بعد کوئی پر-مطالبہ خرچ نہیں
  • آپ کے خود کے ڈیٹا پر ذاتي fine-tuning
  • GPU ہارڈ ویئر کی ضرورت ہے (NVIDIA کی سفارش کی جاتی ہے)
  • آپ اپڈیٹ، اسکیلنگ، اور انحصارات کا انتظام کرتے ہیں

TTS.ai ہوسٹ API استعمال کریں

ایک REST API کے ذریعے تمام 20+ ماڈلز تک فوری رسائی حاصل کریں۔ ہم GPU کی فراہمی، ماڈل اپڈیٹ، کیو مدیریت اور پیمانے بندی کا انتظام کرتے ہیں۔ ایک API کی کلید آپ کو ہر ماڈل تک رسائی فراہم کرتی ہے۔

  • کوئی GPU ہارڈ ویئر کی ضرورت نہیں
  • ایک API کے ذریعے تمام 20+ ماڈل
  • خودکار ماڈل اپڈیٹ اور بہتری
  • 99.9% اپ ٹائم اضافی بنیادی ڈھانچے کے ساتھ
  • صرف اس کے لئے ادا کریں جو آپ استعمال کرتے ہیں

تیز شروع: API یا خود- مہمان

ہمارے مہمان API استعمال کریں، یا Kokoro کو منٹوں میں مقامی طور پر انسٹال کریں

آپشن 1: TTS.ai ہوسٹ API آسان
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
آپشن 2: پیپ کے ساتھ خود میزبان مکمل کنٹرول
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

اوپن سورس، سستا قیمت

ہمارا مہمانداری API مفت سورس TTS کو GPUs کے انتظام کے بغیر دستیاب کرتا ہے۔

مفت سطح

$0

15 کریڈٹس پر سائن اپ

  • 4 مفت اوپن سورس ماڈل
  • بنیادی استعمال کے لیے کوئی رجسٹریشن نہیں
  • تجارتی استعمال کو اجازت دی گئی

شروع

$9

500,000 حروف/مہین

  • تمام 20+ اوپن سورس ماڈل
  • آواز کا کلوننگ
  • API رسائی

پرو

$29

2,000,000 حروف/مہین

  • GPU پروسیسنگ کی ترجیح
  • تمام پرائم ماڈل
  • انٹرپرائز سپورٹ
مکمل قیمت دیکھو

بار بار پوچھے گئے سوالات

اوپن سورس ٹیکس سے اسپیکینگ کے بارے میں عام سوالات

ہاں۔ TTS.ai پر ہر ماڈل ایک اجازت دار اوپن سورس لائسنس استعمال کرتا ہے – یا تو MIT یا Apache 2.0۔ ہم مخصوص طور پر محدود لائسنس کے ساتھ ماڈل کو خارج کرتے ہیں (کوئی کا CPML یا غیر تجارتی CC-BY-NC جیسے)۔ آپ ہر ماڈل کی لائسنس کو اس کے GitHub ریپائزری پر جانچ سکتے ہیں۔

دونوں ہی اجازت دار اوپن سورس لائسنس ہیں جو تجارتی استعمال، تبدیلی اور دوبارہ تقسیم کی اجازت دیتے ہیں ۔اپاشی 2.0 واضح پیٹنٹ جراٹس شامل کرتا ہے اور اگر آپ کوڈ کو تبدیل کریں تو تبدیلیوں کی وضاحت کی ضرورت ہے۔ ایم آئی ٹی کم ضرورتوں کے ساتھ آسان ہے۔ دونوں ہی کاروبار کے لیے دوستانہ ہیں۔

ہاں ہر ماڈل خود مہمان ہو سکتا ہے GitHub سے ماڈل ریپائزری کلون کریں، وابستگیوں کو انسٹال کریں، ماڈل وزنوں کو ڈائون لوڈ کریں، اور انفریکشن چلائیں ہم ہر ماڈل کی خود مہمان ضروریات کے لیے دستاویزات فراہم کرتے ہیں جن میں GPU، RAM، اور Python ورژن شامل ہیں.

ماڈل کے مطابق ضرورتیں مختلف ہیں۔ پیپر کو GPU کی ضرورت نہیں ہے۔ Kokoro اور MeloTTS کو 1-2GB VRAM کی ضرورت ہے۔ زیادہ تر معیاری ماڈلز کو 4GB VRAM کی ضرورت ہے۔ Tortoise اور Sesame CSM کو 8GB کی ضرورت ہے۔ ایک NVIDIA RTX 3060 (12GB) اکثر ماڈلز کو آرام سے چلا سکتا ہے۔

جی ہاں ، اوپن سورس لائسنس تعديل کو اجازت ديتي هے جن ميں فائن ٹوننگ شامل هے ۔ GPT-SoVITS اور Bark جیسے ماڈل فائن ٹوننگ سکرپٹس فراہم کر تے هيں آپ اپنے آواز کے ڈیٹا پر ماڈل کو تربيت دے سکتے هيں تاکہ آپ خاص زبانوں کے ليے خاص آوازیں بنا سکيں يا پرفارمنس کو بہتر کر سکيں

اعلیٰ اوپن سورس ماڈل (Kokoro، StyleTTS 2، Chatterbox) اب معیار کے معیار میں ElevenLabs اور گوگل TTS جیسے تجارتی خدمات سے برابر یا زیادہ ہیں۔ تجارتی خدمات کا اہم فائدہ انتظامی ڈھانچے اور حمایت ہے، نہ کہ آڈیو کی کیفیت۔

ہم نے ان کو پہلے ہی خارج کر دیا ہے XTTS/XTTS-v2 (Coqui کا CPML — غیر تجارتی)، F5-TTS (CC-BY-NC — غیر تجارتی)، اور Higgs-v2 (Boson لائسنس — محدود) سب کو ہٹا دیا گیا تھا۔ TTS.ai پر ہر ماڈل تجارتي استعمال کے لئے محفوظ ہے

ہاں. زیادہ تر ماڈل GitHub کے ذریعے کمیونٹی کی شراکت داری کو قبول کرتے ہیں. آپ بگ رپورٹیں، نئے زبانوں کے لیے آواز ریکارڈنگ، کوڈ بہتری اور دستاویزات بھیج سکتے ہیں. ہر ماڈل کے GitHub ریسپورٹ کو شراکت داری کے رہنما خطوط اور فعال مسائل کے لیے جانچیں.

ماڈل کو ضرورت پر لوڈ کریں اور GPU میمورے کو تقسیم کرنے کے لئے بے کام ہونے پر ان لوڈ کریں۔ ہمارا GPU سرور 4x Tesla P40 (96GB مجموعی VRAM) پر 20+ ماڈل چلاتا ہے جو متحرک لوڈنگ کا استعمال کرتا ہے۔ خود مہمانداری کے لئے، ایک 24GB GPU 3-5 ماڈل کو ایک ساتھ سروس دے سکتا ہے۔

بہت سے ماڈل سرکاری Docker ایمیج یا Dockerfiles فراہم کرتے ہیں. متعدد ماڈلز کو چلانے کے لیے، آپ NVIDIA کنٹینر ٹولکیٹ کے ساتھ GPU رسائی کے لیے ایک مخصوص Docker سیٹ اپ بنا سکتے ہیں. ہمارا API سرور فن تعمیر ایک حوالہ نفاذ کے طور پر کام کر سکتا ہے.

اکثر ماڈل کو پائتھون 3.10-3.12 کا احتياج هے Coqui TTS (VITS) کو خاص طور پر پائتھون 3.11 کا احتياج هے ہم اکثر ماڈل کے ليے پائتھون 3.12 کا مشوره ديتے هے صحيح ورژن کو مطابقت کے ليے ہر ماڈل کے requirements.txt کو چکيں

جی ہاں، ایم آئی ٹی اور اپاچی 2.0 لائسنس واضح طور پر تجارتی استعمال کی اجازت دیتے ہیں۔ آپ ان ماڈلز کو استعمال کرکے SaaS مصنوعات، موبائل ایپلیکیشنز، گیمز اور سروسز بنا سکتے ہیں، بغیر لائسنس کی فیس، روایات یا حوالہ کی ضرورت کے (اگرکہ حوالہ کی قدر کی جاتی ہے)۔
5.0/5 (1)

ہم کیا بہتر کر سکتے ہیں؟ آپ کا رائے ہمیں مسائل حل کرنے میں مدد کرتا ہے.

آج اوپن سورس TTS کو آزمائیں

20+ اوپن سورس ماڈل، سب تجارتی لائسنس. ہماری API یا خود مہمان استعمال کریں - انتخاب آپ کا ہے.