اوپن سورس متن کان ڳالهائڻ جا ماڊلName

اسان جي پليٽ فارم تي هر TTS ماڊل تجارتي دوست لائسنس سان مفت ذريعو آهي. MIT، Apache 2.0 - ڪوبه خاص لاڪ ان، استعمال جي پابنديون، ڪوبه حيرت واري لائسنس جي فيس. انهن کي اسان جي ميزبان API ذريعي استعمال ڪريو، يا انهن کي مڪمل ڪنٽرول سان پنهنجي زيربنامي تي پاڻمرادو ميزبان ڪريو.

اوپن سورس ايم آءِ ٽي لائسنس آپاچي پاڻمرادو ميزبان گيٽ هاب

هاڻي ڪوشش ڪريو

0/500
ڪوڪورو، پيپر، VITS، MeloTTS سان مفت
Your generated audio will appear here
پيدا ڪيل
0:00 0:00
ڊائون لوڊ
TTS.ai وانگر؟ پنھنجن دوستن کي چئو!

اوپن سورس TTS فائدا

اوپن سورس ماڊل توهان جي منصوبن لاءِ ڇو اهم آهن

سڀ اوپن سورس لائسنس ٿيل

TTS.ai تي هر ماڊل هڪ آزاد-سورس لائسنس استعمال ڪري ٿو. ڪوبه ذاتي بلاڪ بڪس نه، ڪوبه وينڊر لاڪ ان نه، ڪوبه غير متوقع لائسنس فيس نه.

MIT / آپاچي 2. 0

ماڊل MIT يا Apache 2.0 تحت لائسنس ٿيل آهن، جيڪي سڀ کان وڌيڪ اجازت ڏيندڙ اوپن سورس لائسنس آهن. تجارتي طور استعمال ڪريو، تبديل ڪريو، ٻيهر ورهائيو - ڪابه پابندي ناهي.

پاڻمرادو ميزبان

ڪنهن به ماڊل کي ڊائون لوڊ ڪريو ۽ ان کي پنهنجي هارڊويئر تي هلايو. توهان جي ڊيٽا تي مڪمل ڪنٽرول، دير ۽ بنياد. ڪو به ڪڪر تي منحصر نه آهي.

GPU تيز ڪيل

ماڊل CUDA مدد سان NVIDIA GPUs لاءِ بهتر ڪيا ويا آھن. پيپر رڳو CPU تي هلندو آھي. گھڻن ماڊلن کي 2-8GB VRAM جي ضرورت آھي اثرائتي انفريشن لاءِ.

ڪميونٽي سنڀاليندڙ

فعال اوپن سورس سوسائٽيون انھن ماڊلن کي سنڀاليندا ۽ بهتر ڪندا آھن. حصو وٺندڙن کي ڀليڪار — بگ، بهتريون ۽ نئون آواز GitHub تي موڪليو.

تجارتي استعمال صحيح

سڀ ماڊل سندن لائسنس تحت تجارتي استعمال جي اجازت ڏين ٿا. مصنوعات ٺاهيو، خدمتون وڪرو ڪريو، ۽ تجارتي مواد ٺاهيو بغير royalties يا استعمال جي فيس جي.

اسان جو اوپن سورس ماڊل ڪيتالوگ

سڀڪو ماڊل، ان جو لائسنس، ۽ جيڪو اهو بهترين ڪري ٿو

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

ھن لاءِ بهترين: Apache 2.0 — سٺو معيار مفت ماڊل، 82M پارامڪس، پاڻ کي ميزبان ڪرڻ آسان

ڪوشش ڪريو Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

ھن لاءِ بهترين: MIT — صرف سي پي يو ، ڪناري جي اوزارن ۽ ضم ٿيل پاڻمرادو ميزباني لاءِ مثالي

ڪوشش ڪريو Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

ھن لاءِ بهترين: MIT — بنياد جو فن تعمير جيڪو ڪيترن ئي هيٺاهين ماڊلن طرفان استعمال ڪيو ويندو آهي

ڪوشش ڪريو VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

ھن لاءِ بهترين: MIT — معياري TTS کان وڌيڪ منفرد آڊيو پيدا ڪرڻ جون صلاحيتون

ڪوشش ڪريو Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 آواز جو کلون

ھن لاءِ بهترين: Apache 2. 0 - وڌ ۾ وڌ معيار، وڏي پيماني تي مطالعو ڪيل حوالو لاڳو ڪرڻ

ڪوشش ڪريو Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 آواز جو کلون

ھن لاءِ بهترين: MIT - اوپن سورس آواز ڪلوننگ گرينئر اسٽائيل ڪنٽرول سان

ڪوشش ڪريو OpenVoice

اوپن سورس TTS ڪيئن استعمال ڪجي

اسان جو ميزبان API استعمال ڪريو يا پاڻ ماڊل هلايو

1

اوپن سورس ماڊلز جو مطالعو ڪريو

اسان جي 20+ اوپن سورس ٽي ٽي ايس ماڊلز جي ڪيٽالاگ جو دورو ڪريو. هر ماڊل صفحو لائسنس، فن تعمير، صلاحيتون، ۽ پاڻ کي ميزبان ڪرڻ جي ضرورتن کي ڏيکاريندو آهي.

2

پنھنجي برائوزر ۾ ڪوشش ڪريو

TTS.ai تي ڪنهن به ماڊل کي ڪنهن به شيءِ کي انسٽال ڪرڻ کانسواءِ آزمايو. اسان جا GPU سرورز پروسيس کي سنڀاليندا آهن ته جيئن توهان پاڻمرادو هوسٽنگ ڪرڻ کان پهريان معيار جو جائزو وٺي سگهو ٿا.

3

پاڻ ميزبان يا اسان جي API استعمال ڪريو

GitHub مان ڪلون ماڊل ريپو ۽ مقامي طور تي هلايو، يا اسان جي پروڊڪشن لاءِ اسان جي hosted API استعمال ڪريو. Self-hosting مڪمل ڪنٽرول ڏئي ٿو؛ اسان جو API انتظامي بنياد فراهم ڪري ٿو.

4

پنھنجي ايپليڪيشن ٺاھيو

TTS کي پنهنجي پيداوار ۾ خودڪار ماڊل يا اسان جي REST API استعمال ڪندي شامل ڪريو. سڀ ماڊل لائسنس جي فيس يا royalties کانسواءِ تجارتي طور استعمال ڪري سگهجن ٿا.

لائسنس مقابلو

TTS.ai تي سڀ ماڊل تجارتي دوست اوپن سورس لائسنس استعمال ڪن ٿا

ماڊل لائسنس تجارتي استعمال ترميم پاڻمرادو ميزباني اعزاز
Kokoro Apache 2.0 لازمي
Piper MIT اختياري
VITS MIT اختياري
MeloTTS MIT اختياري
Chatterbox MIT اختياري
Tortoise TTS Apache 2.0 لازمي
StyleTTS 2 MIT اختياري
OpenVoice MIT اختياري
Sesame CSM Apache 2.0 لازمي
Orpheus Llama 3.2 "Built with Llama"

پاڻمرادو ميزبان vs ميزبان API

پاڻ ماڊل هلايو يا اسان کي ڍانچي کي سنڀالڻ ڏيو

پنھنجي هارڊويئر تي پاڻمرادو ميزبان

TTS.ai تي هر ماڊل GitHub يا Hugging Face تي هڪ اوپن سورس منصوبي جي طور تي دستياب آهي. وزن ڊائون لوڊ ڪريو، وابستگي کي انسٽال ڪريو، ۽ توهان جي پنهنجي GPUs تي انٽيگريشن هلايو. توهان کي لاٽيٽي، پرائيويٽ ۽ اسڪيلينگ تي مڪمل ڪنٽرول آهي.

  • پورو ڊيٽا پرائيويٽ — آڊيو ڪڏهن به توھان جي سرور کي نه ڇڏيندو
  • شروعاتي ترتيب ڏيڻ کان پوءِ ڪابه درخواست جي قيمت نه
  • پنھنجن ڊيٽا تي پنھنجن خيالن سان ترتيب ڏيو
  • GPU هارڊويئر جي ضرورت آھي (NVIDIA صلاح ڏنل)
  • اوھين اپڊيٽ، ماپڻ، ۽ انحصارن جو انتظام ڪندا آھيو

TTS.ai ميزبان API استعمال ڪريو

هڪ REST API ذريعي سڀني 24+ ماڊلز تائين فوري رسائي حاصل ڪريو. اسين GPU جي فراهمي، ماڊل جي تازه ڪاري، قطار جي انتظام ۽ Scaling کي سنڀاليندا آهيون. هڪ API ڪوڊ توهان کي هر ماڊل تائين رسائي ڏئي ٿو - ڪنهن به الڳ ورهاست کي انتظام ڪرڻ جي ضرورت ناهي.

  • GPU هارڊويئر جي ضرورت نه آھي
  • سڀ 24+ ماڊل هڪ API ذريعي
  • خودڪار ماڊل اپڊيٽ ۽ بهتريون
  • 99.9% اپٽائم اضافي بنياد سان
  • جيڪي ڪندا آھيو تنھن کانسواءِ (ٻيو) ڪجھ نه ڏيندؤ.

جلد شروع: API يا پاڻمرادو ميزبان

اسان جو ميزبان API استعمال ڪريو، يا ڪوڪورو کي منٽن ۾ مقامي طور انسٽال ڪريو

آپشن 1: TTS.ai ميزبان API تمام آسان
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
آپشن 2: پاڻمرادو ميزبان پيپ سان مڪمل ڪنٽرول
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

اوپن سورس، سستي قيمت

اسان جو ميزبان API مفت-اصل TTS کي GPUs جي انتظام کانسواءِ رسائي وارو بڻائي ٿو.

آزاد طبقو

$0

رجسٽريشن تي 50 ڪرنٽ

  • 4 اوپن سورس ماڊل مفت
  • بنيادي استعمال لاءِ ڪوبه رجسٽريشن نه
  • واپاري استعمال جي اجازت

شروع

$9

مهينو

  • سڀ 24+ اوپن سورس ماڊل
  • آواز جي کلوننگ
  • API رسائي

پرو

$29

مهينو

  • GPU پروسيسنگ جي ترجيح
  • سڀ پريميئم ماڊل
  • انٽرپرائز
مڪمل قيمت ڏسو

گھڻا پڇيا ويندا سوال

ويڪرو ذريعو متن کي ڳالھائڻ بابت عام سوال

ھائو. TTS.ai تي هر ماڊل هڪ آزاد لائسنس استعمال ڪري ٿو — يا ته MIT يا Apache 2.0. اسان خاص طور تي محدود لائسنسن سان ماڊل کي خارج ڪريون ٿا (جيئن Coqui's CPML يا غير تجارتي CC-BY-NC). توهان هر ماڊل جي لائسنس جي GitHub ذخيري تي تصديق ڪري سگهو ٿا.

ٻئي آزاد-اصل لائسنس آھن جيڪي واپاري استعمال، تبديلي، ۽ ٻيهر ورڇ جي اجازت ڏين ٿا. Apache 2.0 پيٽنٽ جي واضح رعايتون شامل ڪري ٿو ۽ جيڪڏهن توھان ڪوڊ کي تبديل ڪريو ته تبديليون بيان ڪرڻ جي ضرورت آھي. MIT گھٽ گهرجن سان سادي آھي. ٻئي واپاري دوست آھن.

ھائو. هر ماڊل پاڻمرادو ميزبان ٿي سگهي ٿو. GitHub کان ماڊل رپورٽ کي ڪلون ڪريو، وابستگي کي انسٽال ڪريو، ماڊل وزن ڊائون لوڊ ڪريو، ۽ انفريشن هلايو. اسان هر ماڊل جي پاڻمرادو ميزبان جي ضرورتن لاءِ دستاويز مهيا ڪريون ٿا جن ۾ GPU، RAM، ۽ Python ورزن شامل آهن.

ضرورتون ماڊل تي منحصر آهن. پيپر کي ڪو GPU جي ضرورت نه آهي (فقط CPU). ڪوڪورو ۽ MeloTTS کي 1-2GB VRAM جي ضرورت آهي. اڪثر معياري ماڊلز کي 4GB VRAM جي ضرورت آهي. Tortoise ۽ Sesame CSM کي 8GB جي ضرورت آهي. هڪ NVIDIA RTX 3060 (12GB) اڪثر ماڊلز کي آرام سان هلائي سگهي ٿو.

ھائو. اوپن سورس لائسنس تبديلي سميت ڦيرڦار جي اجازت ڏين ٿا. GPT-SoVITS ۽ Bark جهڙا ماڊل ڦيرڦار واريون اسڪرپٽ مهيا ڪن ٿا. توھان پنھنجن آواز جي ڊيٽا تي ماڊلز کي تربيت ڏئي سگھو ٿا ته جيئن پنھنجي پسنديده آواز ٺاهي سگھو يا خاص ٻولين لاءِ ڪارڪردگي بهتر ڪري سگھو.

مٿيون اوپن سورس ماڊل (Kokoro، StyleTTS 2، Chatterbox) هاڻي معيار جي معيار ۾ ElevenLabs ۽ Google TTS وانگر تجارتي خدمتن سان مطابقت رکن ٿا يا ان کان وڌيڪ آهن. تجارتي خدمتن جو بنيادي فائدو انتظامي بنياد ۽ حمايت آهي، نه آڊيو معيار.

XTTS/XTTS-v2 (Coqui's CPML — non-commercial)، F5-TTS (CC-BY-NC — non-commercial)، ۽ Higgs-v2 (Boson License — restrictive) سڀئي حذف ڪيا ويا. TTS.ai تي سڀئي ماڊل تجارتي استعمال لاءِ محفوظ آهن.

ھائو. گھڻا ماڊل GitHub ذريعي سوسائٽي جي حصيداري قبول ڪندا آھن. توھان بگ رپورٽون، نئين ٻولين لاءِ آواز جي رڪارڊنگ، ڪوڊ جي بهتري ۽ دستاويز موڪلي سگھو ٿا. هر ماڊل جي GitHub رپورٽ کي حصيداري جي ھدايتن ۽ فعال مسئلن لاءِ ڏسو.

ڊيمانڊ تي ماڊل لوڊ ڪريو ۽ GPU جي ميموري حصيداري ڪرڻ لاءِ لاڪ ڪريو. اسان جو GPU سرور 4x Tesla P40 (96GB مجموعي VRAM) تي 20+ ماڊل ڊرائيو ڪري ٿو ڊنامڪ لوڊنگ استعمال ڪندي. خود-هسٽنگ لاءِ، هڪ 24GB GPU 3-5 ماڊل گڏيل طور تي خدمت ڪري سگهي ٿو.

ڪيترائي ماڊل سرڪاري Docker تصويرون يا Dockerfiles مهيا ڪن ٿا. ڪيترائي ماڊل هلائڻ لاءِ، توهان NVIDIA Container Toolkit سان GPU رسائي سان هڪ پسنديده Docker ترتيب ڏئي سگهو ٿا. اسان جو API سرور آرڪائيو هڪ حوالو عمل جي طور تي ڪم ڪري سگهي ٿو.

گھڻن ماڊلن کي Python 3.10-3.12 جي ضرورت آھي. Coqui TTS (VITS) کي خاص طور Python 3.11 جي ضرورت آھي. گھڻن ماڊلن لاءِ اسان Python 3.12 جي صلاح ڏيون ٿا. هر ماڊل جي requirements.txt کي صحيح ورزن مطابقت لاءِ ڏسو.

ها. MIT ۽ Apache 2.0 لائسنس واضح طور تي تجارتي استعمال جي اجازت ڏين ٿا. توهان SaaS مصنوعات، موبائل ايپليڪيشنون، رانديون، ۽ خدمتون انهن ماڊلز کي استعمال ڪندي لائسنس جي فيس، رائٽس، يا حوالن جي ضرورتن سان ٺاهي سگهو ٿا (جيڪڏهن ته حوالو ڏنو ويو آهي).
5.0/5 (1)

اوپن سورس TTS اڄ آزمايو

24+ اوپن سورس ماڊل، سڀ تجارتي لائسنس ٿيل. اسان جي API يا خودڪار ميزبان استعمال ڪريو - چونڊ توهان جي آهي.