ओपन सोर्स पाठ्य ते वक्तव्य मॉडेलName

आमच्या प्लॅटफॉर्मवरील प्रत्येक टीटीएस मॉडेल व्यावसायिक-मैत्रीपूर्ण परवानग्यासह ओपन सोर्स आहे. एमआयटी, अपाचे 2.0 - कोणतेही मालकीचे लॉक-इन नाही, वापरावर बंदी नाही, आश्चर्यकारक परवाना शुल्क नाही. आमच्या होस्ट केलेल्या API द्वारे ते वापरा, किंवा पूर्ण नियंत्रणासह आपल्या स्वतःच्या पायाभूत सुविधांवर स्व-होस्ट करा.

ओपन सोर्सName MIT परवाना अपाचे स्वयं-होस्टजोगी गिथबName

आता प्रयत्न करा

कोकोरो, पाइपर, VITS, MeloTTS सह मोफत
तुमचे निर्मित ऑडिओ येथे दिसेल
बनविले
डाउनलोड
TTS.ai आवडले? तुमच्या मित्रांना सांगा!

ओपन सोर्स TTS फायदे

तुमच्या प्रकल्पांसाठी खुले स्रोत मॉडेल का महत्त्वाचे आहेत

सर्व ओपन- सोर्स परवानाकृत

TTS.ai वरील प्रत्येक मॉडेल एक अनुमतीदार ओपन-सोर्स परवाना वापरते. कोणताही मालकीचा ब्लॅक बॉक्स नाही, विक्रेता लॉक-इन नाही, अनपेक्षित परवाना शुल्क नाही.

एमआईटी/ अपाचे 2.0

मॉडेल एमआयटी किंवा अपाचे 2.0अंतर्गत परवानाकृत आहेत, सर्वात अधिक अनुमती देणारे खुले स्रोत परवाना. व्यावसायिक वापर, संपादित करा, पुन्हा वितरीत करा - कोणतीही मर्यादा नाही.

स्वयं-होस्टजोगी

कोणत्याही मॉडेल डाऊनलोड करा व ते तुमच्या स्वतःच्या हार्डवेअरवर चालवा. तुमच्या माहिती, लाटेन्सी व पायाभूत सुविधांवर पूर्ण नियंत्रण. क्लाउड अवलंबनाची आवश्यकता नाही.

GPU अनुकूलीत

CUDA समर्थनासह NVIDIA GPUs साठी मॉडेल अनुकूलित केले गेले आहे. Piper फक्त CPU वर चालते. बहुतेक मॉडेलला प्रभावी निष्कर्षणासाठी 2-8GB VRAM ची आवश्यकता असते.

समुदाय जपून ठेवले

सक्रीय खुले-स्रोत समुदाय हे मॉडेल चालवतात आणि सुधारतात. योगदान स्वागतार्ह आहे - बग, सुधारणे, आणि GitHub वर नवीन आवाज सादर करा.

व्यावसायिक वापर OK

सर्व नमुने त्यांच्या परवानग्या अंतर्गत व्यावसायिक वापरास परवानगी देतात. उत्पादने तयार करा, सेवा विकत घ्या, आणि कोणत्याही रॉयल्टी किंवा वापर शुल्काशिवाय व्यावसायिक सामग्री तयार करा.

आमचे खुले स्रोत मॉडेल कॅटलॉग

प्रत्येक मॉडेल, त्याची परवाना, आणि ते सर्वोत्तम काय करते

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

सर्वोत्तम: अपाची 2.0 — सर्वोत्तम गुणवत्तेचे मोफत मॉडेल, 82M परिमाणे, स्वयं-होस्ट करणे सोपे

प्रयत्न करा Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

सर्वोत्तम: MIT — फक्त CPU, किनार उपकरणे व अंतर्भूत स्व- होस्टिंग करीता उत्तम

प्रयत्न करा Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

सर्वोत्तम: एमआयटी - अनेक डाउनस्ट्रीम मॉडेल्सद्वारे वापरले जाणारे मूलभूत वास्तुकला

प्रयत्न करा VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

सर्वोत्तम: एमआयटी - मानक टीटीएस पेक्षा वेगळी ऑडिओ निर्मिती क्षमता

प्रयत्न करा Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 आवाज क्लोनिंग

सर्वोत्तम: Apache 2. 0- उच्चतम गुणवत्ता, विस्तृत अभ्यास संदर्भ अंमलबजावणी

प्रयत्न करा Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 आवाज क्लोनिंग

सर्वोत्तम: MIT - ग्रॅन्युलर शैली नियंत्रणासह ओपन- सोर्स आवाज क्लोनिंग

प्रयत्न करा OpenVoice

ओपन सोर्स टीटीएस कसे वापरावे

आमचे होस्ट API वापरा किंवा स्वतः मॉडेल चालवा

1

ओपन सोर्स मॉडेलचा शोध घ्याName

20+ ओपन सोर्स टीटीएस मॉडेल्सची आमची कॅटलॉग ब्राउझ करा. प्रत्येक मॉडेल पान परवाना, आर्किटेक्चर, क्षमता आणि स्वयं-होस्टिंग आवश्यकता दर्शवते.

2

तुमच्या ब्राऊजर अंतर्गत प्रयत्न करा

काहीही स्थापित न करता TTS.ai वर थेट कोणत्याही मॉडेलची चाचणी करा. आमचे GPU सर्वर प्रोसेसिंग हाताळतात जेणेकरून आपण स्वतः होस्ट करण्यापूर्वी गुणवत्तेचे मूल्यांकन करू शकता.

3

स्वतः-होस्ट किंवा आमचे API वापरा

GitHub पासून मॉडेल रेपो क्लोन करा आणि स्थानिकरित्या चालवा, किंवा उत्पादनासाठी आमचे होस्ट केलेले API वापरा. स्व-होस्टिंग पूर्ण नियंत्रण देते; आमचे API व्यवस्थापित पायाभूत सुविधा प्रदान करते.

4

अनुप्रयोग बनवाName

स्वतः-होस्ट मॉडेल किंवा आमचे REST API वापरून आपल्या उत्पादनात TTS एकत्र करा. सर्व मॉडेल परवाना शुल्क किंवा रॉयल्टीशिवाय व्यावसायिकरित्या वापरता येतात.

परवाना तुलना

TTS.ai वरील सर्व मॉडेल्स व्यावसायिकरित्या अनुकूल उघड स्रोत परवाना वापरतात.

मॉडेल परवाना व्यावसायिक वापर संपादन स्वयं- यजमान श्रेय
Kokoro Apache 2.0 आवश्यक
Piper MIT वैकल्पिक
VITS MIT वैकल्पिक
MeloTTS MIT वैकल्पिक
Chatterbox MIT वैकल्पिक
Tortoise TTS Apache 2.0 आवश्यक
StyleTTS 2 MIT वैकल्पिक
OpenVoice MIT वैकल्पिक
Sesame CSM Apache 2.0 आवश्यक
Orpheus Llama 3.2 "Built with Llama"

स्वयं-होस्टिंग विरुद्ध होस्ट API

तुम्ही स्वतः नमूने चालवा किंवा आम्हाला पायाभूत सुविधा हाताळण्यास सोडा

तुमच्या हार्डवेअरवर स्वयं- यजमान

TTS.ai वरील प्रत्येक मॉडेल GitHub किंवा Hugging Face वर एक ओपन-सोर्स प्रकल्प म्हणून उपलब्ध आहे. वजन डाउनलोड करा, डिपेंडन्सी स्थापित करा, आणि आपल्या स्वतःच्या GPU वर निष्कर्ष काढा. तुम्हाला latency, गोपनीयता आणि स्केलिंग वर पूर्ण नियंत्रण आहे.

  • पूर्ण माहिती गोपनीयता — ऑडिओ कधीही तुमचे सर्वर सोडत नाही
  • प्रारंभिक संयोजना नंतर प्रति- विनंती खर्च नाही
  • तुमच्या स्वतःच्या माहितीवर इच्छिक सुधारणा
  • GPU हार्डवेअर आवश्यक आहे (NVIDIA सूचविले)
  • तुम्ही अद्ययावतीकरण, स्केलिंग, व अवलंबित्वाचे व्यवस्थापन करता

TTS.ai होस्ट API चा वापर करा

एकमेव REST API द्वारे सर्व 20+ मॉडेल्सचा त्वरित प्रवेश मिळवा. आम्ही GPU प्रॉव्हिडन्स, मॉडेल अद्ययावत, क्यु व्यवस्थापन आणि स्केलिंग हाताळतो. एक API कि तुम्हाला प्रत्येक मॉडेलचा वापर करण्यास परवानगी देते - वेगळ्या वितरणांची व्यवस्था करण्याची गरज नाही.

  • GPU हार्डवेअरची गरज नाही
  • एक API द्वारे सर्व 20+ मॉडेल
  • स्वचालित मॉडेल अद्ययावत व सुधारणे
  • 99.9% अपटाइम आणि अतिरिक्त पायाभूत सुविधा
  • तुम्ही वापरलेल्यासाठीच पैसे द्या

त्वरित प्रारंभ: API किंवा स्वयं- यजमान

आमचे होस्ट API वापरा, किंवा Kokoro स्थानिकरित्या मिनिटांत स्थापित करा

पर्याय 1: TTS.ai होस्ट केलेले API सर्वात सोपे
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
पर्याय 2: pip सह स्वयं- यजमान पूर्ण नियंत्रण
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

खुले स्रोत, परवडणारे दर

यामुळे गूगलने आपल्या वेबसाईटवर गूगल प्ले स्टोअरचा वापर न करताही गूगल प्ले स्टोअर वापरता येते.

मुक्त स्तर

$0

नोंदणीवर 15 क्रेडिट

  • ४ ओपन-सोर्स मॉडेल मोफत
  • मुलभूत वापर करीता नोंदणी नाही
  • व्यावसायिक वापरास परवानगी

प्रारंभकर्ता

$9

500,000 अक्षरे/महिना

  • सर्व 20+ ओपन- सोर्स मॉडेल
  • आवाज क्लोन
  • API प्रवेश

प्रो

$29

2,000,000 अक्षरे/महिना

  • प्राधान्यता GPU प्रक्रिया
  • सर्व प्रीमियम मॉडेल
  • उद्योजक समर्थन
पूर्ण किंमत पहा

वारंवार विचारले जाणारे प्रश्न

ओपन सोर्स पाठ्य ते वक्तव्य विषयी सामान्य प्रश्न

होय. TTS.ai वरील प्रत्येक मॉडेल एक परमिटिव्ह ओपन-सोर्स परवाना वापरते — MIT किंवा Apache 2.0. आम्ही विशेषतः प्रतिबंधित परवाना असलेल्या मॉडेल्सला वगळतो (जसे की Coqui चे CPML किंवा गैर-व्यावसायिक CC-BY-NC). तुम्ही प्रत्येक मॉडेलची परवाना त्याचे GitHub रेकॉर्डवर तपासू शकता.

दोन्ही अनुमतीचे खुले स्रोत परवाना आहेत जे व्यावसायिक वापर, संपादन व पुनर्वितरणास परवानगी देतात. अपाचे 2.0ने स्पष्टपणे पेटंटचे अनुदान जोडले आहे व तुम्ही कोड संपादित केल्यास बदलांची आवश्यकता आहे. MIT कमी आवश्यकता असलेल्या सोप्या आहे. दोन्ही व्यवसाय- मैत्रीपूर्ण आहेत.

होय. प्रत्येक मॉडेल स्वतः-होस्ट केले जाऊ शकते. GitHub पासून मॉडेल रिपोझिटरी क्लोन करा, डिपेंडन्सीज स्थापित करा, मॉडेल वजन डाऊनलोड करा, आणि निष्कर्षण चालवा. आम्ही प्रत्येक मॉडेलच्या स्वयं-होस्टिंग आवश्यकतांसाठी दस्तऐवजीकरण प्रदान करतो ज्यात GPU, RAM, आणि Python आवृत्ती समाविष्ट आहे.

आवश्यकता मॉडेलनुसार बदलते. Piper ला GPU ची गरज नाही (केवळ CPU). Kokoro आणि MeloTTS ला 1-2GB VRAM ची गरज असते. बहुतेक मानक मॉडेलला 4GB VRAM ची गरज असते. Tortoise आणि Sesame CSM ला 8GB ची गरज असते. NVIDIA RTX 3060 (12GB) बहुतेक मॉडेल सहज चालवू शकते.

होय. ओपन-सोर्स परवानग्या Fine-Tuning सह संपादन करीता परवानगी देतात. GPT-SoVITS व Bark सारखे मॉडेल Fine-Tuning स्क्रिप्ट पुरवितात. तुम्ही तुमच्या स्वतःच्या आवाज माहितीवर मॉडेल्सला प्रशिक्षण देऊ शकता जेणेकरून इच्छिक आवाज तयार करू शकता किंवा विशिष्ट भाषांसाठी कार्यक्षमता सुधारू शकता.

टॉप ओपन-सोर्स मॉडेल्स (कोकोरो, स्टाइलटीटीएस २, चॅटरबॉक्स) आता गुणवत्तेच्या बेंचमार्कमध्ये एलेवेनलॅब्स आणि गुगल टीटीएस सारख्या व्यावसायिक सेवांशी जुळतात किंवा त्यापेक्षा जास्त आहेत.

आम्ही आधीच त्यांना वगळले आहे. XTTS/XTTS-v2 (कोक्वी CPML - गैर-व्यावसायिक), F5-TTS (CC-BY-NC - गैर-व्यावसायिक), आणि Higgs-v2 (बॉसन परवाना - प्रतिबंधात्मक) सर्व काढून टाकले गेले. TTS.ai वर प्रत्येक मॉडेल वाणिज्यिक वापर सुरक्षित आहे.

होय. बहुतेक मॉडेल्स GitHub द्वारे समुदाय योगदान स्वीकारतात. तुम्ही बग अहवाल, नवीन भाषांसाठी आवाज नोंदणी, कोड सुधारणे, आणि दस्तऐवजीकरण सादर करू शकता. योगदान मार्गदर्शक तत्त्वे आणि सक्रीय समस्यांसाठी प्रत्येक मॉडेलच्या GitHub रेकॉर्डशीटची तपासणी करा.

GPU स्मृती सामायिक करण्यासाठी मागणीनुसार मॉडेल्स लोड करा आणि निष्क्रीय असताना लोड करा. आमचे GPU सर्व्हर 4x Tesla P40 (96GB एकूण VRAM) वर 20+ मॉडेल्स चालवते ज्यात गतिमान लोड वापरले जाते. स्व-होस्टिंगसाठी, एकमेव 24GB GPU 3-5 मॉडेल्स एकाच वेळी सेवा देऊ शकते.

अनेक मॉडेल्स अधिकृत Docker प्रतिमा किंवा Dockerfiles प्रदान करतात. अनेक मॉडेल्स चालविण्यासाठी, तुम्ही NVIDIA कंटेनर टूलकिटसह GPU प्रवेशासाठी इच्छिक Docker स्थापना तयार करू शकता. आमचे API सर्व्हर आर्किटेक्चर संदर्भ अंमलबजावणी म्हणून कार्य करू शकते.

बहुतेक मॉडेलसाठी पायथन 3.10-3.12 आवश्यक आहे. कोक्वी टीटीएस (VITS)साठी विशेषतः पायथन 3.11 आवश्यक आहे. बहुतेक मॉडेलसाठी आम्ही पायथन 3.12ची शिफारस करतो. प्रत्येक मॉडेलच्या requirements.txt ची तपासणी करा, त्यातील आवृत्ती योग्य आहे का हे पाहण्यासाठी.

होय. MIT आणि Apache 2.0 परवाना स्पष्टपणे व्यावसायिक वापरास परवानगी देतात. तुम्ही SaaS उत्पादने, मोबाईल ऍप्लिकेशन्स, खेळ आणि सेवा या मॉडेल्सचा वापर करून परवानगी शुल्क, रॉयल्टी किंवा श्रेय आवश्यकताशिवाय बनवू शकता (हे श्रेय स्वीकारले जाते).
5.0/5 (1)

आपण काय सुधारू शकतो? तुमचा प्रतिसाद आम्हाला समस्या सोडवण्यात मदत करतो.

आजच ओपन सोर्स TTS चा वापर करा

20+ ओपन-सोर्स मॉडेल, सर्व व्यावसायिक-लाइसेन्स. आमचे API किंवा स्वयं-होस्टचा वापर करा - निवड तुमच्याकडे आहे.