ओपन सोर्स पाठ्य ते वक्तव्य मॉडेलName
आमच्या प्लॅटफॉर्मवरील प्रत्येक टीटीएस मॉडेल व्यावसायिक-मैत्रीपूर्ण परवानग्यासह ओपन सोर्स आहे. एमआयटी, अपाचे 2.0 - कोणतेही मालकीचे लॉक-इन नाही, वापरावर बंदी नाही, आश्चर्यकारक परवाना शुल्क नाही. आमच्या होस्ट केलेल्या API द्वारे ते वापरा, किंवा पूर्ण नियंत्रणासह आपल्या स्वतःच्या पायाभूत सुविधांवर स्व-होस्ट करा.
आता प्रयत्न करा
ओपन सोर्स TTS फायदे
तुमच्या प्रकल्पांसाठी खुले स्रोत मॉडेल का महत्त्वाचे आहेत
सर्व ओपन- सोर्स परवानाकृत
TTS.ai वरील प्रत्येक मॉडेल एक अनुमतीदार ओपन-सोर्स परवाना वापरते. कोणताही मालकीचा ब्लॅक बॉक्स नाही, विक्रेता लॉक-इन नाही, अनपेक्षित परवाना शुल्क नाही.
एमआईटी/ अपाचे 2.0
मॉडेल एमआयटी किंवा अपाचे 2.0अंतर्गत परवानाकृत आहेत, सर्वात अधिक अनुमती देणारे खुले स्रोत परवाना. व्यावसायिक वापर, संपादित करा, पुन्हा वितरीत करा - कोणतीही मर्यादा नाही.
स्वयं-होस्टजोगी
कोणत्याही मॉडेल डाऊनलोड करा व ते तुमच्या स्वतःच्या हार्डवेअरवर चालवा. तुमच्या माहिती, लाटेन्सी व पायाभूत सुविधांवर पूर्ण नियंत्रण. क्लाउड अवलंबनाची आवश्यकता नाही.
GPU अनुकूलीत
CUDA समर्थनासह NVIDIA GPUs साठी मॉडेल अनुकूलित केले गेले आहे. Piper फक्त CPU वर चालते. बहुतेक मॉडेलला प्रभावी निष्कर्षणासाठी 2-8GB VRAM ची आवश्यकता असते.
समुदाय जपून ठेवले
सक्रीय खुले-स्रोत समुदाय हे मॉडेल चालवतात आणि सुधारतात. योगदान स्वागतार्ह आहे - बग, सुधारणे, आणि GitHub वर नवीन आवाज सादर करा.
व्यावसायिक वापर OK
सर्व नमुने त्यांच्या परवानग्या अंतर्गत व्यावसायिक वापरास परवानगी देतात. उत्पादने तयार करा, सेवा विकत घ्या, आणि कोणत्याही रॉयल्टी किंवा वापर शुल्काशिवाय व्यावसायिक सामग्री तयार करा.
आमचे खुले स्रोत मॉडेल कॅटलॉग
प्रत्येक मॉडेल, त्याची परवाना, आणि ते सर्वोत्तम काय करते
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
सर्वोत्तम: अपाची 2.0 — सर्वोत्तम गुणवत्तेचे मोफत मॉडेल, 82M परिमाणे, स्वयं-होस्ट करणे सोपे
प्रयत्न करा Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
सर्वोत्तम: MIT — फक्त CPU, किनार उपकरणे व अंतर्भूत स्व- होस्टिंग करीता उत्तम
प्रयत्न करा Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
सर्वोत्तम: एमआयटी - अनेक डाउनस्ट्रीम मॉडेल्सद्वारे वापरले जाणारे मूलभूत वास्तुकला
प्रयत्न करा VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
सर्वोत्तम: एमआयटी - मानक टीटीएस पेक्षा वेगळी ऑडिओ निर्मिती क्षमता
प्रयत्न करा Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
सर्वोत्तम: Apache 2. 0- उच्चतम गुणवत्ता, विस्तृत अभ्यास संदर्भ अंमलबजावणी
प्रयत्न करा Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
सर्वोत्तम: MIT - ग्रॅन्युलर शैली नियंत्रणासह ओपन- सोर्स आवाज क्लोनिंग
प्रयत्न करा OpenVoiceओपन सोर्स टीटीएस कसे वापरावे
आमचे होस्ट API वापरा किंवा स्वतः मॉडेल चालवा
ओपन सोर्स मॉडेलचा शोध घ्याName
20+ ओपन सोर्स टीटीएस मॉडेल्सची आमची कॅटलॉग ब्राउझ करा. प्रत्येक मॉडेल पान परवाना, आर्किटेक्चर, क्षमता आणि स्वयं-होस्टिंग आवश्यकता दर्शवते.
तुमच्या ब्राऊजर अंतर्गत प्रयत्न करा
काहीही स्थापित न करता TTS.ai वर थेट कोणत्याही मॉडेलची चाचणी करा. आमचे GPU सर्वर प्रोसेसिंग हाताळतात जेणेकरून आपण स्वतः होस्ट करण्यापूर्वी गुणवत्तेचे मूल्यांकन करू शकता.
स्वतः-होस्ट किंवा आमचे API वापरा
GitHub पासून मॉडेल रेपो क्लोन करा आणि स्थानिकरित्या चालवा, किंवा उत्पादनासाठी आमचे होस्ट केलेले API वापरा. स्व-होस्टिंग पूर्ण नियंत्रण देते; आमचे API व्यवस्थापित पायाभूत सुविधा प्रदान करते.
अनुप्रयोग बनवाName
स्वतः-होस्ट मॉडेल किंवा आमचे REST API वापरून आपल्या उत्पादनात TTS एकत्र करा. सर्व मॉडेल परवाना शुल्क किंवा रॉयल्टीशिवाय व्यावसायिकरित्या वापरता येतात.
परवाना तुलना
TTS.ai वरील सर्व मॉडेल्स व्यावसायिकरित्या अनुकूल उघड स्रोत परवाना वापरतात.
| मॉडेल | परवाना | व्यावसायिक वापर | संपादन | स्वयं- यजमान | श्रेय |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | आवश्यक | |||
| Piper | MIT | वैकल्पिक | |||
| VITS | MIT | वैकल्पिक | |||
| MeloTTS | MIT | वैकल्पिक | |||
| Chatterbox | MIT | वैकल्पिक | |||
| Tortoise TTS | Apache 2.0 | आवश्यक | |||
| StyleTTS 2 | MIT | वैकल्पिक | |||
| OpenVoice | MIT | वैकल्पिक | |||
| Sesame CSM | Apache 2.0 | आवश्यक | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
स्वयं-होस्टिंग विरुद्ध होस्ट API
तुम्ही स्वतः नमूने चालवा किंवा आम्हाला पायाभूत सुविधा हाताळण्यास सोडा
तुमच्या हार्डवेअरवर स्वयं- यजमान
TTS.ai वरील प्रत्येक मॉडेल GitHub किंवा Hugging Face वर एक ओपन-सोर्स प्रकल्प म्हणून उपलब्ध आहे. वजन डाउनलोड करा, डिपेंडन्सी स्थापित करा, आणि आपल्या स्वतःच्या GPU वर निष्कर्ष काढा. तुम्हाला latency, गोपनीयता आणि स्केलिंग वर पूर्ण नियंत्रण आहे.
- पूर्ण माहिती गोपनीयता — ऑडिओ कधीही तुमचे सर्वर सोडत नाही
- प्रारंभिक संयोजना नंतर प्रति- विनंती खर्च नाही
- तुमच्या स्वतःच्या माहितीवर इच्छिक सुधारणा
- GPU हार्डवेअर आवश्यक आहे (NVIDIA सूचविले)
- तुम्ही अद्ययावतीकरण, स्केलिंग, व अवलंबित्वाचे व्यवस्थापन करता
TTS.ai होस्ट API चा वापर करा
एकमेव REST API द्वारे सर्व 20+ मॉडेल्सचा त्वरित प्रवेश मिळवा. आम्ही GPU प्रॉव्हिडन्स, मॉडेल अद्ययावत, क्यु व्यवस्थापन आणि स्केलिंग हाताळतो. एक API कि तुम्हाला प्रत्येक मॉडेलचा वापर करण्यास परवानगी देते - वेगळ्या वितरणांची व्यवस्था करण्याची गरज नाही.
- GPU हार्डवेअरची गरज नाही
- एक API द्वारे सर्व 20+ मॉडेल
- स्वचालित मॉडेल अद्ययावत व सुधारणे
- 99.9% अपटाइम आणि अतिरिक्त पायाभूत सुविधा
- तुम्ही वापरलेल्यासाठीच पैसे द्या
त्वरित प्रारंभ: API किंवा स्वयं- यजमान
आमचे होस्ट API वापरा, किंवा Kokoro स्थानिकरित्या मिनिटांत स्थापित करा
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
खुले स्रोत, परवडणारे दर
यामुळे गूगलने आपल्या वेबसाईटवर गूगल प्ले स्टोअरचा वापर न करताही गूगल प्ले स्टोअर वापरता येते.
मुक्त स्तर
$0
नोंदणीवर 15 क्रेडिट
- ४ ओपन-सोर्स मॉडेल मोफत
- मुलभूत वापर करीता नोंदणी नाही
- व्यावसायिक वापरास परवानगी
प्रारंभकर्ता
$9
500,000 अक्षरे/महिना
- सर्व 20+ ओपन- सोर्स मॉडेल
- आवाज क्लोन
- API प्रवेश
प्रो
$29
2,000,000 अक्षरे/महिना
- प्राधान्यता GPU प्रक्रिया
- सर्व प्रीमियम मॉडेल
- उद्योजक समर्थन
वारंवार विचारले जाणारे प्रश्न
ओपन सोर्स पाठ्य ते वक्तव्य विषयी सामान्य प्रश्न
आपण काय सुधारू शकतो? तुमचा प्रतिसाद आम्हाला समस्या सोडवण्यात मदत करतो.
आजच ओपन सोर्स TTS चा वापर करा
20+ ओपन-सोर्स मॉडेल, सर्व व्यावसायिक-लाइसेन्स. आमचे API किंवा स्वयं-होस्टचा वापर करा - निवड तुमच्याकडे आहे.