ओपन सोर्स पाठबाट वक्तव्य मोडेलName
हाम्रो प्लेटफर्म मा हरेक TTS मोडेल व्यावसायिक-मैत्री लाइसेन्स संग खुला स्रोत छ। एमआईटी, Apache 2.0 - कुनै स्वामित्व लक-इन, कुनै प्रयोग प्रतिबन्ध, कुनै आश्चर्य लाइसेन्स शुल्क। तिनीहरूलाई हाम्रो होस्ट एपीआई मार्फत प्रयोग गर्नुहोस्, वा पूर्ण नियन्त्रण संग आफ्नो आफ्नै पूर्वाधार मा तिनीहरूलाई आत्म-होस्ट।
अहिले प्रयास गर्नुहोस्
खुला स्रोत TTS लाभ
किन खुला स्रोत मोडेल आफ्नो परियोजनाहरूको लागि महत्वपूर्ण छ
सबै खुला स्रोत लाइसेन्स गरिएको
TTS.ai मा हरेक मोडेल एक permissive खुला स्रोत लाइसेन्स प्रयोग गर्दछ। कुनै स्वामित्व कालो बाकस, कुनै विक्रेता लक-मा, कुनै अप्रत्याशित लाइसेन्स शुल्क।
एमआईटी / अपाचे २. ०
नमूनाहरू एमआईटी वा अपाचे २.० अन्तर्गत लाइसेन्स गरिएको छ, सबैभन्दा अनुमति दिने खुला स्रोत लाइसेन्सहरू। व्यावसायिक रूपमा प्रयोग गर्नुहोस्, परिमार्जन गर्नुहोस्, पुन: वितरण गर्नुहोस् - कुनै प्रतिबन्ध छैन।
स्व-होस्टयोग्य
कुनै पनि नमूना डाउनलोड र आफ्नो हार्डवेयर मा यसलाई चलाउनुहोस्। आफ्नो डाटा, लाटेन्सी, र पूर्वाधार मा पूर्ण नियन्त्रण। कुनै क्लाउड निर्भरता आवश्यक छैन।
GPU अनुकूलित
मोडेलहरू CUDA समर्थनको साथ NVIDIA GPUs को लागि अनुकूलित छन्। पाइपर सीपीयूमा मात्र चल्छ। धेरै मोडेलहरू कुशल निष्कर्षणको लागि 2-8GB VRAM आवश्यक पर्दछ।
समुदाय मर्मत गरिएको
सक्रिय खुला-स्रोत समुदायहरू राख्न र यी नमूनाहरू सुधार. योगदान स्वागत छ - बगहरू पेश, सुधार, र GitHub मा नयाँ आवाजहरू.
व्यावसायिक प्रयोग ठीक छ
सबै मोडेल आफ्नो लाइसेन्स अन्तर्गत व्यावसायिक प्रयोग अनुमति दिन्छ। उत्पादन निर्माण, सेवा बेच्न, र कुनै रॉयल्टी वा प्रयोग शुल्क संग व्यावसायिक सामग्री सिर्जना।
हाम्रो खुला स्रोत मोडेल विवरणिका
हरेक मोडेल, यसको लाइसेन्स, र यो सबै भन्दा राम्रो के गर्छ
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
यसका लागि उत्तम: अपाचे 2.0 — सबै भन्दा राम्रो गुणस्तर मुक्त मोडेल, 82M params, स्व-होस्ट गर्न सजिलो
प्रयास गर्नुहोस् Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
यसका लागि उत्तम: एमआईटी - सीपीयू-मात्र, किनारा उपकरणहरू र सम्मिलित आत्म-होस्टिङको लागि उत्तम
प्रयास गर्नुहोस् Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
यसका लागि उत्तम: एमआईटी - धेरै डाउनस्ट्रिम मोडेल द्वारा प्रयोग foundational वास्तुकला
प्रयास गर्नुहोस् VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
यसका लागि उत्तम: एमआईटी — मानक TTS भन्दा अद्वितीय अडियो पुस्ता क्षमताहरू
प्रयास गर्नुहोस् Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
यसका लागि उत्तम: Apache 2.0 — अधिकतम गुणस्तर, व्यापक अध्ययन सन्दर्भ कार्यान्वयन
प्रयास गर्नुहोस् Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
यसका लागि उत्तम: एमआईटी — खुला स्रोत आवाज क्लोनिङ ग्रेनलर शैली नियन्त्रणसँग
प्रयास गर्नुहोस् OpenVoiceखुला स्रोत TTS कसरी प्रयोग गर्ने
हाम्रो होस्ट गरिएको एपीआई प्रयोग गर्नुहोस् वा नमूना आफै चलाउनुहोस्
खुला स्रोत नमूनाहरू अन्वेषण गर्नुहोस्
20+ खुला स्रोत TTS मोडेलहरूको हाम्रो विवरणिका ब्राउज गर्नुहोस्। प्रत्येक मोडेल पृष्ठले लाइसेन्स, वास्तुकला, क्षमताहरू र आत्म-होस्टिङ आवश्यकताहरू देखाउँछ।
तपाईँको ब्राउजरमा प्रयास गर्नुहोस्
केही स्थापना बिना TTS.ai मा कुनै पनि मोडेल परीक्षण गर्नुहोस्। हाम्रो GPU सर्भरहरू प्रक्रिया ह्यान्डल गर्दछ ताकि तपाईं आत्म-होस्ट गर्न प्रतिबद्ध हुनु अघि गुणस्तरको मूल्यांकन गर्न सक्नुहुन्छ।
आत्म-होस्ट वा हाम्रो API प्रयोग गर्नुहोस्
GitHub बाट क्लोन मोडेल repos र स्थानीय रूपमा चलाउनुहोस्, वा उत्पादनको लागि हाम्रो होस्ट गरिएको एपीआई प्रयोग गर्नुहोस्। आत्म-होस्टिङले पूर्ण नियन्त्रण दिन्छ; हाम्रो एपीआईले प्रबन्धित पूर्वाधार प्रदान गर्दछ।
तपाईँको अनुप्रयोग निर्माण गर्नुहोस्
TTS आफ्नो उत्पादन मा एकीकृत आत्म-होस्ट मोडेल वा हाम्रो REST API प्रयोग। सबै मोडेल कुनै लाइसेन्स शुल्क वा रॉयल्टी संग व्यावसायिक प्रयोग गर्न सकिन्छ।
इजाजतपत्र तुलना
TTS.ai मा सबै मोडेलहरू व्यावसायिक-मैत्री खुला स्रोत लाइसेन्सहरू प्रयोग गर्दछ
| नमूना | इजाजतपत्र | व्यावसायिक प्रयोग | परिमार्जन | स्व- होस्ट | श्रेय |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | आवश्यक | |||
| Piper | MIT | वैकल्पिक | |||
| VITS | MIT | वैकल्पिक | |||
| MeloTTS | MIT | वैकल्पिक | |||
| Chatterbox | MIT | वैकल्पिक | |||
| Tortoise TTS | Apache 2.0 | आवश्यक | |||
| StyleTTS 2 | MIT | वैकल्पिक | |||
| OpenVoice | MIT | वैकल्पिक | |||
| Sesame CSM | Apache 2.0 | आवश्यक | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
स्व-होस्टिङ विरुद्ध होस्ट गरिएको एपीआई
तपाईँले नै नमूना चलाउनुहोस् वा हामीलाई पूर्वाधार ह्यान्डल गर्नुहोस्
तपाईँको हार्डवेयरमा स्व-होस्ट
TTS.ai मा हरेक मोडेल GitHub वा Hugging फेस मा खुला स्रोत परियोजनाको रूपमा उपलब्ध छ। वजन डाउनलोड गर्नुहोस्, निर्भरताहरू स्थापना गर्नुहोस्, र आफ्नो GPUs मा निष्कर्षहरू चलाउनुहोस्। तपाईंलाई latency, गोपनीयता र मापनमा पूर्ण नियन्त्रण छ।
- पूर्ण डेटा गोपनीयता — अडियोले तपाईँको सर्भर छोड्दैन
- सुरुआत सेटअप पछि प्रति- अनुरोध लागत छैन
- तपाईँको आफ्नै डेटामा अनुकूलन fine-tuning
- GPU हार्डवेयर आवश्यक पर्दछ (NVIDIA सिफारिस गरिएको)
- तपाईँले अद्यावधिक, मापन, र निर्भरताहरू व्यवस्थापन गर्नुहुन्छ
TTS.ai होस्ट गरिएको API प्रयोग गर्नुहोस्
एकल REST API मार्फत सबै 20+ मोडेलहरूमा तत्काल पहुँच प्राप्त गर्नुहोस्। हामी जीपीयू प्रावधान, मोडेल अद्यावधिक, कतार व्यवस्थापन र स्केलिङ ह्यान्डल गर्दछौं। एक एपीआई कुञ्जीले तपाईंलाई प्रत्येक मोडेलमा पहुँच दिन्छ - छुट्टै तैनात व्यवस्थापन गर्न आवश्यक छैन।
- GPU हार्डवेयर आवश्यक छैन
- एक एपीआई मार्फत सबै 20+ मोडेल
- स्वचालित नमूना अद्यावधिक र सुधार
- 99.9% अपटाइम अतिरिक्त पूर्वाधारसँग
- तपाईँले प्रयोग गर्ने कुराका लागि मात्र भुक्तानी गर्नुहोस्
छिटो सुरु: एपीआई वा स्व-होस्ट
हाम्रो होस्ट गरिएको एपीआई प्रयोग गर्नुहोस्, वा मिनेटमा कोकोरो स्थानीय रूपमा स्थापना गर्नुहोस्
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
खुला स्रोत, किफायती मूल्य
हाम्रो होस्ट गरिएको एपीआईले जीपीयूहरू व्यवस्थापन नगरी खुला स्रोत टीटीएस पहुँचयोग्य बनाउँछ।
स्वतन्त्र तह
$0
साइन अप मा 15 क्रेडिट
- 4 खुला स्रोत मोडेल निःशुल्क
- आधारभूत प्रयोगका लागि साइनअप छैन
- व्यावसायिक प्रयोग अनुमति दिइएको छ
सुरुआतकर्ता
$9
500 क्रेडिट / महिना
- सबै २०+ खुला स्रोत नमूनाहरू
- आवाज क्लोनिङ
- API पहुँच
प्रो
$29
२,००,००० क्यारेक्टर/महिना
- प्राथमिकता GPU प्रक्रिया
- सबै प्रिमियम मोडेल
- उद्यम समर्थन
प्राय सोधिने प्रश्नहरू
बोल्नका लागि खुला स्रोत पाठका बारेमा सामान्य प्रश्नहरू
हामी के सुधार गर्न सक्छन्? आफ्नो प्रतिक्रिया हामीलाई समस्या समाधान गर्न मद्दत गर्दछ.
आज खुला स्रोत TTS प्रयास गर्नुहोस्
20+ खुला स्रोत मोडेल, सबै व्यावसायिक-लाइसेन्स. हाम्रो एपीआई वा आत्म-होस्ट प्रयोग गर्नुहोस् - विकल्प तपाईंको छ.