ओपन सोर्स पाठबाट वक्तव्य मोडेलName

हाम्रो प्लेटफर्म मा हरेक TTS मोडेल व्यावसायिक-मैत्री लाइसेन्स संग खुला स्रोत छ। एमआईटी, Apache 2.0 - कुनै स्वामित्व लक-इन, कुनै प्रयोग प्रतिबन्ध, कुनै आश्चर्य लाइसेन्स शुल्क। तिनीहरूलाई हाम्रो होस्ट एपीआई मार्फत प्रयोग गर्नुहोस्, वा पूर्ण नियन्त्रण संग आफ्नो आफ्नै पूर्वाधार मा तिनीहरूलाई आत्म-होस्ट।

खुला स्रोत एमआईटी इजाजतपत्र अपाचे २. ० स्व-होस्टयोग्य गिथब

पूर्ण TTS सम्पादक API कागजात

अहिले प्रयास गर्नुहोस्

0/500

कोकोरो, पाइपर, भिट्स, मेलोटीटीएससँग निःशुल्क

तपाईँको सिर्जना गरिएको अडियो यहाँ देखा पर्नेछ

पूर्ण TTS सम्पादक खोल्नुहोस्

खुला स्रोत TTS लाभ

किन खुला स्रोत मोडेल आफ्नो परियोजनाहरूको लागि महत्वपूर्ण छ

सबै खुला स्रोत लाइसेन्स गरिएको

TTS.ai मा हरेक मोडेल एक permissive खुला स्रोत लाइसेन्स प्रयोग गर्दछ। कुनै स्वामित्व कालो बाकस, कुनै विक्रेता लक-मा, कुनै अप्रत्याशित लाइसेन्स शुल्क।

एमआईटी / अपाचे २. ०

नमूनाहरू एमआईटी वा अपाचे २.० अन्तर्गत लाइसेन्स गरिएको छ, सबैभन्दा अनुमति दिने खुला स्रोत लाइसेन्सहरू। व्यावसायिक रूपमा प्रयोग गर्नुहोस्, परिमार्जन गर्नुहोस्, पुन: वितरण गर्नुहोस् - कुनै प्रतिबन्ध छैन।

स्व-होस्टयोग्य

कुनै पनि नमूना डाउनलोड र आफ्नो हार्डवेयर मा यसलाई चलाउनुहोस्। आफ्नो डाटा, लाटेन्सी, र पूर्वाधार मा पूर्ण नियन्त्रण। कुनै क्लाउड निर्भरता आवश्यक छैन।

GPU अनुकूलित

मोडेलहरू CUDA समर्थनको साथ NVIDIA GPUs को लागि अनुकूलित छन्। पाइपर सीपीयूमा मात्र चल्छ। धेरै मोडेलहरू कुशल निष्कर्षणको लागि 2-8GB VRAM आवश्यक पर्दछ।

समुदाय मर्मत गरिएको

सक्रिय खुला-स्रोत समुदायहरू राख्न र यी नमूनाहरू सुधार. योगदान स्वागत छ - बगहरू पेश, सुधार, र GitHub मा नयाँ आवाजहरू.

व्यावसायिक प्रयोग ठीक छ

सबै मोडेल आफ्नो लाइसेन्स अन्तर्गत व्यावसायिक प्रयोग अनुमति दिन्छ। उत्पादन निर्माण, सेवा बेच्न, र कुनै रॉयल्टी वा प्रयोग शुल्क संग व्यावसायिक सामग्री सिर्जना।

हाम्रो खुला स्रोत मोडेल विवरणिका

हरेक मोडेल, यसको लाइसेन्स, र यो सबै भन्दा राम्रो के गर्छ

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

स्थिर 5/5

यसका लागि उत्तम: अपाचे 2.0 — सबै भन्दा राम्रो गुणस्तर मुक्त मोडेल, 82M params, स्व-होस्ट गर्न सजिलो

प्रयास गर्नुहोस् Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

स्थिर 3/5

यसका लागि उत्तम: एमआईटी - सीपीयू-मात्र, किनारा उपकरणहरू र सम्मिलित आत्म-होस्टिङको लागि उत्तम

प्रयास गर्नुहोस् Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

स्थिर 3/5

यसका लागि उत्तम: एमआईटी - धेरै डाउनस्ट्रिम मोडेल द्वारा प्रयोग foundational वास्तुकला

प्रयास गर्नुहोस् VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

ढिलो 4/5

यसका लागि उत्तम: एमआईटी — मानक TTS भन्दा अद्वितीय अडियो पुस्ता क्षमताहरू

प्रयास गर्नुहोस् Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

ढिलो 5/5 आवाज क्लोनिङ

यसका लागि उत्तम: Apache 2.0 — अधिकतम गुणस्तर, व्यापक अध्ययन सन्दर्भ कार्यान्वयन

प्रयास गर्नुहोस् Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

मध्यम 4/5 आवाज क्लोनिङ

यसका लागि उत्तम: एमआईटी — खुला स्रोत आवाज क्लोनिङ ग्रेनलर शैली नियन्त्रणसँग

प्रयास गर्नुहोस् OpenVoice

खुला स्रोत TTS कसरी प्रयोग गर्ने

हाम्रो होस्ट गरिएको एपीआई प्रयोग गर्नुहोस् वा नमूना आफै चलाउनुहोस्

खुला स्रोत नमूनाहरू अन्वेषण गर्नुहोस्

20+ खुला स्रोत TTS मोडेलहरूको हाम्रो विवरणिका ब्राउज गर्नुहोस्। प्रत्येक मोडेल पृष्ठले लाइसेन्स, वास्तुकला, क्षमताहरू र आत्म-होस्टिङ आवश्यकताहरू देखाउँछ।

तपाईँको ब्राउजरमा प्रयास गर्नुहोस्

केही स्थापना बिना TTS.ai मा कुनै पनि मोडेल परीक्षण गर्नुहोस्। हाम्रो GPU सर्भरहरू प्रक्रिया ह्यान्डल गर्दछ ताकि तपाईं आत्म-होस्ट गर्न प्रतिबद्ध हुनु अघि गुणस्तरको मूल्यांकन गर्न सक्नुहुन्छ।

आत्म-होस्ट वा हाम्रो API प्रयोग गर्नुहोस्

GitHub बाट क्लोन मोडेल repos र स्थानीय रूपमा चलाउनुहोस्, वा उत्पादनको लागि हाम्रो होस्ट गरिएको एपीआई प्रयोग गर्नुहोस्। आत्म-होस्टिङले पूर्ण नियन्त्रण दिन्छ; हाम्रो एपीआईले प्रबन्धित पूर्वाधार प्रदान गर्दछ।

तपाईँको अनुप्रयोग निर्माण गर्नुहोस्

TTS आफ्नो उत्पादन मा एकीकृत आत्म-होस्ट मोडेल वा हाम्रो REST API प्रयोग। सबै मोडेल कुनै लाइसेन्स शुल्क वा रॉयल्टी संग व्यावसायिक प्रयोग गर्न सकिन्छ।

इजाजतपत्र तुलना

TTS.ai मा सबै मोडेलहरू व्यावसायिक-मैत्री खुला स्रोत लाइसेन्सहरू प्रयोग गर्दछ

नमूना	इजाजतपत्र	श्रेय
Kokoro	Apache 2.0	आवश्यक
Piper	MIT	वैकल्पिक
VITS	MIT	वैकल्पिक
MeloTTS	MIT	वैकल्पिक
Chatterbox	MIT	वैकल्पिक
Tortoise TTS	Apache 2.0	आवश्यक
StyleTTS 2	MIT	वैकल्पिक
OpenVoice	MIT	वैकल्पिक
Sesame CSM	Apache 2.0	आवश्यक
Orpheus	Llama 3.2	"Built with Llama"

यी मोडेल निःशुल्क प्रयास गर्नुहोस्

स्व-होस्टिङ विरुद्ध होस्ट गरिएको एपीआई

तपाईँले नै नमूना चलाउनुहोस् वा हामीलाई पूर्वाधार ह्यान्डल गर्नुहोस्

तपाईँको हार्डवेयरमा स्व-होस्ट

TTS.ai मा हरेक मोडेल GitHub वा Hugging फेस मा खुला स्रोत परियोजनाको रूपमा उपलब्ध छ। वजन डाउनलोड गर्नुहोस्, निर्भरताहरू स्थापना गर्नुहोस्, र आफ्नो GPUs मा निष्कर्षहरू चलाउनुहोस्। तपाईंलाई latency, गोपनीयता र मापनमा पूर्ण नियन्त्रण छ।

पूर्ण डेटा गोपनीयता — अडियोले तपाईँको सर्भर छोड्दैन
सुरुआत सेटअप पछि प्रति- अनुरोध लागत छैन
तपाईँको आफ्नै डेटामा अनुकूलन fine-tuning
GPU हार्डवेयर आवश्यक पर्दछ (NVIDIA सिफारिस गरिएको)
तपाईँले अद्यावधिक, मापन, र निर्भरताहरू व्यवस्थापन गर्नुहुन्छ

TTS.ai होस्ट गरिएको API प्रयोग गर्नुहोस्

एकल REST API मार्फत सबै 20+ मोडेलहरूमा तत्काल पहुँच प्राप्त गर्नुहोस्। हामी जीपीयू प्रावधान, मोडेल अद्यावधिक, कतार व्यवस्थापन र स्केलिङ ह्यान्डल गर्दछौं। एक एपीआई कुञ्जीले तपाईंलाई प्रत्येक मोडेलमा पहुँच दिन्छ - छुट्टै तैनात व्यवस्थापन गर्न आवश्यक छैन।

GPU हार्डवेयर आवश्यक छैन
एक एपीआई मार्फत सबै 20+ मोडेल
स्वचालित नमूना अद्यावधिक र सुधार
99.9% अपटाइम अतिरिक्त पूर्वाधारसँग
तपाईँले प्रयोग गर्ने कुराका लागि मात्र भुक्तानी गर्नुहोस्

सट्टामा होस्ट गरिएको API प्रयोग गर्नुहोस्

छिटो सुरु: एपीआई वा स्व-होस्ट

हाम्रो होस्ट गरिएको एपीआई प्रयोग गर्नुहोस्, वा मिनेटमा कोकोरो स्थानीय रूपमा स्थापना गर्नुहोस्

विकल्प 1: TTS.ai होस्ट गरिएको एपीआई सजिलो

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

विकल्प २: pip सँग स्व- होस्ट पूर्ण नियन्त्रण

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

API मिसिलीकरण हेर्नुहोस्

खुला स्रोत, किफायती मूल्य

हाम्रो होस्ट गरिएको एपीआईले जीपीयूहरू व्यवस्थापन नगरी खुला स्रोत टीटीएस पहुँचयोग्य बनाउँछ।

स्वतन्त्र तह

साइन अप मा 15 क्रेडिट

4 खुला स्रोत मोडेल निःशुल्क
आधारभूत प्रयोगका लागि साइनअप छैन
व्यावसायिक प्रयोग अनुमति दिइएको छ

सुरुआतकर्ता

500 क्रेडिट / महिना

सबै २०+ खुला स्रोत नमूनाहरू
आवाज क्लोनिङ
API पहुँच

प्रो

$29

२,००,००० क्यारेक्टर/महिना

प्राथमिकता GPU प्रक्रिया
सबै प्रिमियम मोडेल
उद्यम समर्थन

पूरा मूल्याङ्कन हेर्नुहोस्

प्राय सोधिने प्रश्नहरू

बोल्नका लागि खुला स्रोत पाठका बारेमा सामान्य प्रश्नहरू

हो। TTS.ai मा हरेक नमूना एक permissive खुला स्रोत लाइसेन्स प्रयोग - MIT वा Apache 2.0. हामी विशेष रूपमा प्रतिबन्धात्मक लाइसेन्स संग नमूनाहरू समावेश (जस्तै Coqui को CPML वा गैर-व्यावसायिक CC-BY-NC). तपाईं यसको GitHub भण्डार मा प्रत्येक नमूना लाइसेन्स रुजु गर्न सक्नुहुन्छ।

दुवै व्यावसायिक प्रयोग, परिमार्जन र पुन: वितरण अनुमति दिने अनुमति खुला स्रोत लाइसेन्सहरू हुन्। अपाचे २.० ले स्पष्ट पेटेन्ट अनुदानहरू थप्दछ र यदि तपाईंले कोड परिमार्जन गर्नुभयो भने परिवर्तनहरू घोषणा गर्न आवश्यक पर्दछ। एमआईटी कम आवश्यकताहरूसँग सरल छ। दुवै व्यवसाय-मैत्री छन्।

हो। हरेक नमूना स्व-होस्ट गर्न सकिन्छ। GitHub बाट नमूना भण्डार क्लोन, निर्भरताहरू स्थापना गर्नुहोस्, नमूना वजन डाउनलोड गर्नुहोस्, र निष्कर्ष निकाल्नुहोस्। हामी GPU, RAM, र पाइथन संस्करण सहित प्रत्येक नमूना स्व-होस्टिङ आवश्यकताहरूको लागि मिसिलीकरण प्रदान गर्दछौं।

आवश्यकताहरू मोडेल द्वारा भिन्न हुन्छन्। पाइपरलाई कुनै जीपीयू आवश्यक पर्दैन (सिपीयू मात्र)। कोकोरो र मेलोटीटीएसलाई 1-2GB VRAM आवश्यक पर्दछ। धेरै मानक मोडेलहरूलाई 4GB VRAM आवश्यक पर्दछ। टर्टोस र सेसेम सीएसएमलाई 8GB आवश्यक पर्दछ। एक NVIDIA RTX 3060 (12GB) ले धेरै मोडेलहरू सहज रूपमा चलाउन सक्छ।

हो । खुला स्रोत इजाजतपत्रले फाइन-ट्युनिङ सहित परिमार्जन गर्न अनुमति दिन्छ । GPT-SoVITS र बार्क जस्ता नमूनाहरूले फाइन-ट्युनिङ स्क्रिप्टहरू प्रदान गर्दछन् । तपाईँले अनुकूल आवाज सिर्जना गर्न वा विशिष्ट भाषाहरूका लागि प्रदर्शन सुधार गर्न तपाईँको आफ्नै आवाज डेटामा नमूनाहरू प्रशिक्षण गर्न सक्नुहुन्छ ।

शीर्ष खुला-स्रोत मोडेल (Kokoro, StyleTTS2, Chatterbox) अब गुणस्तर बेन्चमार्क मा ElevenLabs र गुगल TTS जस्तै व्यावसायिक सेवाहरू मिलान वा भन्दा बढी छन्। व्यावसायिक सेवाहरूको मुख्य फाइदा प्रबन्धित पूर्वाधार र समर्थन हो, अडियो गुणस्तर होइन।

हामी पहिले नै तिनीहरूलाई हटाइएको छ. XTTS/XTTS-v2 (Coqui को CPML — गैर-व्यावसायिक), F5-TTS (CC-BY-NC — गैर-व्यावसायिक), र Higgs-v2 (बोसन लाइसेन्स — प्रतिबन्धात्मक) सबै हटाइएको थियो. हरेक मोडेल मा TTS.ai व्यापारिक-प्रयोग सुरक्षित पुष्टि छ.

हो । धेरैजसो नमूनाहरूले GitHub मार्फत समुदायको योगदान स्वीकार गर्दछन् । तपाईँले बग प्रतिवेदनहरू पेश गर्न सक्नुहुन्छ, नयाँ भाषाहरूका लागि आवाज रेकर्डिङ, कोड सुधार, र मिसिलिकरण । योगदान मार्गदर्शनहरू र सक्रिय मुद्दाहरूका लागि प्रत्येक नमूनाको GitHub भण्डार जाँच गर्नुहोस् ।

हाम्रो जीपीयू सर्भरले गतिशील लोड प्रयोग गरेर 4x टेस्ला P40 (96GB कुल VRAM) मा 20+ मोडेल चलाउँछ। आत्म-होस्टिङको लागि, एकल 24GB जीपीयूले 3-5 मोडेलहरू एकै समयमा सेवा गर्न सक्छ।

धेरै मोडेलहरूले आधिकारिक डोकर छविहरू वा डकफाइलहरू प्रदान गर्दछ। बहु मोडेलहरू चलाउनको लागि, तपाईंले GPU पहुँचको लागि NVIDIA कन्टेनर टूलकिटसँग अनुकूल डोकर सेटअप निर्माण गर्न सक्नुहुन्छ। हाम्रो एपीआई सर्भर वास्तुकला सन्दर्भ कार्यान्वयनको रूपमा सेवा गर्न सक्छ।

धेरै मोडेल पाइथन 3.10-3.12 आवश्यक. Coqui TTS (VITS) विशेष गरी पाइथन 3.11 आवश्यकता. हामी पाइथन 3.12 धेरै मोडेल लागि सिफारिस. सटीक संस्करण अनुकूलता लागि प्रत्येक मोडेलको requirements.txt जाँच.

हो। एमआईटी र अपाचे 2.0 लाइसेन्स स्पष्ट रूपमा व्यावसायिक प्रयोग अनुमति दिन्छ। तपाईं कुनै लाइसेन्स शुल्क, रॉयल्टी, वा श्रेय आवश्यकताहरूको साथ यी मोडेलहरू प्रयोग गरेर SaaS उत्पादनहरू, मोबाइल एप्लिकेसन, खेलहरू र सेवाहरू निर्माण गर्न सक्नुहुन्छ (हालांकि श्रेय सराहना गरिन्छ)।

5.0/5 (1)

आज खुला स्रोत TTS प्रयास गर्नुहोस्

20+ खुला स्रोत मोडेल, सबै व्यावसायिक-लाइसेन्स. हाम्रो एपीआई वा आत्म-होस्ट प्रयोग गर्नुहोस् - विकल्प तपाईंको छ.

निःशुल्क दर्ता गर्नुहोस् मूल्याङ्कन हेर्नुहोस्

ओपन सोर्स पाठबाट वक्तव्य मोडेलName

अहिले प्रयास गर्नुहोस्

TTS.ai प्रेम? आफ्नो साथीहरूलाई भन्नुहोस्!

खुला स्रोत TTS लाभ

सबै खुला स्रोत लाइसेन्स गरिएको

एमआईटी / अपाचे २. ०

स्व-होस्टयोग्य

GPU अनुकूलित

समुदाय मर्मत गरिएको

व्यावसायिक प्रयोग ठीक छ

हाम्रो खुला स्रोत मोडेल विवरणिका

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

खुला स्रोत TTS कसरी प्रयोग गर्ने

खुला स्रोत नमूनाहरू अन्वेषण गर्नुहोस्

तपाईँको ब्राउजरमा प्रयास गर्नुहोस्

आत्म-होस्ट वा हाम्रो API प्रयोग गर्नुहोस्

तपाईँको अनुप्रयोग निर्माण गर्नुहोस्

इजाजतपत्र तुलना

स्व-होस्टिङ विरुद्ध होस्ट गरिएको एपीआई

तपाईँको हार्डवेयरमा स्व-होस्ट

TTS.ai होस्ट गरिएको API प्रयोग गर्नुहोस्

छिटो सुरु: एपीआई वा स्व-होस्ट

खुला स्रोत, किफायती मूल्य

स्वतन्त्र तह

सुरुआतकर्ता

प्रो

प्राय सोधिने प्रश्नहरू

सबै TTS.ai मोडेल साँच्चै खुला स्रोत छन्?

एमआईटी र अपाचे 2.0 इजाजतपत्र बीच के फरक छ?

म मेरो आफ्नै सर्भरमा यी नमूनाहरू स्व-होस्ट गर्न सक्छु?

के GPU म TTS नमूनाहरू स्व-होस्ट गर्न आवश्यक छ?

म खुला स्रोत TTS नमूनाहरू फिन-ट्युन गर्न सक्छु?

कसरी खुला स्रोत TTS मोडेल वाणिज्यिक सेवाहरू तुलना?

म जोगिन गर्नुपर्छ प्रतिबन्धात्मक लाइसेन्स संग कुनै मोडेल छन्?

म यी खुला स्रोत नमूनाहरूमा योगदान गर्न सक्छु?

म कसरी एक GPU सर्भरमा बहुविध नमूनाहरू चलाउँछु?

के स्व-होस्टिङका लागि डोकर छवि छ?

कुन पाइथन संस्करण म आफैलाई होस्ट गर्न आवश्यक छ?

म यी नमूनाहरू प्रयोग गरेर एक व्यावसायिक उत्पादन निर्माण गर्न सक्छन्?

आज खुला स्रोत TTS प्रयास गर्नुहोस्