ओपन सोर्स पाठबाट वक्तव्य मोडेलName

हाम्रो प्लेटफर्म मा हरेक TTS मोडेल व्यावसायिक-मैत्री लाइसेन्स संग खुला स्रोत छ। एमआईटी, Apache 2.0 - कुनै स्वामित्व लक-इन, कुनै प्रयोग प्रतिबन्ध, कुनै आश्चर्य लाइसेन्स शुल्क। तिनीहरूलाई हाम्रो होस्ट एपीआई मार्फत प्रयोग गर्नुहोस्, वा पूर्ण नियन्त्रण संग आफ्नो आफ्नै पूर्वाधार मा तिनीहरूलाई आत्म-होस्ट।

खुला स्रोत एमआईटी इजाजतपत्र अपाचे २. ० स्व-होस्टयोग्य गिथब

अहिले प्रयास गर्नुहोस्

कोकोरो, पाइपर, भिट्स, मेलोटीटीएससँग निःशुल्क
तपाईँको सिर्जना गरिएको अडियो यहाँ देखा पर्नेछ
सिर्जना गरिएको
डाउनलोड गर्नुहोस्
TTS.ai प्रेम? आफ्नो साथीहरूलाई भन्नुहोस्!

खुला स्रोत TTS लाभ

किन खुला स्रोत मोडेल आफ्नो परियोजनाहरूको लागि महत्वपूर्ण छ

सबै खुला स्रोत लाइसेन्स गरिएको

TTS.ai मा हरेक मोडेल एक permissive खुला स्रोत लाइसेन्स प्रयोग गर्दछ। कुनै स्वामित्व कालो बाकस, कुनै विक्रेता लक-मा, कुनै अप्रत्याशित लाइसेन्स शुल्क।

एमआईटी / अपाचे २. ०

नमूनाहरू एमआईटी वा अपाचे २.० अन्तर्गत लाइसेन्स गरिएको छ, सबैभन्दा अनुमति दिने खुला स्रोत लाइसेन्सहरू। व्यावसायिक रूपमा प्रयोग गर्नुहोस्, परिमार्जन गर्नुहोस्, पुन: वितरण गर्नुहोस् - कुनै प्रतिबन्ध छैन।

स्व-होस्टयोग्य

कुनै पनि नमूना डाउनलोड र आफ्नो हार्डवेयर मा यसलाई चलाउनुहोस्। आफ्नो डाटा, लाटेन्सी, र पूर्वाधार मा पूर्ण नियन्त्रण। कुनै क्लाउड निर्भरता आवश्यक छैन।

GPU अनुकूलित

मोडेलहरू CUDA समर्थनको साथ NVIDIA GPUs को लागि अनुकूलित छन्। पाइपर सीपीयूमा मात्र चल्छ। धेरै मोडेलहरू कुशल निष्कर्षणको लागि 2-8GB VRAM आवश्यक पर्दछ।

समुदाय मर्मत गरिएको

सक्रिय खुला-स्रोत समुदायहरू राख्न र यी नमूनाहरू सुधार. योगदान स्वागत छ - बगहरू पेश, सुधार, र GitHub मा नयाँ आवाजहरू.

व्यावसायिक प्रयोग ठीक छ

सबै मोडेल आफ्नो लाइसेन्स अन्तर्गत व्यावसायिक प्रयोग अनुमति दिन्छ। उत्पादन निर्माण, सेवा बेच्न, र कुनै रॉयल्टी वा प्रयोग शुल्क संग व्यावसायिक सामग्री सिर्जना।

हाम्रो खुला स्रोत मोडेल विवरणिका

हरेक मोडेल, यसको लाइसेन्स, र यो सबै भन्दा राम्रो के गर्छ

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

यसका लागि उत्तम: अपाचे 2.0 — सबै भन्दा राम्रो गुणस्तर मुक्त मोडेल, 82M params, स्व-होस्ट गर्न सजिलो

प्रयास गर्नुहोस् Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

यसका लागि उत्तम: एमआईटी - सीपीयू-मात्र, किनारा उपकरणहरू र सम्मिलित आत्म-होस्टिङको लागि उत्तम

प्रयास गर्नुहोस् Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

यसका लागि उत्तम: एमआईटी - धेरै डाउनस्ट्रिम मोडेल द्वारा प्रयोग foundational वास्तुकला

प्रयास गर्नुहोस् VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

यसका लागि उत्तम: एमआईटी — मानक TTS भन्दा अद्वितीय अडियो पुस्ता क्षमताहरू

प्रयास गर्नुहोस् Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 आवाज क्लोनिङ

यसका लागि उत्तम: Apache 2.0 — अधिकतम गुणस्तर, व्यापक अध्ययन सन्दर्भ कार्यान्वयन

प्रयास गर्नुहोस् Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 आवाज क्लोनिङ

यसका लागि उत्तम: एमआईटी — खुला स्रोत आवाज क्लोनिङ ग्रेनलर शैली नियन्त्रणसँग

प्रयास गर्नुहोस् OpenVoice

खुला स्रोत TTS कसरी प्रयोग गर्ने

हाम्रो होस्ट गरिएको एपीआई प्रयोग गर्नुहोस् वा नमूना आफै चलाउनुहोस्

1

खुला स्रोत नमूनाहरू अन्वेषण गर्नुहोस्

20+ खुला स्रोत TTS मोडेलहरूको हाम्रो विवरणिका ब्राउज गर्नुहोस्। प्रत्येक मोडेल पृष्ठले लाइसेन्स, वास्तुकला, क्षमताहरू र आत्म-होस्टिङ आवश्यकताहरू देखाउँछ।

2

तपाईँको ब्राउजरमा प्रयास गर्नुहोस्

केही स्थापना बिना TTS.ai मा कुनै पनि मोडेल परीक्षण गर्नुहोस्। हाम्रो GPU सर्भरहरू प्रक्रिया ह्यान्डल गर्दछ ताकि तपाईं आत्म-होस्ट गर्न प्रतिबद्ध हुनु अघि गुणस्तरको मूल्यांकन गर्न सक्नुहुन्छ।

3

आत्म-होस्ट वा हाम्रो API प्रयोग गर्नुहोस्

GitHub बाट क्लोन मोडेल repos र स्थानीय रूपमा चलाउनुहोस्, वा उत्पादनको लागि हाम्रो होस्ट गरिएको एपीआई प्रयोग गर्नुहोस्। आत्म-होस्टिङले पूर्ण नियन्त्रण दिन्छ; हाम्रो एपीआईले प्रबन्धित पूर्वाधार प्रदान गर्दछ।

4

तपाईँको अनुप्रयोग निर्माण गर्नुहोस्

TTS आफ्नो उत्पादन मा एकीकृत आत्म-होस्ट मोडेल वा हाम्रो REST API प्रयोग। सबै मोडेल कुनै लाइसेन्स शुल्क वा रॉयल्टी संग व्यावसायिक प्रयोग गर्न सकिन्छ।

इजाजतपत्र तुलना

TTS.ai मा सबै मोडेलहरू व्यावसायिक-मैत्री खुला स्रोत लाइसेन्सहरू प्रयोग गर्दछ

नमूना इजाजतपत्र व्यावसायिक प्रयोग परिमार्जन स्व- होस्ट श्रेय
Kokoro Apache 2.0 आवश्यक
Piper MIT वैकल्पिक
VITS MIT वैकल्पिक
MeloTTS MIT वैकल्पिक
Chatterbox MIT वैकल्पिक
Tortoise TTS Apache 2.0 आवश्यक
StyleTTS 2 MIT वैकल्पिक
OpenVoice MIT वैकल्पिक
Sesame CSM Apache 2.0 आवश्यक
Orpheus Llama 3.2 "Built with Llama"

स्व-होस्टिङ विरुद्ध होस्ट गरिएको एपीआई

तपाईँले नै नमूना चलाउनुहोस् वा हामीलाई पूर्वाधार ह्यान्डल गर्नुहोस्

तपाईँको हार्डवेयरमा स्व-होस्ट

TTS.ai मा हरेक मोडेल GitHub वा Hugging फेस मा खुला स्रोत परियोजनाको रूपमा उपलब्ध छ। वजन डाउनलोड गर्नुहोस्, निर्भरताहरू स्थापना गर्नुहोस्, र आफ्नो GPUs मा निष्कर्षहरू चलाउनुहोस्। तपाईंलाई latency, गोपनीयता र मापनमा पूर्ण नियन्त्रण छ।

  • पूर्ण डेटा गोपनीयता — अडियोले तपाईँको सर्भर छोड्दैन
  • सुरुआत सेटअप पछि प्रति- अनुरोध लागत छैन
  • तपाईँको आफ्नै डेटामा अनुकूलन fine-tuning
  • GPU हार्डवेयर आवश्यक पर्दछ (NVIDIA सिफारिस गरिएको)
  • तपाईँले अद्यावधिक, मापन, र निर्भरताहरू व्यवस्थापन गर्नुहुन्छ

TTS.ai होस्ट गरिएको API प्रयोग गर्नुहोस्

एकल REST API मार्फत सबै 20+ मोडेलहरूमा तत्काल पहुँच प्राप्त गर्नुहोस्। हामी जीपीयू प्रावधान, मोडेल अद्यावधिक, कतार व्यवस्थापन र स्केलिङ ह्यान्डल गर्दछौं। एक एपीआई कुञ्जीले तपाईंलाई प्रत्येक मोडेलमा पहुँच दिन्छ - छुट्टै तैनात व्यवस्थापन गर्न आवश्यक छैन।

  • GPU हार्डवेयर आवश्यक छैन
  • एक एपीआई मार्फत सबै 20+ मोडेल
  • स्वचालित नमूना अद्यावधिक र सुधार
  • 99.9% अपटाइम अतिरिक्त पूर्वाधारसँग
  • तपाईँले प्रयोग गर्ने कुराका लागि मात्र भुक्तानी गर्नुहोस्

छिटो सुरु: एपीआई वा स्व-होस्ट

हाम्रो होस्ट गरिएको एपीआई प्रयोग गर्नुहोस्, वा मिनेटमा कोकोरो स्थानीय रूपमा स्थापना गर्नुहोस्

विकल्प 1: TTS.ai होस्ट गरिएको एपीआई सजिलो
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
विकल्प २: pip सँग स्व- होस्ट पूर्ण नियन्त्रण
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

खुला स्रोत, किफायती मूल्य

हाम्रो होस्ट गरिएको एपीआईले जीपीयूहरू व्यवस्थापन नगरी खुला स्रोत टीटीएस पहुँचयोग्य बनाउँछ।

स्वतन्त्र तह

$0

साइन अप मा 15 क्रेडिट

  • 4 खुला स्रोत मोडेल निःशुल्क
  • आधारभूत प्रयोगका लागि साइनअप छैन
  • व्यावसायिक प्रयोग अनुमति दिइएको छ

सुरुआतकर्ता

$9

500 क्रेडिट / महिना

  • सबै २०+ खुला स्रोत नमूनाहरू
  • आवाज क्लोनिङ
  • API पहुँच

प्रो

$29

२,००,००० क्यारेक्टर/महिना

  • प्राथमिकता GPU प्रक्रिया
  • सबै प्रिमियम मोडेल
  • उद्यम समर्थन
पूरा मूल्याङ्कन हेर्नुहोस्

प्राय सोधिने प्रश्नहरू

बोल्नका लागि खुला स्रोत पाठका बारेमा सामान्य प्रश्नहरू

हो। TTS.ai मा हरेक नमूना एक permissive खुला स्रोत लाइसेन्स प्रयोग - MIT वा Apache 2.0. हामी विशेष रूपमा प्रतिबन्धात्मक लाइसेन्स संग नमूनाहरू समावेश (जस्तै Coqui को CPML वा गैर-व्यावसायिक CC-BY-NC). तपाईं यसको GitHub भण्डार मा प्रत्येक नमूना लाइसेन्स रुजु गर्न सक्नुहुन्छ।

दुवै व्यावसायिक प्रयोग, परिमार्जन र पुन: वितरण अनुमति दिने अनुमति खुला स्रोत लाइसेन्सहरू हुन्। अपाचे २.० ले स्पष्ट पेटेन्ट अनुदानहरू थप्दछ र यदि तपाईंले कोड परिमार्जन गर्नुभयो भने परिवर्तनहरू घोषणा गर्न आवश्यक पर्दछ। एमआईटी कम आवश्यकताहरूसँग सरल छ। दुवै व्यवसाय-मैत्री छन्।

हो। हरेक नमूना स्व-होस्ट गर्न सकिन्छ। GitHub बाट नमूना भण्डार क्लोन, निर्भरताहरू स्थापना गर्नुहोस्, नमूना वजन डाउनलोड गर्नुहोस्, र निष्कर्ष निकाल्नुहोस्। हामी GPU, RAM, र पाइथन संस्करण सहित प्रत्येक नमूना स्व-होस्टिङ आवश्यकताहरूको लागि मिसिलीकरण प्रदान गर्दछौं।

आवश्यकताहरू मोडेल द्वारा भिन्न हुन्छन्। पाइपरलाई कुनै जीपीयू आवश्यक पर्दैन (सिपीयू मात्र)। कोकोरो र मेलोटीटीएसलाई 1-2GB VRAM आवश्यक पर्दछ। धेरै मानक मोडेलहरूलाई 4GB VRAM आवश्यक पर्दछ। टर्टोस र सेसेम सीएसएमलाई 8GB आवश्यक पर्दछ। एक NVIDIA RTX 3060 (12GB) ले धेरै मोडेलहरू सहज रूपमा चलाउन सक्छ।

हो । खुला स्रोत इजाजतपत्रले फाइन-ट्युनिङ सहित परिमार्जन गर्न अनुमति दिन्छ । GPT-SoVITS र बार्क जस्ता नमूनाहरूले फाइन-ट्युनिङ स्क्रिप्टहरू प्रदान गर्दछन् । तपाईँले अनुकूल आवाज सिर्जना गर्न वा विशिष्ट भाषाहरूका लागि प्रदर्शन सुधार गर्न तपाईँको आफ्नै आवाज डेटामा नमूनाहरू प्रशिक्षण गर्न सक्नुहुन्छ ।

शीर्ष खुला-स्रोत मोडेल (Kokoro, StyleTTS2, Chatterbox) अब गुणस्तर बेन्चमार्क मा ElevenLabs र गुगल TTS जस्तै व्यावसायिक सेवाहरू मिलान वा भन्दा बढी छन्। व्यावसायिक सेवाहरूको मुख्य फाइदा प्रबन्धित पूर्वाधार र समर्थन हो, अडियो गुणस्तर होइन।

हामी पहिले नै तिनीहरूलाई हटाइएको छ. XTTS/XTTS-v2 (Coqui को CPML — गैर-व्यावसायिक), F5-TTS (CC-BY-NC — गैर-व्यावसायिक), र Higgs-v2 (बोसन लाइसेन्स — प्रतिबन्धात्मक) सबै हटाइएको थियो. हरेक मोडेल मा TTS.ai व्यापारिक-प्रयोग सुरक्षित पुष्टि छ.

हो । धेरैजसो नमूनाहरूले GitHub मार्फत समुदायको योगदान स्वीकार गर्दछन् । तपाईँले बग प्रतिवेदनहरू पेश गर्न सक्नुहुन्छ, नयाँ भाषाहरूका लागि आवाज रेकर्डिङ, कोड सुधार, र मिसिलिकरण । योगदान मार्गदर्शनहरू र सक्रिय मुद्दाहरूका लागि प्रत्येक नमूनाको GitHub भण्डार जाँच गर्नुहोस् ।

हाम्रो जीपीयू सर्भरले गतिशील लोड प्रयोग गरेर 4x टेस्ला P40 (96GB कुल VRAM) मा 20+ मोडेल चलाउँछ। आत्म-होस्टिङको लागि, एकल 24GB जीपीयूले 3-5 मोडेलहरू एकै समयमा सेवा गर्न सक्छ।

धेरै मोडेलहरूले आधिकारिक डोकर छविहरू वा डकफाइलहरू प्रदान गर्दछ। बहु मोडेलहरू चलाउनको लागि, तपाईंले GPU पहुँचको लागि NVIDIA कन्टेनर टूलकिटसँग अनुकूल डोकर सेटअप निर्माण गर्न सक्नुहुन्छ। हाम्रो एपीआई सर्भर वास्तुकला सन्दर्भ कार्यान्वयनको रूपमा सेवा गर्न सक्छ।

धेरै मोडेल पाइथन 3.10-3.12 आवश्यक. Coqui TTS (VITS) विशेष गरी पाइथन 3.11 आवश्यकता. हामी पाइथन 3.12 धेरै मोडेल लागि सिफारिस. सटीक संस्करण अनुकूलता लागि प्रत्येक मोडेलको requirements.txt जाँच.

हो। एमआईटी र अपाचे 2.0 लाइसेन्स स्पष्ट रूपमा व्यावसायिक प्रयोग अनुमति दिन्छ। तपाईं कुनै लाइसेन्स शुल्क, रॉयल्टी, वा श्रेय आवश्यकताहरूको साथ यी मोडेलहरू प्रयोग गरेर SaaS उत्पादनहरू, मोबाइल एप्लिकेसन, खेलहरू र सेवाहरू निर्माण गर्न सक्नुहुन्छ (हालांकि श्रेय सराहना गरिन्छ)।
5.0/5 (1)

हामी के सुधार गर्न सक्छन्? आफ्नो प्रतिक्रिया हामीलाई समस्या समाधान गर्न मद्दत गर्दछ.

आज खुला स्रोत TTS प्रयास गर्नुहोस्

20+ खुला स्रोत मोडेल, सबै व्यावसायिक-लाइसेन्स. हाम्रो एपीआई वा आत्म-होस्ट प्रयोग गर्नुहोस् - विकल्प तपाईंको छ.