बग अहवाल / वैशिष्ट्य विनंती

ओपन सोर्स पाठ्य ते वक्तव्य मॉडेलName

आमच्या प्लॅटफॉर्मवरील प्रत्येक टीटीएस मॉडेल व्यावसायिक-मैत्रीपूर्ण परवानग्यासह ओपन सोर्स आहे. एमआयटी, अपाचे 2.0 - कोणतेही मालकीचे लॉक-इन नाही, वापरावर बंदी नाही, आश्चर्यकारक परवाना शुल्क नाही. आमच्या होस्ट केलेल्या API द्वारे ते वापरा, किंवा पूर्ण नियंत्रणासह आपल्या स्वतःच्या पायाभूत सुविधांवर स्व-होस्ट करा.

ओपन सोर्सName MIT परवाना अपाचे स्वयं-होस्टजोगी गिथबName

पूर्ण TTS संपादक API दस्तऐवजीकरण

आता प्रयत्न करा

0/500

कोकोरो, पाइपर, VITS, MeloTTS सह मोफत

तुमचे निर्मित ऑडिओ येथे दिसेल

पूर्ण TTS संपादक उघडा

ओपन सोर्स TTS फायदे

तुमच्या प्रकल्पांसाठी खुले स्रोत मॉडेल का महत्त्वाचे आहेत

सर्व ओपन- सोर्स परवानाकृत

TTS.ai वरील प्रत्येक मॉडेल एक अनुमतीदार ओपन-सोर्स परवाना वापरते. कोणताही मालकीचा ब्लॅक बॉक्स नाही, विक्रेता लॉक-इन नाही, अनपेक्षित परवाना शुल्क नाही.

एमआईटी/ अपाचे 2.0

मॉडेल एमआयटी किंवा अपाचे 2.0अंतर्गत परवानाकृत आहेत, सर्वात अधिक अनुमती देणारे खुले स्रोत परवाना. व्यावसायिक वापर, संपादित करा, पुन्हा वितरीत करा - कोणतीही मर्यादा नाही.

स्वयं-होस्टजोगी

कोणत्याही मॉडेल डाऊनलोड करा व ते तुमच्या स्वतःच्या हार्डवेअरवर चालवा. तुमच्या माहिती, लाटेन्सी व पायाभूत सुविधांवर पूर्ण नियंत्रण. क्लाउड अवलंबनाची आवश्यकता नाही.

GPU अनुकूलीत

CUDA समर्थनासह NVIDIA GPUs साठी मॉडेल अनुकूलित केले गेले आहे. Piper फक्त CPU वर चालते. बहुतेक मॉडेलला प्रभावी निष्कर्षणासाठी 2-8GB VRAM ची आवश्यकता असते.

समुदाय जपून ठेवले

सक्रीय खुले-स्रोत समुदाय हे मॉडेल चालवतात आणि सुधारतात. योगदान स्वागतार्ह आहे - बग, सुधारणे, आणि GitHub वर नवीन आवाज सादर करा.

व्यावसायिक वापर OK

सर्व नमुने त्यांच्या परवानग्या अंतर्गत व्यावसायिक वापरास परवानगी देतात. उत्पादने तयार करा, सेवा विकत घ्या, आणि कोणत्याही रॉयल्टी किंवा वापर शुल्काशिवाय व्यावसायिक सामग्री तयार करा.

आमचे खुले स्रोत मॉडेल कॅटलॉग

प्रत्येक मॉडेल, त्याची परवाना, आणि ते सर्वोत्तम काय करते

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

ठराविक 5/5

सर्वोत्तम: अपाची 2.0 — सर्वोत्तम गुणवत्तेचे मोफत मॉडेल, 82M परिमाणे, स्वयं-होस्ट करणे सोपे

प्रयत्न करा Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

ठराविक 3/5

सर्वोत्तम: MIT — फक्त CPU, किनार उपकरणे व अंतर्भूत स्व- होस्टिंग करीता उत्तम

प्रयत्न करा Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

ठराविक 3/5

सर्वोत्तम: एमआयटी - अनेक डाउनस्ट्रीम मॉडेल्सद्वारे वापरले जाणारे मूलभूत वास्तुकला

प्रयत्न करा VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

मंद 4/5

सर्वोत्तम: एमआयटी - मानक टीटीएस पेक्षा वेगळी ऑडिओ निर्मिती क्षमता

प्रयत्न करा Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

मंद 5/5 आवाज क्लोनिंग

सर्वोत्तम: Apache 2. 0- उच्चतम गुणवत्ता, विस्तृत अभ्यास संदर्भ अंमलबजावणी

प्रयत्न करा Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

माध्यम 4/5 आवाज क्लोनिंग

सर्वोत्तम: MIT - ग्रॅन्युलर शैली नियंत्रणासह ओपन- सोर्स आवाज क्लोनिंग

प्रयत्न करा OpenVoice

ओपन सोर्स टीटीएस कसे वापरावे

आमचे होस्ट API वापरा किंवा स्वतः मॉडेल चालवा

ओपन सोर्स मॉडेलचा शोध घ्याName

20+ ओपन सोर्स टीटीएस मॉडेल्सची आमची कॅटलॉग ब्राउझ करा. प्रत्येक मॉडेल पान परवाना, आर्किटेक्चर, क्षमता आणि स्वयं-होस्टिंग आवश्यकता दर्शवते.

तुमच्या ब्राऊजर अंतर्गत प्रयत्न करा

काहीही स्थापित न करता TTS.ai वर थेट कोणत्याही मॉडेलची चाचणी करा. आमचे GPU सर्वर प्रोसेसिंग हाताळतात जेणेकरून आपण स्वतः होस्ट करण्यापूर्वी गुणवत्तेचे मूल्यांकन करू शकता.

स्वतः-होस्ट किंवा आमचे API वापरा

GitHub पासून मॉडेल रेपो क्लोन करा आणि स्थानिकरित्या चालवा, किंवा उत्पादनासाठी आमचे होस्ट केलेले API वापरा. स्व-होस्टिंग पूर्ण नियंत्रण देते; आमचे API व्यवस्थापित पायाभूत सुविधा प्रदान करते.

अनुप्रयोग बनवाName

स्वतः-होस्ट मॉडेल किंवा आमचे REST API वापरून आपल्या उत्पादनात TTS एकत्र करा. सर्व मॉडेल परवाना शुल्क किंवा रॉयल्टीशिवाय व्यावसायिकरित्या वापरता येतात.

परवाना तुलना

TTS.ai वरील सर्व मॉडेल्स व्यावसायिकरित्या अनुकूल उघड स्रोत परवाना वापरतात.

मॉडेल	परवाना	श्रेय
Kokoro	Apache 2.0	आवश्यक
Piper	MIT	वैकल्पिक
VITS	MIT	वैकल्पिक
MeloTTS	MIT	वैकल्पिक
Chatterbox	MIT	वैकल्पिक
Tortoise TTS	Apache 2.0	आवश्यक
StyleTTS 2	MIT	वैकल्पिक
OpenVoice	MIT	वैकल्पिक
Sesame CSM	Apache 2.0	आवश्यक
Orpheus	Llama 3.2	"Built with Llama"

हे नमुने मोफत वापरा

स्वयं-होस्टिंग विरुद्ध होस्ट API

तुम्ही स्वतः नमूने चालवा किंवा आम्हाला पायाभूत सुविधा हाताळण्यास सोडा

तुमच्या हार्डवेअरवर स्वयं- यजमान

TTS.ai वरील प्रत्येक मॉडेल GitHub किंवा Hugging Face वर एक ओपन-सोर्स प्रकल्प म्हणून उपलब्ध आहे. वजन डाउनलोड करा, डिपेंडन्सी स्थापित करा, आणि आपल्या स्वतःच्या GPU वर निष्कर्ष काढा. तुम्हाला latency, गोपनीयता आणि स्केलिंग वर पूर्ण नियंत्रण आहे.

पूर्ण माहिती गोपनीयता — ऑडिओ कधीही तुमचे सर्वर सोडत नाही
प्रारंभिक संयोजना नंतर प्रति- विनंती खर्च नाही
तुमच्या स्वतःच्या माहितीवर इच्छिक सुधारणा
GPU हार्डवेअर आवश्यक आहे (NVIDIA सूचविले)
तुम्ही अद्ययावतीकरण, स्केलिंग, व अवलंबित्वाचे व्यवस्थापन करता

TTS.ai होस्ट API चा वापर करा

एकमेव REST API द्वारे सर्व 20+ मॉडेल्सचा त्वरित प्रवेश मिळवा. आम्ही GPU प्रॉव्हिडन्स, मॉडेल अद्ययावत, क्यु व्यवस्थापन आणि स्केलिंग हाताळतो. एक API कि तुम्हाला प्रत्येक मॉडेलचा वापर करण्यास परवानगी देते - वेगळ्या वितरणांची व्यवस्था करण्याची गरज नाही.

GPU हार्डवेअरची गरज नाही
एक API द्वारे सर्व 20+ मॉडेल
स्वचालित मॉडेल अद्ययावत व सुधारणे
99.9% अपटाइम आणि अतिरिक्त पायाभूत सुविधा
तुम्ही वापरलेल्यासाठीच पैसे द्या

त्याऐवजी होस्ट API चा वापर करा

त्वरित प्रारंभ: API किंवा स्वयं- यजमान

आमचे होस्ट API वापरा, किंवा Kokoro स्थानिकरित्या मिनिटांत स्थापित करा

पर्याय 1: TTS.ai होस्ट केलेले API सर्वात सोपे

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

पर्याय 2: pip सह स्वयं- यजमान पूर्ण नियंत्रण

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

API दस्तऐवजीकरण पहा

खुले स्रोत, परवडणारे दर

यामुळे गूगलने आपल्या वेबसाईटवर गूगल प्ले स्टोअरचा वापर न करताही गूगल प्ले स्टोअर वापरता येते.

मुक्त स्तर

नोंदणीवर 15 क्रेडिट

४ ओपन-सोर्स मॉडेल मोफत
मुलभूत वापर करीता नोंदणी नाही
व्यावसायिक वापरास परवानगी

प्रारंभकर्ता

500,000 अक्षरे/महिना

सर्व 20+ ओपन- सोर्स मॉडेल
आवाज क्लोन
API प्रवेश

प्रो

$29

2,000,000 अक्षरे/महिना

प्राधान्यता GPU प्रक्रिया
सर्व प्रीमियम मॉडेल
उद्योजक समर्थन

पूर्ण किंमत पहा

वारंवार विचारले जाणारे प्रश्न

ओपन सोर्स पाठ्य ते वक्तव्य विषयी सामान्य प्रश्न

होय. TTS.ai वरील प्रत्येक मॉडेल एक परमिटिव्ह ओपन-सोर्स परवाना वापरते — MIT किंवा Apache 2.0. आम्ही विशेषतः प्रतिबंधित परवाना असलेल्या मॉडेल्सला वगळतो (जसे की Coqui चे CPML किंवा गैर-व्यावसायिक CC-BY-NC). तुम्ही प्रत्येक मॉडेलची परवाना त्याचे GitHub रेकॉर्डवर तपासू शकता.

दोन्ही अनुमतीचे खुले स्रोत परवाना आहेत जे व्यावसायिक वापर, संपादन व पुनर्वितरणास परवानगी देतात. अपाचे 2.0ने स्पष्टपणे पेटंटचे अनुदान जोडले आहे व तुम्ही कोड संपादित केल्यास बदलांची आवश्यकता आहे. MIT कमी आवश्यकता असलेल्या सोप्या आहे. दोन्ही व्यवसाय- मैत्रीपूर्ण आहेत.

होय. प्रत्येक मॉडेल स्वतः-होस्ट केले जाऊ शकते. GitHub पासून मॉडेल रिपोझिटरी क्लोन करा, डिपेंडन्सीज स्थापित करा, मॉडेल वजन डाऊनलोड करा, आणि निष्कर्षण चालवा. आम्ही प्रत्येक मॉडेलच्या स्वयं-होस्टिंग आवश्यकतांसाठी दस्तऐवजीकरण प्रदान करतो ज्यात GPU, RAM, आणि Python आवृत्ती समाविष्ट आहे.

आवश्यकता मॉडेलनुसार बदलते. Piper ला GPU ची गरज नाही (केवळ CPU). Kokoro आणि MeloTTS ला 1-2GB VRAM ची गरज असते. बहुतेक मानक मॉडेलला 4GB VRAM ची गरज असते. Tortoise आणि Sesame CSM ला 8GB ची गरज असते. NVIDIA RTX 3060 (12GB) बहुतेक मॉडेल सहज चालवू शकते.

होय. ओपन-सोर्स परवानग्या Fine-Tuning सह संपादन करीता परवानगी देतात. GPT-SoVITS व Bark सारखे मॉडेल Fine-Tuning स्क्रिप्ट पुरवितात. तुम्ही तुमच्या स्वतःच्या आवाज माहितीवर मॉडेल्सला प्रशिक्षण देऊ शकता जेणेकरून इच्छिक आवाज तयार करू शकता किंवा विशिष्ट भाषांसाठी कार्यक्षमता सुधारू शकता.

टॉप ओपन-सोर्स मॉडेल्स (कोकोरो, स्टाइलटीटीएस २, चॅटरबॉक्स) आता गुणवत्तेच्या बेंचमार्कमध्ये एलेवेनलॅब्स आणि गुगल टीटीएस सारख्या व्यावसायिक सेवांशी जुळतात किंवा त्यापेक्षा जास्त आहेत.

आम्ही आधीच त्यांना वगळले आहे. XTTS/XTTS-v2 (कोक्वी CPML - गैर-व्यावसायिक), F5-TTS (CC-BY-NC - गैर-व्यावसायिक), आणि Higgs-v2 (बॉसन परवाना - प्रतिबंधात्मक) सर्व काढून टाकले गेले. TTS.ai वर प्रत्येक मॉडेल वाणिज्यिक वापर सुरक्षित आहे.

होय. बहुतेक मॉडेल्स GitHub द्वारे समुदाय योगदान स्वीकारतात. तुम्ही बग अहवाल, नवीन भाषांसाठी आवाज नोंदणी, कोड सुधारणे, आणि दस्तऐवजीकरण सादर करू शकता. योगदान मार्गदर्शक तत्त्वे आणि सक्रीय समस्यांसाठी प्रत्येक मॉडेलच्या GitHub रेकॉर्डशीटची तपासणी करा.

GPU स्मृती सामायिक करण्यासाठी मागणीनुसार मॉडेल्स लोड करा आणि निष्क्रीय असताना लोड करा. आमचे GPU सर्व्हर 4x Tesla P40 (96GB एकूण VRAM) वर 20+ मॉडेल्स चालवते ज्यात गतिमान लोड वापरले जाते. स्व-होस्टिंगसाठी, एकमेव 24GB GPU 3-5 मॉडेल्स एकाच वेळी सेवा देऊ शकते.

अनेक मॉडेल्स अधिकृत Docker प्रतिमा किंवा Dockerfiles प्रदान करतात. अनेक मॉडेल्स चालविण्यासाठी, तुम्ही NVIDIA कंटेनर टूलकिटसह GPU प्रवेशासाठी इच्छिक Docker स्थापना तयार करू शकता. आमचे API सर्व्हर आर्किटेक्चर संदर्भ अंमलबजावणी म्हणून कार्य करू शकते.

बहुतेक मॉडेलसाठी पायथन 3.10-3.12 आवश्यक आहे. कोक्वी टीटीएस (VITS)साठी विशेषतः पायथन 3.11 आवश्यक आहे. बहुतेक मॉडेलसाठी आम्ही पायथन 3.12ची शिफारस करतो. प्रत्येक मॉडेलच्या requirements.txt ची तपासणी करा, त्यातील आवृत्ती योग्य आहे का हे पाहण्यासाठी.

होय. MIT आणि Apache 2.0 परवाना स्पष्टपणे व्यावसायिक वापरास परवानगी देतात. तुम्ही SaaS उत्पादने, मोबाईल ऍप्लिकेशन्स, खेळ आणि सेवा या मॉडेल्सचा वापर करून परवानगी शुल्क, रॉयल्टी किंवा श्रेय आवश्यकताशिवाय बनवू शकता (हे श्रेय स्वीकारले जाते).

5.0/5 (1)

आजच ओपन सोर्स TTS चा वापर करा

20+ ओपन-सोर्स मॉडेल, सर्व व्यावसायिक-लाइसेन्स. आमचे API किंवा स्वयं-होस्टचा वापर करा - निवड तुमच्याकडे आहे.

नोंदणी करा किंमत पहा

ओपन सोर्स पाठ्य ते वक्तव्य मॉडेलName

आता प्रयत्न करा

TTS.ai आवडले? तुमच्या मित्रांना सांगा!

ओपन सोर्स TTS फायदे

सर्व ओपन- सोर्स परवानाकृत

एमआईटी/ अपाचे 2.0

स्वयं-होस्टजोगी

GPU अनुकूलीत

समुदाय जपून ठेवले

व्यावसायिक वापर OK

आमचे खुले स्रोत मॉडेल कॅटलॉग

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

ओपन सोर्स टीटीएस कसे वापरावे

ओपन सोर्स मॉडेलचा शोध घ्याName

तुमच्या ब्राऊजर अंतर्गत प्रयत्न करा

स्वतः-होस्ट किंवा आमचे API वापरा

अनुप्रयोग बनवाName

परवाना तुलना

स्वयं-होस्टिंग विरुद्ध होस्ट API

तुमच्या हार्डवेअरवर स्वयं- यजमान

TTS.ai होस्ट API चा वापर करा

त्वरित प्रारंभ: API किंवा स्वयं- यजमान

खुले स्रोत, परवडणारे दर

मुक्त स्तर

प्रारंभकर्ता

प्रो

वारंवार विचारले जाणारे प्रश्न

सर्व TTS.ai नमुने खरच ओपन सोर्स आहेत का?

MIT आणि Apache 2.0 परवानग्या दरम्यान फरक काय आहे?

मी स्वतःच्या सर्व्हरवर हे मॉडेल्स स्व-होस्ट करू शकतो का?

TTS मॉडेल स्व-होस्ट करण्यासाठी मला काय GPU ची गरज आहे?

मी ओपन-सोर्स TTS मॉडेल्सची सुधारणा करू शकतो का?

ओपन सोर्स टीटीएस मॉडेल्सची तुलना व्यावसायिक सेवांशी कशी करता येईल?

कोणत्याही प्रकारची शस्त्रक्रिया न करता गर्भपात करणे योग्य आहे का?

या योजनेत सहभागी होण्यासाठी कोणते निकष पूर्ण करावे लागतात?

मी एका GPU सर्व्हरवर अनेक नमुने कसे चालवू शकतो?

याचे कारण म्हणजे याचे वजन कमी करण्यासाठी वजन कमी करणे आवश्यक आहे.

या योजनेत सहभागी होण्यासाठी कोणत्या प्रकारची पात्रता आवश्यक आहे?

या यंत्राचा वापर करून आपण कोणत्याही प्रकारचे उत्पादन करू शकतो.

आजच ओपन सोर्स TTS चा वापर करा