पाठ को बोलने के लिए खोलें

हमारे मंच पर हर TTS मॉडल के साथ व्यावसायिक रूप से अनुकूल लाइसेंस के साथ खुले स्रोत है. MATCAT, 2.0 - कोई leveling लॉक प्रतिबंध, कोई आश्चर्य की रोक नहीं है. उनका उपयोग हमारे मेजबानित बिल के माध्यम से करें, या अपने स्वयं पर पूर्ण नियंत्रण के साथ.

स्रोत खोलें लाइसेंस arbfp 2. 0 स्व- होस्ट- नहीं GiHh

अब इसे कोशिश करें

कोकोरो, पाइपर, VIFS, मेरोट के साथ मुक्त
आपका उत्पन्न ऑडियो यहाँ प्रकट होगा
बनाएँ (G)
डाउनलोड
अपने दोस्तों को बताइए!

स्रोत टीएसएस फ़ायदे खोलें

अपने परियोजनाओं के लिए खुला विकल्प विषय क्यों खोलें

सभी खुले स्रोत लाइसेंस

TTS.ai पर हर मॉडल एक गलत खुले-source लाइसेंस का उपयोग करता है. कोई भी अपराजी ब्लैक बक्से, कोई भी विक्रेता लॉक नहीं, कोई अप्रत्याशित खांस का भुगतान नहीं करता.

देश / 2.0 2. 0

मॉडल एमआईटी या 2.0 के तहत लाइसेंस दिए गए हैं, सबसे विजुअल खुले स्रोत लाइसेंस. व्यावसायिक रूप से प्रयोग करें, परिवर्धित करें, परिवहन — कोई प्रतिबंध नहीं.

स्व- होस्ट- नहीं

कोई मॉडल डाउनलोड करें और इसे अपने स्वयं के हार्डवेयर पर चलाएँ. आपके डाटा, लेटनर तथा इन्फाइस पर पूरा नियंत्रण है. बादल की आवश्यकता नहीं है.

गापीयू ऑप्टीमाइज़्ड

NVIDIA समर्थन के साथ NUPEPEACA के लिए मॉडलों का प्रतिनिधित्व किया जा रहा है. पाइप केवल सीपीयू पर चलता है. अधिकांश मॉडलों को 2-8-8GB वेन के लिए कुशल के लिए तैयार होना चाहिए.

समाज को बरकरार रखा गया

सक्रिय स्रोत समूह इन मॉडलों को बनाए रखते हैं और सुधार करते हैं. सहयोग दें - बग- फ़लब पर बग सुधार, सुधार तथा नए आवाज को स्वीकार करें.

व्यावसायिक उपयोग ठीक

सभी मॉडलों में व्यापारिक प्रयोग की अनुमति दी जाती है ।

हमारा ओपन स्रोत मॉडल कैटालॉग

हर मॉडल, अपने लाइसेंस, और जो अच्छा करता है

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

के लिए उत्तम: DROWOT 2. 0 — उत्तम गुण मुक्त मॉडल, 82M खड़े, स्व-होल के लिए आसान

कोशिश करें Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

के लिए उत्तम: MIT — सिर्फ सीपीयू, किनारा उपकरणों के लिए सिद्ध और अंतर्निर्मित स्व- होस्टिंग

कोशिश करें Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

के लिए उत्तम: देश — बहुत - से मॉडलों के ज़रिए इस्तेमाल की गयी नींव - पत्थर की बनावट

कोशिश करें VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

के लिए उत्तम: देश — मानक टीटीटी से परे विशिष्ट ऑडियो पीढ़ी क्षमताओं को विशिष्ट किया जा सकता है

कोशिश करें Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 आवाज कोलोन

के लिए उत्तम: 2.0 — अधिकतम गुणवत्ता, व्यापक संदर्भ कार्यान्वयन का अध्ययन

कोशिश करें Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 आवाज कोलोन

के लिए उत्तम: MTAT - ओपन-source परस्पर आग्रही शैली के साथ खोलें

कोशिश करें OpenVoice

कैसे खोलें स्रोत TS का प्रयोग करें

हमारे मेजबान्ड एपीआई का उपयोग करें या अपने आप को मॉडल चलाने के लिए

1

स्रोत मॉडल तैयार करें

20+ open-source टीएस मॉडल की हमारी सूची ब्राउज़ करें. प्रत्येक मॉडल पृष्ठ लाइसेंस, निर्माण, क्षमताओं, और स्व- युक्ति माँगों को दिखाता है.

2

अपने ब्राउज़र में कोशिश करें

कोई भी मॉडल सीधे TTS.ai पर जाँच बिना कुछ भी अधिष्ठापन के. हमारे जीपी सर्वर प्रक्रिया संभाल करता है ताकि आप खुद को संस्थापित करने से पहले गुणवत्ता की जाँच कर सकें.

3

स्व-धन या हमारे एपीआई का प्रयोग

GitHb से फिर से कनेक्ट करें और स्थानीय रूप से चलाने के लिए, या उत्पादन के लिए हमारे मेजबान्ड एपीआई इस्तेमाल करें. स्व-होलिंग पूर्ण नियंत्रण देता है, हमारा एपीआई sfundacents में सक्षम प्रदान करता है.

4

आपके अनुप्रयोग बिल्ड करें

स्वयं के मॉडल का उपयोग कर अपने उत्पाद में टीएसटीआई या हमारे Reeeb. सभी मॉडल व्यापार के साथ इस्तेमाल कर रहे हैं किसी भी तरह से कर रहे हैं.

लाइसेंस तुलना

TTS.ai पर सभी मॉडल व्यावसायिक रूप से खुले स्रोत लाइसेंस का उपयोग करते हैं

मॉडल लाइसेंस व्यावसायिक उपयोग परिवर्धन स्व- होस्ट आस - पास की आयतों पर गौर कीजिए ।
Kokoro Apache 2.0 आवश्यक
Piper MIT वैकल्पिक
VITS MIT वैकल्पिक
MeloTTS MIT वैकल्पिक
Chatterbox MIT वैकल्पिक
Tortoise TTS Apache 2.0 आवश्यक
StyleTTS 2 MIT वैकल्पिक
OpenVoice MIT वैकल्पिक
Sesame CSM Apache 2.0 आवश्यक
Orpheus Llama 3.2 "Built with Llama"

स्व-Hobs मेजबानित एपीआई

अपने आप को आदर्श चलाएँ या हम इन्फ्रास्ट्रक्चर को संभाल लें

आपके हार्डवेयर पर स्व-Hol

TTS.ai पर प्रत्येक मॉडल एक खुले स्रोत परियोजना के रूप में मौजूद है GiHHHब या Hyfing चेहरे पर. डाउनलोड, निर्भरता संस्थापित करें, और अपने स्वयं के जीपीएस पर चलाने के लिए चलाएँ. आपके पास देर से अधिक गोपनीयता, गोपनीयता, और स्केलिंग पर पूरी तरह नियंत्रण है.

  • पूर्ण डाटा गोपनीयता — ऑडियो आपके सर्वर को कभी नहीं छोड़ता
  • आरंभिक सेटअप के बाद कोई भी प्रति- निर्धारित लागत नहीं
  • अपने स्वयं के डेटा पर मनपसंद बढ़िया-चंजिंग
  • GPS हार्डवेयर की आवश्यकता है (एनईआईएमई अनुशंसित)
  • आप अद्यतन, स्केलिंग, और निर्भरता प्रबंधन

TTS.ai होस्ट का प्रयोग करें

एक एकल पुनःसंक्रिया के माध्यम से सभी 20+ मॉडलों के लिए तत्काल पहुँच प्राप्त करें. हम GuUPATaning, मॉडल अद्यतन, कतार प्रबंधन प्रबंधन, और स्केलिंग नियंत्रण संभालता है. एक एपीआई कुंजी आपको हर मॉडल तक पहुँचने की जरूरत नहीं है, अलग-अलग निगरानी का प्रबंधन करने की जरूरत नहीं है.

  • कोई GPS हार्डवेयर आवश्यक नहीं
  • सभी 20+ मॉडल एक अक्षर के माध्यम से
  • स्वचालित मॉडल अद्यतन तथा सुधार
  • 99. 9% वैकल्पिक इंस्फीयर के साथ ऊपर का समय
  • "तुम बदला वही तो पाओगे जो तुम करते हो

क्विक प्रारंभ: एपीआई या स्व- युक्ति

हमारे मेजबान्ड एपीआई इस्तेमाल करें, या मिनट में कोकोरो स्थानीय संस्थापित करें

विकल्प 1: TTS.ai होस्ट्ड एपीआई सबसे मुश्‍किल
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
विकल्प 2: पीपी के साथ स्व- होस्ट पूरा नियंत्रण
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

स्रोत खोलें, AfrfordPing

हमारे मेजबानित एपीआई GUs के प्रबंधन के बिना ओपन-source Tecuts उपलब्ध बनाता है.

फ्री टीयर

$0

साइन अप पर 50 श्रेय

  • 4 खुला- स्रोत मॉडल मुक्त
  • मूल उपयोग के लिए कोई हस्ताक्षर नहीं
  • व्यावसायिक उपयोग स्वीकार्य

प्रारंभ

$9

5,00,000 अक्षर/ माह

  • सभी 20+ खुले स्रोत मॉडल
  • आवाज कहीं नहीं
  • एपीआई पहुँच

प्रोग्रेड

$29

2 लाख अक्षर/ माह

  • प्राथमिकता जीपिपी प्रक्रिया
  • सभी प्रीडिनियम मॉडल
  • छोटे समर्थन
फुल- मुख्स देखें

बार बार पूछे जाने वाले प्रश्न

खुले स्रोत पाठ को बोलने के बारे में आम सवाल

जी हाँ. प्रत्येक मॉडल TTS.ai पर एक गलत खुले स्रोत लाइसेंस का उपयोग करता है या तो एमटीटी या 2.0 0. हम विशेष रूप से प्रतिबन्धों के साथ मॉडल अलग (जैसे कि Ceeee' Cucue'ML या नॉन-MPCP-B-B- Baphhhhhhh-S पर। आप प्रत्येक मॉडल के लाइसेंस की जाँच कर सकते हैं।

दोनों गलत खुले स्रोत लाइसेंस हैं जो व्यावसायिक उपयोग, परिवर्धन, और पुनः प्रदान करने की अनुमति देते हैं. 2.0 विस्तार प्रदान करता है और बताता है कि यदि आप कोड को परिवर्धित करते हैं तो परिवर्तनों को कम आवश्यकताओं के साथ सरल करता है. दोनों ही व्यवसायात्मक हैं.

हां. हर मॉडल आत्म-host किया जा सकता है. Gihb से एक मॉडल भंडार दर्ज करें, निर्भरता स्थापित करें, मॉडल वजन में डाउनलोड करें, और चलाने में दौड़ता है. हम प्रत्येक मॉडल के स्वयं के लिए दस्तावेज प्रदान करते हैं GP-host, रैम और पायथन संस्करण में.

EVATERITBET. tuer कोई Gugo (सिर्फ Sugio) की जरूरत नहीं है। कोकोरोरो और मेलटीटीटीटीटीएस को 1 2-2GB वेथ की जरूरत होती है। अधिकांश मानक मॉडलों को 4GB वेथ की जरूरत होती है और सी-जी में 8GB की जरूरत होती है। एक एम. एम. एम.

जी हाँ. ओपन-source लाइसेंस अच्छी तरह से काम करने की अनुमति देता है. मॉडल की तरह Gen-thens और बार-ks बढ़िया स्क्रिप्ट प्रदान करता है. आप अपनी आवाज के मॉडलों को मनपसंद भाषा बनाने या विशिष्ट भाषाओं के लिए और सुधार करने के लिए प्रशिक्षित कर सकते हैं.

टॉप खुले स्रोत मॉडल (केऑक्सो, स्टाइलटीटीटीएस 2, गपशप- बक्से) अब 11 Sbebe और गूगल टीएस क्वालिटी के रूप में मेल या अधिक व्यावसायिक सेवाओं से मेल खाता है. व्यापार सेवाओं का मुख्य लाभ अभ्य्यता और समर्थन, ऑडियो गुणवत्ता में सक्षम नहीं है.

We have already excluded them. XTTS/XTTS-v2 (Coqui's CPML — non-commercial), F5-TTS (CC-BY-NC — non-commercial), and Higgs-v2 (Boson License — restrictive) were all removed. Every model on TTS.ai is verified commercial-use safe.

हाँ. अधिकांश मॉडल GiHHHh के माध्यम से समुदाय के अंशदान स्वीकार करते हैं. आप बग रपट स्वीकार कर सकते हैं, नए भाषा की रिपोर्ट, कोड सुधार, और दस्तावेज़ के लिए आवाज्स. प्रत्येक मॉडल के उपप भंडार को निर्देश और सक्रिय मुद्दों के लिए चेक करें.

Gugue स्मृति को साझा करने के लिए जब निष्क्रिय और लोड करने के लिए मॉडल लोड कर सकते हैं. हमारा जीपीयू सर्वर 4xee P40 (96xeaxea) पर 20+ मॉडल चलाता है जो विशाल लोड किया जा रहा है. स्व-host, एक एकल 24GB जीक मॉडलों के लिए सेवा कर सकते हैं मौजूदा रूप में

बहुत से मॉडल सरकारी डॉकर छवियों या डॉकfiles प्रदान करते हैं. कई मॉडल चलाने के लिए, आप एक मनपसंद डॉक डॉकर निर्माण कर सकते हैं NVIAIA समाहित पात्र के साथ जीयू एक्सेस के लिए. हमारे API सर्वर डिजाइन एक संदर्भ के रूप में काम कर सकते हैं.

अधिकांश मॉडलों के लिए पायथन 3.12 की आवश्यकता होती है. कोक टीएस (VITS) खास तौर पर पायथन 3.11 की आवश्यकता होती है. हम पायथन को अधिकतर मॉडल्स के लिए सलाह देते हैं. हर मॉडल के आवश्यकताओं को जाँचें. सटीक संस्करण संगतता के लिए फिट.

हाँ. MIAT और 2.0 लाइसेंसों को प्रत्यक्ष रूप से व्यावसायिक प्रयोग की अनुमति देते हैं. आप SaaS उत्पादन, मोबाइल ऐप, खेल, और सेवाओं का निर्माण कर सकते हैं इन मॉडलों के साथ कोई cacts, राजस्वार्थी का भुगतान, या अनुमानित माँगों के साथ (हालाँकि कि कि कि कि कि कि कि हिसाब से माना जाता है).
5.0/5 (1)

क्या हम सुधार कर सकते हैं?

आज खोलने की कोशिश करें

20+ खुले स्रोत मॉडल, सभी व्यावसायिक मॉडल. हमारे एपीआई या स्व-होल का प्रयोग करें — चुनाव तुम्हारा है.