ઓપન સોર્સ લખાણ-થી-ભાષણ મોડેલોName

અમારા પ્લેટફોર્મ પર દરેક TTS મોડેલ વ્યાપારી-મિત્રતાપૂર્ણ લાઇસન્સ સાથે ઓપન સ્રોત છે. MIT, Apache 2.0 — કોઇ પ્રોપર્ટી લોક-ઇન નથી, કોઇ વપરાશ પ્રતિબંધ નથી, કોઇ અચાનક લાઇસન્સિંગ ફી નથી. તેમને અમારા હોસ્ટ કરેલ API મારફતે વાપરો, અથવા તેમને તમારા પોતાના ઇન્ફ્રાસ્ટ્રક્ચર પર સંપૂર્ણ નિયંત્રણ સાથે સ્વયં-હોસ્ટ કરો.

ઓપન સોર્સ MIT લાઇસન્સ અપાચી ૨.૦ સ્વયં-હોસ્ટ કરી શકાય તેવું ગિટહુબ

હવે પ્રયત્ન કરો

કોકોરો, પાઇપર, VITS, MeloTTS સાથે મુક્ત
તમારું ઉત્પન્ન થયેલ ઓડિયો અહીં દેખાશે
બનાવેલ
ડાઉનલોડ
TTS.ai ને પ્રેમ કરો છો? તમારા મિત્રોને કહી દો!

ઓપન સોર્સ TTS લાભો

તમારા પ્રોજેક્ટ માટે ઓપન-સોર્સ મોડેલો કેમ મહત્વપૂર્ણ છે

બધા ઓપન-સોર્સ લાઇસન્સ થયેલ

TTS.ai પર દરેક મોડેલ પરવાનગી આપતી ઓપન-સોર્સ લાઇસન્સ વાપરે છે. કોઇ પ્રોપર્ટી બ્લેક બોક્સ નથી, કોઇ વેપારી લોક-ઇન નથી, કોઇ અનિચ્છનીય લાઇસન્સિંગ ફી નથી.

MIT / અપાચે ૨. ૦

મોડેલો MIT અથવા Apache ૨.૦ ની નીચે લાઇસન્સ થયેલ છે, સૌથી વધુ પરવાનગી આપતી ઓપન-સોર્સ લાઇસન્સ. વ્યવસાયિક રીતે વાપરો, બદલો, પુનઃવિતરો — કોઈ પ્રતિબંધો નથી.

સ્વયં-હોસ્ટ કરી શકાય તેવું

કોઈપણ મોડેલ ડાઉનલોડ કરો અને તેને તમારા પોતાના હાર્ડવેરમાં ચલાવો. તમારી માહિતી, લેટેન્સી અને ઇન્ફ્રાસ્ટ્રક્ચર પર સંપૂર્ણ નિયંત્રણ. કોઈ વાદળ આધારની જરૂર નથી.

GPU મહત્તમ થયેલ

મોડેલો CUDA આધાર સાથે NVIDIA GPUs માટે શ્રેષ્ઠ છે. Piper ફક્ત CPU પર ચાલે છે. મોટાભાગના મોડેલોને કાર્યક્ષમ અનુમાન માટે ૨-૮GB VRAM ની જરૂર છે.

સમુદાય જાળવાયેલ

સક્રિય ઓપન-સોર્સ સમુદાયો આ નમૂનાઓને જાળવે છે અને સુધારે છે. પ્રદાન સ્વીકાર્ય છે - બગ્સ, સુધારાઓ, અને GitHub પર નવા અવાજો રજૂ કરો.

વાણિજ્યિક વપરાશ બરાબર

બધા મોડેલો તેમના લાઇસન્સ હેઠળ વાણિજ્યિક ઉપયોગની પરવાનગી આપે છે. ઉત્પાદનો બનાવો, સેવાઓ વેચો, અને વાણિજ્યિક સમાવિષ્ટો બનાવો કોઈ રોયલ્ટી અથવા વપરાશ ફી વગર.

અમારું ઓપન સ્ત્રોત મોડેલ કેટેલોગ

દરેક મોડેલ, તેની લાઇસન્સ, અને તે શું શ્રેષ્ઠ કરે છે

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

માટે શ્રેષ્ઠ: Apache ૨. ૦ - શ્રેષ્ઠ ગુણવત્તા મુક્ત મોડેલ, ૮૨M પરિમાણો, સ્વયં- યજમાન કરવા માટે સરળ

પ્રયત્ન કરો Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

માટે શ્રેષ્ઠ: MIT — CPU-only, એજ ઉપકરણો અને જડિત સ્વયં-હોસ્ટિંગ માટે સંપૂર્ણ

પ્રયત્ન કરો Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

માટે શ્રેષ્ઠ: MIT — ઘણાં ડાઉનસ્ટ્રીમ મોડેલો દ્વારા વપરાતું મૂળભૂત આર્કિટેક્ચર

પ્રયત્ન કરો VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

માટે શ્રેષ્ઠ: MIT — પ્રમાણભૂત TTS થી વધારે અનોખી ઓડિયો ઉત્પન્ન ક્ષમતા

પ્રયત્ન કરો Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 અવાજ ક્લોનિંગ

માટે શ્રેષ્ઠ: Apache ૨. ૦ - મહત્તમ ગુણવત્તા, વિસ્તૃત અભ્યાસ સંદર્ભ અમલીકરણ

પ્રયત્ન કરો Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 અવાજ ક્લોનિંગ

માટે શ્રેષ્ઠ: MIT - ઓપન-સોર્સ વોઇસ ક્લોનીંગ ગ્રેનોલાર શૈલી નિયંત્રણ સાથે

પ્રયત્ન કરો OpenVoice

ઓપન સોર્સ TTS કેવી રીતે વાપરો

અમારું યજમાન API વાપરો અથવા મોડેલોને તમે જ ચલાવો

1

ઓપન-સોર્સ મોડેલોને શોધો

૨૦+ ઓપન-સોર્સ TTS મોડેલોની અમારી કેટેલોગ બ્રાઉઝ કરો. દરેક મોડેલ પાનું લાઇસન્સ, આર્કિટેક્ચર, ક્ષમતા, અને સ્વયં-હોસ્ટિંગ જરૂરિયાતો બતાવે છે.

2

તમારા બ્રાઉઝરમાં પ્રયત્ન કરો

કંઇપણ સ્થાપિત કર્યા વગર TTS.ai પર સીધું કોઈપણ મોડેલ ચકાસો. અમારા GPU સર્વર પ્રક્રિયાને સંભાળે છે તેથી તમે સ્વયં-હોસ્ટિંગ માટે પ્રતિબદ્ધ થવા પહેલાં ગુણવત્તાનું મૂલ્યાંકન કરી શકો છો.

3

સ્વયં-યજમાન અથવા અમારી API વાપરો

GitHub માંથી ક્લોન મોડેલ રેપો અને સ્થાનિક રીતે ચલાવો, અથવા ઉત્પાદન માટે અમારા યજમાન API નો ઉપયોગ કરો. સ્વયં-યજમાન સંપૂર્ણ નિયંત્રણ આપે છે; અમારું API સંચાલિત માળખું પૂરુ પાડે છે.

4

તમારા કાર્યક્રમને બનાવો

તમારી પ્રોડક્ટમાં TTS ને સ્વયં-હોસ્ટ કરેલ મોડેલો અથવા અમારી REST API ની મદદથી એકીકૃત કરો. બધા મોડેલો લાઇસન્સિંગ ફી અથવા રોયલ્ટી વગર વાણિજ્યિક રીતે ઉપયોગી છે.

લાઇસન્સ સરખામણી

TTS.ai પર બધા મોડેલો વાણિજ્યિક-મિત્રતાપૂર્ણ ઓપન-સોર્સ લાઇસન્સ વાપરે છે

મોડેલ લાઇસન્સ વ્યવસાયિક વપરાશ સુધારો સ્વયં-યજમાન એટ્રિબ્યુશન
Kokoro Apache 2.0 જરૂરી
Piper MIT વૈકલ્પિક
VITS MIT વૈકલ્પિક
MeloTTS MIT વૈકલ્પિક
Chatterbox MIT વૈકલ્પિક
Tortoise TTS Apache 2.0 જરૂરી
StyleTTS 2 MIT વૈકલ્પિક
OpenVoice MIT વૈકલ્પિક
Sesame CSM Apache 2.0 જરૂરી
Orpheus Llama 3.2 "Built with Llama"

સ્વયં-હોસ્ટિંગ વિ યજમાન API

તમે મોડેલોને ચલાવો અથવા અમને ઇન્ફ્રાસ્ટ્રક્ચર સંભાળવા દો

તમારા હાર્ડવેરમાં સ્વયં-યજમાન

TTS.ai પર દરેક મોડેલ GitHub અથવા Hugging Face પર ઓપન-સોર્સ પ્રોજેક્ટ તરીકે ઉપલબ્ધ છે. વજનોને ડાઉનલોડ કરો, આધારોને સ્થાપિત કરો, અને તમારા પોતાના GPUs પર અનુમાન ચલાવો. તમારી પાસે લેટેન્સી, ગોપનીયતા, અને માપન પર સંપૂર્ણ નિયંત્રણ છે.

  • સંપૂર્ણ માહિતી ગોપનીયતા — ઓડિયો ક્યારેય તમારા સર્વરને છોડતો નથી
  • પ્રારંભિક સુયોજન પછી કોઇ પ્રતિ-વિનંતી ખર્ચા નથી
  • તમારી પોતાની માહિતી પર વૈવિધ્યપૂર્ણ સુધારો
  • GPU હાર્ડવેરની જરૂર છે (NVIDIA સૂચવેલ)
  • તમે સુધારાઓ, માપન, અને આધારોનું વ્યવસ્થાપન કરો

TTS.ai યજમાન API વાપરો

એક જ REST API મારફતે બધા 20+ મોડેલો માટે તરત જ પ્રવેશ મેળવો. અમે GPU પ્રોવિઝનિંગ, મોડેલ સુધારાઓ, કતાર વ્યવસ્થાપન અને માપનને સંભાળીએ છીએ. એક API કી તમને દરેક મોડેલને પ્રવેશ આપે છે - અલગથી વિસ્તરણોને વ્યવસ્થાપિત કરવાની જરૂર નથી.

  • GPU હાર્ડવેરની જરૂર નથી
  • એક API મારફતે બધા 20+ મોડેલો
  • આપોઆપ મોડેલ સુધારાઓ અને સુધારાઓ
  • 99.9% અપટાઇમ સાથે અપૂરતી માળખાગત સુવિધાઓ
  • તમે જે વાપરો છો તેના માટે જ ચૂકવણી કરો

ઝડપી શરૂઆત: API અથવા સ્વયં-યજમાન

અમારી યજમાન API વાપરો, અથવા મિનિટોમાં કોકોરો સ્થાનિક રીતે સ્થાપિત કરો

વિકલ્પ ૧: TTS.ai યજમાન API સૌથી સરળ
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
વિકલ્પ ૨: pip સાથે સ્વયં-યજમાન સંપૂર્ણ નિયંત્રણ
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

ઓપન સોર્સ, સસ્તું ભાડું

અમારી યજમાન એપીઆઈ જીપીયુનું વ્યવસ્થાપન કર્યા વિના ઓપન-સોર્સ ટીટીએસને ઉપલબ્ધ બનાવે છે.

મુક્ત સ્તર

$0

નોંધણી પર 50 ક્રેડિટ્સ

  • 4 ઓપન-સોર્સ મોડેલો મુક્ત
  • મૂળભૂત વપરાશ માટે નોંધણી નથી
  • વ્યવસાયિક વપરાશ પરવાનગી આપેલ છે

શરુઆત કરનાર

$9

500,000 અક્ષરો/મહિનો

  • બધા ૨૦+ ઓપન-સોર્સ મોડેલો
  • અવાજ ક્લોનિંગ
  • API પ્રવેશ

પ્રોફેશનલ

$29

૨,૦૦૦,૦૦૦ અક્ષરો/મહિનો

  • GPU પ્રક્રિયાને પ્રાથમિકતા
  • બધા પ્રીમિયમ મોડેલો
  • એન્ટરપ્રાઇઝ આધાર
સંપૂર્ણ કિંમત જુઓ

વારંવાર પૂછાતા પ્રશ્નો

ઓપન સોર્સ લખાણને બોલવામાં વિશે સામાન્ય પ્રશ્નો

હા. TTS.ai પર દરેક મોડેલ પરવાનગી આપતી ઓપન-સોર્સ લાઇસન્સ વાપરે છે - MIT અથવા Apache 2.0. અમે સ્પષ્ટપણે પ્રતિબંધિત લાઇસન્સ સાથેના મોડેલોને બાકાત રાખીએ છીએ (Coqui ની CPML અથવા બિન-વાણિજ્યિક CC-BY-NC જેવી). તમે દરેક મોડેલની લાઇસન્સ તેની GitHub રિપોઝીટરી પર ચકાસી શકો છો.

બંને પરવાનગી આપતી ઓપન-સોર્સ લાઇસન્સ છે જે વ્યાપારિક વપરાશ, ફેરફાર, અને પુનઃવિતરણને પરવાનગી આપે છે. Apache ૨.૦ સ્પષ્ટ પેટેન્ટ ગ્રાન્ટ્સ ઉમેરે છે અને જો તમે કોડને બદલો તો ફેરફારોની જરૂરિયાત છે. MIT ઓછી જરૂરિયાતો સાથે સરળ છે. બંને વ્યવસાય-મિત્રતાપૂર્ણ છે.

હા. દરેક મોડેલ સ્વયં-હોસ્ટ થયેલ હોઈ શકે છે. GitHub માંથી મોડેલ રિપોઝીટરીને ક્લોન કરો, આધાર રાખે છે, મોડેલ વજનોને ડાઉનલોડ કરો, અને અંદાજ ચલાવો. અમે GPU, RAM, અને Python આવૃત્તિને સમાવતી દરેક મોડેલની સ્વયં-હોસ્ટ કરવાની જરૂરિયાતો માટે દસ્તાવેજ પૂરુ પાડીએ છીએ.

જરૂરિયાતો મોડેલ અનુસાર બદલાય છે. Piper ને GPU ની જરૂર નથી (કેવળ CPU). Kokoro અને MeloTTS ને 1-2GB VRAM ની જરૂર છે. મોટાભાગના પ્રમાણભૂત મોડેલોને 4GB VRAM ની જરૂર છે. Tortoise અને Sesame CSM ને 8GB ની જરૂર છે. NVIDIA RTX 3060 (12GB) મોટાભાગના મોડેલોને આરામથી ચલાવી શકે છે.

હા. ઓપન-સોર્સ લાઇસન્સો સુધારવા માટે પરવાનગી આપે છે જેમાં ફિન-ટ્યુનિંગ પણ છે. GPT-SoVITS અને Bark જેવા મોડેલો ફિન-ટ્યુનિંગ સ્ક્રિપ્ટો પૂરી પાડે છે. તમે તમારા પોતાના અવાજ માહિતી પર મોડેલોને વૈવિધ્યપૂર્ણ અવાજો બનાવવા માટે તાલીમ આપી શકો છો અથવા ચોક્કસ ભાષાઓ માટે કાર્યક્ષમતા સુધારી શકો છો.

ટોચના ઓપન-સોર્સ મોડેલો (કોકોરો, સ્ટાઇલટીટીએસ ૨, ચેટરબોક્સ) હવે ગુણવત્તાના બેન્ચમાર્કમાં ઇલેવનલેબ્સ અને ગુગલ ટીટીએસ જેવી વાણિજ્યિક સેવાઓ સાથે મેળ ખાય છે અથવા તેથી વધુ છે. વાણિજ્યિક સેવાઓનો મુખ્ય ફાયદો સંચાલિત માળખાગત સુવિધાઓ અને આધાર છે, ઓડિયો ગુણવત્તા નથી.

અમે તેમને પહેલાથી જ બાકાત કરી દીધા છે. XTTS/XTTS-v2 (Coqui નું CPML — બિન-વાણિજ્યિક), F5-TTS (CC-BY-NC — બિન-વાણિજ્યિક), અને Higgs-v2 (બોઝન લાઇસન્સ — પ્રતિબંધક) બધા દૂર કરવામાં આવ્યા હતા. TTS.ai પર દરેક મોડેલ વાણિજ્યિક-ઉપયોગ સુરક્ષિત ચકાસાયેલ છે.

હા. મોટાભાગના મોડેલો GitHub મારફતે સમુદાય પ્રદાનને સ્વીકારે છે. તમે બગ અહેવાલો, નવી ભાષાઓ માટે અવાજ રેકોર્ડિંગ, કોડ સુધારાઓ, અને દસ્તાવેજોને રજૂ કરી શકો છો. પ્રદાન માર્ગદર્શિકા અને સક્રિય મુદ્દાઓ માટે દરેક મોડેલના GitHub રિપોઝીટરીને ચકાસો.

GPU મેમરી વહેંચવા માટે માગણી પર મોડેલો લોડ કરો અને જ્યારે નિષ્ક્રિય હોય ત્યારે લોડ કરો. અમારું GPU સર્વર 4x Tesla P40 (96GB કુલ VRAM) પર 20+ મોડેલોને ગતિશીલ લોડિંગની મદદથી ચલાવે છે. સ્વયં-હોસ્ટિંગ માટે, એક જ 24GB GPU 3-5 મોડેલોને એકસાથે સેવા આપી શકે છે.

ઘણાં મોડેલો સત્તાવાર ડોકર ઇમેજો અથવા ડોકફાઇલો પૂરી પાડે છે. ઘણાં મોડેલો ચલાવવા માટે, તમે GPU પ્રવેશ માટે NVIDIA કન્ટેનર ટુલકિટ સાથે વૈવિધ્યપૂર્ણ ડોકર સુયોજન બનાવી શકો છો. અમારું API સર્વર આર્કિટેક્ચર સંદર્ભ અમલીકરણ તરીકે સેવા આપી શકે છે.

મોટાભાગના મોડેલોને Python 3.10-3.12 ની જરૂર છે. Coqui TTS (VITS) ને Python 3.11 ની ખાસ જરૂર છે. અમે મોટાભાગના મોડેલો માટે Python 3.12 ની ભલામણ કરીએ છીએ. ચોક્કસ આવૃત્તિ સુસંગતતા માટે દરેક મોડેલની requirements.txt ને ચકાસો.

હા. MIT અને Apache 2.0 લાઇસન્સ સ્પષ્ટપણે વ્યાવસાયિક ઉપયોગની પરવાનગી આપે છે. તમે SaaS ઉત્પાદનો, મોબાઇલ એપ્લિકેશનો, રમતોને અને સેવાઓને આ મોડેલોનો ઉપયોગ કરીને લાઇસન્સિંગ ફી, રજિસ્ટર, અથવા અધિકારની જરૂરિયાતો વગર બનાવી શકો છો (જોકે અધિકારની પ્રશંસા થાય છે).
5.0/5 (1)

અમે શું સુધારી શકીએ? તમારો પ્રતિભાવ અમને સમસ્યાઓ ઉકેલવામાં મદદ કરે છે.

આજે ઓપન સ્ત્રોત TTSનો પ્રયત્ન કરો

20+ ઓપન-સોર્સ મોડેલો, બધા વ્યાપારિક-લાઇસન્સ ધરાવતા. અમારી API અથવા સ્વયં-હોસ્ટનો ઉપયોગ કરો - પસંદગી તમારી છે.