મુક્ત AI લખાણને બોલવામાંName

20+ ઓપન-સોર્સ મોડેલ્સ, 107+ અવાજ, 32+ ભાષાઓ. ખાતું જરૂરી નથી.

1K+
બનાવનારાઓ
2K+
પેઢીઓ
20+
AI મોડેલો
107+
અવાજો
0/500 અક્ષરો મુક્ત
TTS.ai ની જેમ? તમારા મિત્રોને કહી દો!

વોઇસ AI માટે તમારે જે બધું જ જરૂરી છે

30+ સાધનો ઓપન-સોર્સ એઆઈ મોડેલો દ્વારા શક્તિશાળી

20+ AI અવાજ મોડેલો

એક પ્લેટફોર્મમાં ઓપન-સોર્સ TTS મોડેલોનું સૌથી વિસ્તૃત સંગ્રહ

KokoroKokoro Free

કોકોરો એ 82 મિલિયન પરિમાણ લખાણ-થી-ભાષા મોડેલ છે કે જે તેના વજન વર્ગની ઉપર સારી રીતે પંજો કરે છે. તેના નાનકડા કદ છતાં, તે નોંધપાત્ર રીતે કુદરતી અને અભિવ્યક્ત ભાષા ઉત્પન્ન કરે છે. કોકોરો અંગ્રેજી, જાપાની, ચીની, અને કોરિયન જેવી અનેક ભાષાઓને અભિવ્યક્ત ભાષાઓની વિવિધતા સાથે આધાર આપે છે. તે અવિશ્વસનીય રીતે ઝડપથી ચલાવે છે - GPU પર વાસ્તવિક સમય કરતાં લગભગ 100x ઝડપથી ઓડિયો ઉત્પન્ન કરે છે.

માટે શ્રેષ્ઠ: ન્યૂનતમ લેટેન્સી સાથે ઉચ્ચ ગુણવત્તા TTS, સ્ટ્રીમિંગ કાર્યક્રમો

મફત પ્રયત્ન કરો

PiperPiper Free

Piper એ Rhasspy દ્વારા વિકસિત થયેલ હળવું લખાણ-થી-ભાષા એન્જિન છે કે જે VITS અને larynx આર્કિટેક્ચર વાપરે છે. તે સંપૂર્ણપણે CPU પર ચાલે છે, એજ ઉપકરણો, ઘર સ્વચાલિત, અને ઓફલાઇન TTS જરૂરી કાર્યક્રમો માટે આદર્શ બનાવે છે. 30+ ભાષાઓમાં 100 થી વધુ અવાજો સાથે, Piper એ Raspberry Pi4પર પણ વાસ્તવિક સમયની ઝડપે કુદરતી-સંગીત વાક્ય પૂરુ પાડે છે.

માટે શ્રેષ્ઠ: ઝડપી પૂર્વદર્શનો, સુલભતા, અને જડિત કાર્યક્રમો

મફત પ્રયત્ન કરો

VITSVITS Free

VITS (એન્ડ-ટુ-એન્ડ લખાણ-થી-ભાષણ માટે વિવિધતા અનુમાન સાથે વિરોધાભાસી શીખવણી) એ સમકાલીન એન્ડ-ટુ-એન્ડ TTS પદ્ધતિ છે કે જે વર્તમાન બે-સ્તર મોડેલો કરતાં વધુ પ્રાકૃતિક ધ્વનિ ઉત્પન્ન કરે છે. તે વિવિધતા અનુમાનને સ્વીકારે છે જે સામાન્ય પ્રવાહ સાથે વધારાયેલ છે અને વિરોધાભાસી તાલીમ પ્રક્રિયા, પ્રાકૃતિકતામાં નોંધપાત્ર સુધારો મેળવે છે.

માટે શ્રેષ્ઠ: સામાન્ય-ઉદ્દેશ લખાણ-થી-વાક્ય કુદરતી પ્રોસોડી સાથેName

મફત પ્રયત્ન કરો

MeloTTSMeloTTS Free

MyShell.ai દ્દારા MeloTTS એ અંગ્રેજી (અમેરિકન, બ્રિટિશ, ભારતીય, ઓસ્ટ્રેલિયન), સ્પેનિશ, ફ્રેન્ચ, ચાઇનીઝ, જાપાનીઝ, અને કોરીયનને આધાર આપતી બહુભાષી TTS લાઇબ્રેરી છે. તે ખૂબ ઝડપી છે, માત્ર CPU પર નજીકના વાસ્તવિક સમયની ઝડપે લખાણને પ્રક્રિયા કરે છે. MeloTTS ઉત્પાદન વપરાશ માટે ડિઝાઇન થયેલ છે અને CPU અને GPU બંનેને આધાર આપે છે.

માટે શ્રેષ્ઠ: ઉત્પાદન કાર્યક્રમોને ઝડપી, બહુભાષી TTS ની જરૂર છે

મફત પ્રયત્ન કરો

BarkBark Standard

ટ્રાન્સફોર્મર આધારિત લખાણ-થી-ઓડિયો મોડેલ કે જે વાસ્તવિક ભાષા, સંગીત, અને ધ્વનિ અસરો પેદા કરે છે.

ડેવલોપર: Suno · લાઇસન્સ: MIT

પ્રયત્ન કરો

Bark SmallBark Small Standard

ઝડપી અંદાજ અને ઓછા મેમરી વપરાશ સાથે Bark ની હળવી આવૃત્તિ.

ડેવલોપર: Suno · લાઇસન્સ: MIT

પ્રયત્ન કરો

CosyVoice 2CosyVoice 2 Standard

અલીબાબાનું સ્કેલેબલ સ્ટ્રીમિંગ TTS માનવ-સમાનતા કુદરતીતા અને નજીક-શૂન્ય લેટેન્સી સાથે.

ડેવલોપર: Alibaba (Tongyi Lab) · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

Dia TTSDia TTS Standard

બહુ-સ્પીકર સંવાદ ઉત્પન્ન મોડેલ કે જે સ્પીકર વચ્ચે કુદરતી વાતચીત બનાવે છે.

ડેવલોપર: Nari Labs · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

Parler TTSParler TTS Standard

તમે પ્રાકૃતિક ભાષામાં ઇચ્છતા અવાજનું વર્ણન કરો અને Parler બંધબેસતા ભાષણને ઉત્પન્ન કરે છે.

ડેવલોપર: Hugging Face · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

GLM-TTSGLM-TTS Standard

ઓપન-સોર્સ TTS મોડેલો વચ્ચે નીચલો અક્ષર ભૂલ દર મેળવે છે.

ડેવલોપર: Zhipu AI · લાઇસન્સ: GLM-4 License

પ્રયત્ન કરો

IndexTTS-2IndexTTS-2 Standard

ઝીરો-શોટ TTS, ફાઇન-ગ્રેનેડ ઇમોશન નિયંત્રણ અને ઉચ્ચ વ્યક્તીત્વ સાથે.

ડેવલોપર: Index Team · લાઇસન્સ: Bilibili Model License

પ્રયત્ન કરો

Spark TTSSpark TTS Standard

અવાજ ક્લોનિંગ TTS નિયંત્રિત ભાવના અને પ્રોમ્પ્ટ્સ મારફતે બોલવાની શૈલી સાથે.

ડેવલોપર: SparkAudio · લાઇસન્સ: CC BY-NC-SA 4.0

પ્રયત્ન કરો

GPT-SoVITSGPT-SoVITS Standard

થોડા-શૉટ અવાજ ક્લોનિંગ TTS કે જે ઓડિયોનાં માત્ર ૫ સેકન્ડોમાંથી કોઈપણ અવાજને નકલ કરે છે.

ડેવલોપર: RVC-Boss · લાઇસન્સ: MIT

પ્રયત્ન કરો

OrpheusOrpheus Standard

100,000 કલાકની ભાષણ માહિતી પર તાલીમ આપવામાં આવેલ માનવ સ્તરીય લાગણીશીલ ટીટીએસ મોડેલ.

ડેવલોપર: Canopy Labs · લાઇસન્સ: Llama 3.2 Community

પ્રયત્ન કરો

Qwen3 TTSQwen3 TTS Standard

અલીબાબાનું બહુભાષી TTS અવાજ ક્લોનીંગ સાથે, પૂર્વસુયોજિત અવાજો, અને લખાણમાંથી અવાજ ડિઝાઇન સાથે.

ડેવલોપર: Alibaba (Qwen) · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

ChatterboxChatterbox Premium

Resemble AI માંથી લાગણી નિયંત્રણ સાથે state-of-the-art zero-shot અવાજ ક્લોનિંગ.

ગુણવત્તા:

પ્રયત્ન કરો

Tortoise TTSTortoise TTS Premium

બહુ- અવાજ લખાણ-થી-ભાષા ગુણવત્તા પર કેન્દ્રિત છે, આત્મ-પલટાતા આર્કિટેક્ચર સાથે.

ગુણવત્તા:

પ્રયત્ન કરો

StyleTTS 2StyleTTS 2 Premium

શૈલી પ્રસારણ અને વિરોધી તાલીમ મારફતે માનવ-સ્તરનું લખાણ-થી-ભાષણ.

ગુણવત્તા:

પ્રયત્ન કરો

OpenVoiceOpenVoice Premium

શૈલી, લાગણી, અને ઉચ્ચાર પર ઘન નિયંત્રણ સાથે તાત્કાલિક અવાજ ક્લોનિંગ.

ગુણવત્તા:

પ્રયત્ન કરો

Sesame CSMSesame CSM Premium

સંવાદાત્મક ભાષાનું મોડેલ, જે યોગ્ય સમય અને લાગણી સાથે કુદરતી સંવાદ પેદા કરે છે.

ગુણવત્તા:

પ્રયત્ન કરો

CosyVoice 2CosyVoice 2

અલીબાબાનું સ્કેલેબલ સ્ટ્રીમિંગ TTS માનવ-સમાનતા કુદરતીતા અને નજીક-શૂન્ય લેટેન્સી સાથે.

ભાષાઓ: en, zh, ja, ko, fr, de, it, es

અવાજ ક્લોન કરો

GLM-TTSGLM-TTS

ઓપન-સોર્સ TTS મોડેલો વચ્ચે નીચલો અક્ષર ભૂલ દર મેળવે છે.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

IndexTTS-2IndexTTS-2

ઝીરો-શોટ TTS, ફાઇન-ગ્રેનેડ ઇમોશન નિયંત્રણ અને ઉચ્ચ વ્યક્તીત્વ સાથે.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

Spark TTSSpark TTS

અવાજ ક્લોનિંગ TTS નિયંત્રિત ભાવના અને પ્રોમ્પ્ટ્સ મારફતે બોલવાની શૈલી સાથે.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

GPT-SoVITSGPT-SoVITS

થોડા-શૉટ અવાજ ક્લોનિંગ TTS કે જે ઓડિયોનાં માત્ર ૫ સેકન્ડોમાંથી કોઈપણ અવાજને નકલ કરે છે.

ભાષાઓ: en, zh, ja, ko

અવાજ ક્લોન કરો

ChatterboxChatterbox

Resemble AI માંથી લાગણી નિયંત્રણ સાથે state-of-the-art zero-shot અવાજ ક્લોનિંગ.

ભાષાઓ: en

અવાજ ક્લોન કરો

Tortoise TTSTortoise TTS

બહુ- અવાજ લખાણ-થી-ભાષા ગુણવત્તા પર કેન્દ્રિત છે, આત્મ-પલટાતા આર્કિટેક્ચર સાથે.

ભાષાઓ: en

અવાજ ક્લોન કરો

OpenVoiceOpenVoice

શૈલી, લાગણી, અને ઉચ્ચાર પર ઘન નિયંત્રણ સાથે તાત્કાલિક અવાજ ક્લોનિંગ.

ભાષાઓ: en, zh, ja, ko, fr, de, es, it

અવાજ ક્લોન કરો

Qwen3 TTSQwen3 TTS

અલીબાબાનું બહુભાષી TTS અવાજ ક્લોનીંગ સાથે, પૂર્વસુયોજિત અવાજો, અને લખાણમાંથી અવાજ ડિઝાઇન સાથે.

ભાષાઓ: en, zh, ja, ko, de, fr, ru, pt, es, it

અવાજ ક્લોન કરો

ડેવલોપર-પહેલા API

OpenAI-સુસંગત REST API. એક અંતબિંદુ, ૨૨+ મોડેલો. વાસ્તવિક સમય કાર્યક્રમો માટે સ્ટ્રીમિંગ આધાર.

  • OpenAI-સુસંગત બંધારણ
  • રિયલ-ટાઇમ કાર્યક્રમો માટે સ્ટ્રીમિંગ TTS
  • મોટા કાર્યો માટે બેચ પ્રક્રિયા
  • વેબહોક નોંધણીઓ
API દસ્તાવેજો જુઓ
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

સરળ, પારદર્શક કિંમત

મુક્ત શરૂઆત. તમે વધો તેમ માપન કરો.

મુક્ત

$0

૧૫ ક્રેડિટ્સ

  • Kokoro, Piper, VITS, MeloTTS
  • 500 અક્ષરોની મર્યાદા
  • ૩ જન/કલાક (ખાતું નથી)
મફત નોંધણી કરો

શરુઆત કરનાર

$9/મહિનો

500 ક્રેડિટ્સ/મહિનો

  • બધા ૨૨+ મોડેલો
  • ૧૦૦,૦૦૦ અક્ષરો પ્રતિ પેઢી
  • અવાજ ક્લોનિંગ
શરૂ કરો
સૌથી લોકપ્રિય

પ્રો

$29/મહિનો

૨,૦૦૦ ક્રેડિટ્સ/મહિનો

  • શરૂઆતમાં બધું
  • API પ્રવેશ
  • પ્રાથમિકતા પ્રક્રિયા
પ્રોફેશનલ મેળવો

વ્યવસાય

$99/મહિનો

10,000 ક્રેડિટ્સ/મહિનો

  • Pro માં બધું
  • બલ્ક API
  • પ્રાથમિકતા કતાર
વ્યવસાય મેળવો

અક્ષર પેક્સને સમાવતા બધા યોજનાઓ જુઓ →

વારંવાર પૂછાતા પ્રશ્નો

TTS.ai સૌથી વિસ્તૃત એઆઈ અવાજ પ્લેટફોર્મ છે, જે 22+ લખાણ-થી-ભાષણ મોડેલો, ભાષણ ક્લોનીંગ, ભાષણ-થી-લેખન અને ઓડિયો સાધનો પ્રદાન કરે છે.

હા! TTS.ai Kokoro, Piper, VITS, અને MeloTTS મોડેલો સાથે મફત લખાણ-થી-વાક્ય પ્રદાન કરે છે. ખાતું જરૂરી નથી. 15,000 મુક્ત અક્ષરો મેળવવા માટે નોંધણી કરો અને બધા મોડેલોને વાપરો. ચૂકવણી યોજનાઓ $9/મહિનાથી શરૂ થાય છે.

ઝડપ માટે, કોકોરો અથવા પાયપર વાપરો. ગુણવત્તા માટે, કોસીવોઇસ ૨ અથવા સ્ટાઇલTTS ૨નો પ્રયત્ન કરો. અવાજ ક્લોનિંગ માટે, ચેટબોક્સ અથવા GPT-SoVITS વાપરો. સંવાદ માટે, ડાયા TTS વાપરો. સરખામણી કરવા માટે એક જ લખાણ પર ઘણાં મોડેલોનો પ્રયત્ન કરો.

હા. TTS, STT, અવાજ ક્લોનિંગ, અને ઓડિયો સાધનો માટે OpenAI-સુસંગત REST API. Pro ($29/mo) અને Enterprise ($99/mo) યોજનાઓ પર ઉપલબ્ધ. tts.ai/api/ પર દસ્તાવેજો જુઓ.

અવાજની ગુણવત્તા મોડેલ અનુસાર બદલાય છે. CosyVoice ૨, StyleTTS ૨, અને Chatterbox જેવા પ્રીમિયમ મોડેલો કુદરતી અવાજો અને લાગણીઓ સાથે નજીક-માનવ ગુણવત્તાવાળા ભાષણને ઉત્પન્ન કરે છે. Kokoro જેવા મુક્ત મોડેલો મોટાભાગના ઉપયોગના કિસ્સાઓ માટે ઉત્તમ ગુણવત્તા પ્રદાન કરે છે.

TTS.ai તેની મોડેલ લાઇબ્રેરીમાં 30+ ભાષાઓને આધાર આપે છે. અંગ્રેજી પાસે સૌથી વિશાળ મોડેલ આધાર છે, પરંતુ CosyVoice2જેવા મોડેલો ચાઇનીઝ, જાપાનીઝ અને કોરીયનને આવરી લે છે; GPT-SoVITS ચાઇનીઝ, જાપાનીઝ, કોરીયન અને અંગ્રેજી સંભાળે છે; અને MeloTTS અંગ્રેજી, સ્પેનિશ, ફ્રેન્ચ, ચાઇનીઝ, જાપાનીઝ અને કોરીયનને આધાર આપે છે.

હા. બધી પ્રક્રિયા અમારા સમર્પિત GPU સર્વર પર થાય છે. અમે તમારા લખાણ ઇનપુટને સંગ્રહતા નથી અથવા પ્રદાન કર્યા પછી ઉત્પન્ન થયેલ ઓડિયો. ક્લોનિંગ માટે અપલોડ થયેલ અવાજ નમૂનાઓ ફક્ત વર્તમાન સત્ર માટે વપરાય છે અને સંગ્રહાયેલ નથી. અમે તમારી માહિતીને ત્રીજી પાર્ટીઓ સાથે કદી વહેંચતા નથી અથવા તેને મોડેલોને તાલીમ આપવા માટે વાપરી શકતા નથી.

હા. TTS.ai પર ઉત્પન્ન થયેલ બધા ઓડિયો તમારા વ્યવસાયિક ઉપયોગ માટે છે, YouTube વિડિઓઝ, પોડકાસ્ટ્સ, ઓડિયોબુક્સ, એપ્લિકેશનો, જાહેરાતો, અને ઉત્પાદનો માટે સમાવેશ થાય છે. અમારા મોડેલો પરવાનગી આપતી લાઇસન્સ (MIT, Apache 2.0) ની નીચે ઓપન સ્રોત છે. કોઈ રજિસ્ટર અથવા પ્રમાણપત્રની જરૂર નથી.

TTS.ai મહત્તમ ગુણવત્તા માટે મૂળભૂત રીતે WAV બંધારણમાં ઓડિયો પેદા કરે છે. તમે MP3, FLAC, OGG, અથવા M4A માં અમારું મફત ઓડિયો રૂપાંતરણ સાધન વાપરીને રૂપાંતરિત કરી શકો છો. API એ સૂચનામાં સીધા જ તમારા પસંદગીના આઉટપુટ બંધારણને સ્પષ્ટ કરવાનો આધાર આપે છે.

તમે ક્લોન કરવા માંગતા હોવ તે અવાજના ટૂંકા ઓડિયો નમૂનાને અપલોડ કરો (5 સેકન્ડો જેટલું નાનું), પછી તે અવાજમાં બોલવાનું ઉત્પન્ન કરવા માટે કોઈપણ લખાણને લખો. Chatterbox, GPT-SoVITS, અને CosyVoice2જેવા મોડેલો અવાજ ક્લોનીંગને આધાર આપે છે. ક્લોન થયેલ અવાજ ટોન, ઉચ્ચાર, અને બોલવાની શૈલીને ઝડપે છે.

મુક્ત મોડેલો (Kokoro, Piper, VITS, MeloTTS) માટે ખાતાની જરૂર નથી અને શૂન્ય અક્ષરોનો ખર્ચ થાય છે. પ્રમાણભૂત મોડેલો (2,000 અક્ષરો/1K ઇનપુટ) માં Bark, CosyVoice 2, F5-TTS, અને Dia સમાવે છે. પ્રીમિયમ મોડેલો (4,000 અક્ષરો/1K ઇનપુટ) માં OpenVoice, Chatterbox, StyleTTS 2, અને Tortoise સમાવે છે. ચૂકવેલ મોડેલો સામાન્ય રીતે ઉચ્ચ ગુણવત્તા, વધુ અવાજો, અને વૉઇસ ક્લોનીંગ જેવી વધારાની લાક્ષણિકતાઓ પ્રદાન કરે છે.

હા. API ભાષણમાં લખાણના મોટા વોલ્યુમોને રૂપાંતરિત કરવા માટે બેચ પ્રક્રિયાને આધાર આપે છે. ઘણી બધી વિનંતીઓને રજૂ કરો અને કામ UUIDs ની મદદથી અસુમેળ રીતે પરિણામોને પુનઃપ્રાપ્ત કરો. એન્ટરપ્રાઇઝ યોજનાઓ ($99/mo) ઝડપી બેચ પ્રક્રિયા માટે પ્રાથમિકતા કતાર પ્રવેશને સમાવે છે. ઓડિયોબુક ઉત્પાદન, કોર્સ સમાવિષ્ટો, અને મોટા પાયે વૉઇસોવર પ્રોજેક્ટ્સ માટે આદર્શ.
4.0/5 (8)

AI Voice વાપરવાનું આજે શરૂ કરો

TTS.ai ની મદદથી બનાવનારાઓ, વિકાસકર્તાઓ અને વ્યવસાયો સાથે જોડાઓ