મુક્ત AI લખાણને બોલવામાંName
20+ ઓપન-સોર્સ મોડેલ્સ, 107+ અવાજ, 32+ ભાષાઓ. ખાતું જરૂરી નથી.
વોઇસ AI માટે તમારે જે બધું જ જરૂરી છે
30+ સાધનો ઓપન-સોર્સ એઆઈ મોડેલો દ્વારા શક્તિશાળી
20+ AI અવાજ મોડેલો
એક પ્લેટફોર્મમાં ઓપન-સોર્સ TTS મોડેલોનું સૌથી વિસ્તૃત સંગ્રહ
Kokoro Free
કોકોરો એ 82 મિલિયન પરિમાણ લખાણ-થી-ભાષા મોડેલ છે કે જે તેના વજન વર્ગની ઉપર સારી રીતે પંજો કરે છે. તેના નાનકડા કદ છતાં, તે નોંધપાત્ર રીતે કુદરતી અને અભિવ્યક્ત ભાષા ઉત્પન્ન કરે છે. કોકોરો અંગ્રેજી, જાપાની, ચીની, અને કોરિયન જેવી અનેક ભાષાઓને અભિવ્યક્ત ભાષાઓની વિવિધતા સાથે આધાર આપે છે. તે અવિશ્વસનીય રીતે ઝડપથી ચલાવે છે - GPU પર વાસ્તવિક સમય કરતાં લગભગ 100x ઝડપથી ઓડિયો ઉત્પન્ન કરે છે.
માટે શ્રેષ્ઠ: ન્યૂનતમ લેટેન્સી સાથે ઉચ્ચ ગુણવત્તા TTS, સ્ટ્રીમિંગ કાર્યક્રમો
મફત પ્રયત્ન કરો
Piper Free
Piper એ Rhasspy દ્વારા વિકસિત થયેલ હળવું લખાણ-થી-ભાષા એન્જિન છે કે જે VITS અને larynx આર્કિટેક્ચર વાપરે છે. તે સંપૂર્ણપણે CPU પર ચાલે છે, એજ ઉપકરણો, ઘર સ્વચાલિત, અને ઓફલાઇન TTS જરૂરી કાર્યક્રમો માટે આદર્શ બનાવે છે. 30+ ભાષાઓમાં 100 થી વધુ અવાજો સાથે, Piper એ Raspberry Pi4પર પણ વાસ્તવિક સમયની ઝડપે કુદરતી-સંગીત વાક્ય પૂરુ પાડે છે.
માટે શ્રેષ્ઠ: ઝડપી પૂર્વદર્શનો, સુલભતા, અને જડિત કાર્યક્રમો
મફત પ્રયત્ન કરો
VITS Free
VITS (એન્ડ-ટુ-એન્ડ લખાણ-થી-ભાષણ માટે વિવિધતા અનુમાન સાથે વિરોધાભાસી શીખવણી) એ સમકાલીન એન્ડ-ટુ-એન્ડ TTS પદ્ધતિ છે કે જે વર્તમાન બે-સ્તર મોડેલો કરતાં વધુ પ્રાકૃતિક ધ્વનિ ઉત્પન્ન કરે છે. તે વિવિધતા અનુમાનને સ્વીકારે છે જે સામાન્ય પ્રવાહ સાથે વધારાયેલ છે અને વિરોધાભાસી તાલીમ પ્રક્રિયા, પ્રાકૃતિકતામાં નોંધપાત્ર સુધારો મેળવે છે.
માટે શ્રેષ્ઠ: સામાન્ય-ઉદ્દેશ લખાણ-થી-વાક્ય કુદરતી પ્રોસોડી સાથેName
મફત પ્રયત્ન કરો
MeloTTS Free
MyShell.ai દ્દારા MeloTTS એ અંગ્રેજી (અમેરિકન, બ્રિટિશ, ભારતીય, ઓસ્ટ્રેલિયન), સ્પેનિશ, ફ્રેન્ચ, ચાઇનીઝ, જાપાનીઝ, અને કોરીયનને આધાર આપતી બહુભાષી TTS લાઇબ્રેરી છે. તે ખૂબ ઝડપી છે, માત્ર CPU પર નજીકના વાસ્તવિક સમયની ઝડપે લખાણને પ્રક્રિયા કરે છે. MeloTTS ઉત્પાદન વપરાશ માટે ડિઝાઇન થયેલ છે અને CPU અને GPU બંનેને આધાર આપે છે.
માટે શ્રેષ્ઠ: ઉત્પાદન કાર્યક્રમોને ઝડપી, બહુભાષી TTS ની જરૂર છે
મફત પ્રયત્ન કરો
Bark Standard
ટ્રાન્સફોર્મર આધારિત લખાણ-થી-ઓડિયો મોડેલ કે જે વાસ્તવિક ભાષા, સંગીત, અને ધ્વનિ અસરો પેદા કરે છે.
ડેવલોપર: Suno · લાઇસન્સ: MIT
પ્રયત્ન કરો
Bark Small Standard
ઝડપી અંદાજ અને ઓછા મેમરી વપરાશ સાથે Bark ની હળવી આવૃત્તિ.
ડેવલોપર: Suno · લાઇસન્સ: MIT
પ્રયત્ન કરો
CosyVoice 2 Standard
અલીબાબાનું સ્કેલેબલ સ્ટ્રીમિંગ TTS માનવ-સમાનતા કુદરતીતા અને નજીક-શૂન્ય લેટેન્સી સાથે.
ડેવલોપર: Alibaba (Tongyi Lab) · લાઇસન્સ: Apache 2.0
પ્રયત્ન કરો
Dia TTS Standard
બહુ-સ્પીકર સંવાદ ઉત્પન્ન મોડેલ કે જે સ્પીકર વચ્ચે કુદરતી વાતચીત બનાવે છે.
ડેવલોપર: Nari Labs · લાઇસન્સ: Apache 2.0
પ્રયત્ન કરો
Parler TTS Standard
તમે પ્રાકૃતિક ભાષામાં ઇચ્છતા અવાજનું વર્ણન કરો અને Parler બંધબેસતા ભાષણને ઉત્પન્ન કરે છે.
ડેવલોપર: Hugging Face · લાઇસન્સ: Apache 2.0
પ્રયત્ન કરો
GLM-TTS Standard
ઓપન-સોર્સ TTS મોડેલો વચ્ચે નીચલો અક્ષર ભૂલ દર મેળવે છે.
ડેવલોપર: Zhipu AI · લાઇસન્સ: GLM-4 License
પ્રયત્ન કરો
IndexTTS-2 Standard
ઝીરો-શોટ TTS, ફાઇન-ગ્રેનેડ ઇમોશન નિયંત્રણ અને ઉચ્ચ વ્યક્તીત્વ સાથે.
ડેવલોપર: Index Team · લાઇસન્સ: Bilibili Model License
પ્રયત્ન કરો
Spark TTS Standard
અવાજ ક્લોનિંગ TTS નિયંત્રિત ભાવના અને પ્રોમ્પ્ટ્સ મારફતે બોલવાની શૈલી સાથે.
ડેવલોપર: SparkAudio · લાઇસન્સ: CC BY-NC-SA 4.0
પ્રયત્ન કરો
GPT-SoVITS Standard
થોડા-શૉટ અવાજ ક્લોનિંગ TTS કે જે ઓડિયોનાં માત્ર ૫ સેકન્ડોમાંથી કોઈપણ અવાજને નકલ કરે છે.
ડેવલોપર: RVC-Boss · લાઇસન્સ: MIT
પ્રયત્ન કરો
Orpheus Standard
100,000 કલાકની ભાષણ માહિતી પર તાલીમ આપવામાં આવેલ માનવ સ્તરીય લાગણીશીલ ટીટીએસ મોડેલ.
ડેવલોપર: Canopy Labs · લાઇસન્સ: Llama 3.2 Community
પ્રયત્ન કરો
Qwen3 TTS Standard
અલીબાબાનું બહુભાષી TTS અવાજ ક્લોનીંગ સાથે, પૂર્વસુયોજિત અવાજો, અને લખાણમાંથી અવાજ ડિઝાઇન સાથે.
ડેવલોપર: Alibaba (Qwen) · લાઇસન્સ: Apache 2.0
પ્રયત્ન કરો
CosyVoice 2
અલીબાબાનું સ્કેલેબલ સ્ટ્રીમિંગ TTS માનવ-સમાનતા કુદરતીતા અને નજીક-શૂન્ય લેટેન્સી સાથે.
ભાષાઓ: en, zh, ja, ko, fr, de, it, es
અવાજ ક્લોન કરો
IndexTTS-2
ઝીરો-શોટ TTS, ફાઇન-ગ્રેનેડ ઇમોશન નિયંત્રણ અને ઉચ્ચ વ્યક્તીત્વ સાથે.
ભાષાઓ: en, zh
અવાજ ક્લોન કરો
Spark TTS
અવાજ ક્લોનિંગ TTS નિયંત્રિત ભાવના અને પ્રોમ્પ્ટ્સ મારફતે બોલવાની શૈલી સાથે.
ભાષાઓ: en, zh
અવાજ ક્લોન કરો
GPT-SoVITS
થોડા-શૉટ અવાજ ક્લોનિંગ TTS કે જે ઓડિયોનાં માત્ર ૫ સેકન્ડોમાંથી કોઈપણ અવાજને નકલ કરે છે.
ભાષાઓ: en, zh, ja, ko
અવાજ ક્લોન કરો
Chatterbox
Resemble AI માંથી લાગણી નિયંત્રણ સાથે state-of-the-art zero-shot અવાજ ક્લોનિંગ.
ભાષાઓ: en
અવાજ ક્લોન કરો
Tortoise TTS
બહુ- અવાજ લખાણ-થી-ભાષા ગુણવત્તા પર કેન્દ્રિત છે, આત્મ-પલટાતા આર્કિટેક્ચર સાથે.
ભાષાઓ: en
અવાજ ક્લોન કરો
OpenVoice
શૈલી, લાગણી, અને ઉચ્ચાર પર ઘન નિયંત્રણ સાથે તાત્કાલિક અવાજ ક્લોનિંગ.
ભાષાઓ: en, zh, ja, ko, fr, de, es, it
અવાજ ક્લોન કરો
Qwen3 TTS
અલીબાબાનું બહુભાષી TTS અવાજ ક્લોનીંગ સાથે, પૂર્વસુયોજિત અવાજો, અને લખાણમાંથી અવાજ ડિઝાઇન સાથે.
ભાષાઓ: en, zh, ja, ko, de, fr, ru, pt, es, it
અવાજ ક્લોન કરોડેવલોપર-પહેલા API
OpenAI-સુસંગત REST API. એક અંતબિંદુ, ૨૨+ મોડેલો. વાસ્તવિક સમય કાર્યક્રમો માટે સ્ટ્રીમિંગ આધાર.
- OpenAI-સુસંગત બંધારણ
- રિયલ-ટાઇમ કાર્યક્રમો માટે સ્ટ્રીમિંગ TTS
- મોટા કાર્યો માટે બેચ પ્રક્રિયા
- વેબહોક નોંધણીઓ
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
સરળ, પારદર્શક કિંમત
મુક્ત શરૂઆત. તમે વધો તેમ માપન કરો.
મુક્ત
૧૫ ક્રેડિટ્સ
- Kokoro, Piper, VITS, MeloTTS
- 500 અક્ષરોની મર્યાદા
- ૩ જન/કલાક (ખાતું નથી)
શરુઆત કરનાર
500 ક્રેડિટ્સ/મહિનો
- બધા ૨૨+ મોડેલો
- ૧૦૦,૦૦૦ અક્ષરો પ્રતિ પેઢી
- અવાજ ક્લોનિંગ
પ્રો
૨,૦૦૦ ક્રેડિટ્સ/મહિનો
- શરૂઆતમાં બધું
- API પ્રવેશ
- પ્રાથમિકતા પ્રક્રિયા
વારંવાર પૂછાતા પ્રશ્નો
AI Voice વાપરવાનું આજે શરૂ કરો
TTS.ai ની મદદથી બનાવનારાઓ, વિકાસકર્તાઓ અને વ્યવસાયો સાથે જોડાઓ