મુક્ત AI લખાણને બોલવામાંName

33+ ઓપન-સોર્સ મોડેલ્સ, 273+ અવાજ, 33+ ભાષાઓ. ખાતું જરૂરી નથી.

18K+
બનાવનારાઓ
71K+
પેઢીઓ
33+
AI મોડેલો
273+
અવાજો
TTS.ai ને પ્રેમ કરો છો? તમારા મિત્રોને કહી દો!

વોઇસ AI માટે તમારે જે બધું જ જરૂરી છે

30+ સાધનો ઓપન-સોર્સ એઆઈ મોડેલો દ્વારા શક્તિશાળી

33+ AI અવાજ મોડેલો

એક પ્લેટફોર્મમાં ઓપન-સોર્સ TTS મોડેલોનું સૌથી વિસ્તૃત સંગ્રહ

KokoroKokoro મુક્ત

કોકોરો એ 82 મિલિયન પરિમાણ લખાણ-થી-ભાષા મોડેલ છે કે જે તેના વજન વર્ગની ઉપર સારી રીતે ઊભું રહે છે. તેના નાનકડા કદ છતાં, તે નોંધપાત્ર રીતે કુદરતી અને વ્યક્તીગત ભાષા ઉત્પન્ન કરે છે. કોકોરો અંગ્રેજી, જાપાની, ચીની, અને કોરિયન જેવી અનેક ભાષાઓને વિવિધ વ્યક્તીગત અવાજો સાથે આધાર આપે છે. તે અત્યંત ઝડપથી ચલાવે છે - GPU પર વાસ્તવિક સમય કરતાં લગભગ 100x ઝડપથી ઓડિયો ઉત્પન્ન કરે છે.

માટે શ્રેષ્ઠ: ન્યૂનતમ લેટસી સાથે ઉચ્ચ ગુણવત્તા TTS, સ્ટ્રીમિંગ કાર્યક્રમો

મફત પ્રયત્ન કરો

PiperPiper મુક્ત

Piper એ Rhasspy દ્વારા વિકસિત થયેલ હળવું લખાણ-થી-ભાષા એન્જિન છે કે જે VITS અને larynx આર્કિટેક્ચર વાપરે છે. તે સંપૂર્ણપણે CPU પર ચાલે છે, એજ ઉપકરણો, ઘર સ્વચાલિત, અને ઓફલાઇન TTS જરૂરી કાર્યક્રમો માટે આદર્શ બનાવે છે. 30+ ભાષાઓમાં 100 થી વધુ અવાજો સાથે, Piper એ Raspberry Pi4પર પણ વાસ્તવિક સમયની ઝડપે કુદરતી-સંગીત વાક્ય પૂરુ પાડે છે.

માટે શ્રેષ્ઠ: ઝડપી પૂર્વદર્શનો, સુલભતા, અને જડિત કાર્યક્રમો

મફત પ્રયત્ન કરો

VITSVITS મુક્ત

VITS (વિવિધતા અનુમાન સાથે અંત-થી-અંત લખાણ-થી-ભાષણ માટે વિરોધી શીખવણી) એ એક સમાન અંત-થી-અંત TTS પદ્ધતિ છે કે જે વર્તમાન બે-સ્તર મોડેલો કરતાં વધુ પ્રાકૃતિક રીતે સંભળાતું ઓડિયો પેદા કરે છે. તે સામાન્યીકરણ પ્રવાહ સાથે વધારાયેલ વિવિધતા અનુમાન અને વિરોધી તાલીમ પ્રક્રિયાને સ્વીકારે છે, પ્રાકૃતિકતામાં નોંધપાત્ર સુધારો મેળવે છે.

માટે શ્રેષ્ઠ: સામાન્ય હેતુનું લખાણ-થી-વાક્ય કુદરતી રૂપરેખાંકન સાથેName

મફત પ્રયત્ન કરો

MeloTTSMeloTTS મુક્ત

MyShell.ai દ્દારા MeloTTS એ બહુભાષી TTS લાઇબ્રેરી છે જે અંગ્રેજી (અમેરિકન, બ્રિટિશ, ભારતીય, ઓસ્ટ્રેલિયાઈ), સ્પેનિશ, ફ્રેન્ચ, ચાઇનીઝ, જાપાનીઝ, અને કોરીયનને આધાર આપે છે. તે ખૂબ ઝડપી છે, CPU પર માત્રા પર નજીકના વાસ્તવિક સમયની ઝડપે લખાણને પ્રક્રિયા કરે છે. MeloTTS ઉત્પાદન વપરાશ માટે ડિઝાઇન થયેલ છે અને CPU અને GPU બંનેને આધાર આપે છે.

માટે શ્રેષ્ઠ: ઉત્પાદન કાર્યક્રમોને ઝડપી, બહુભાષી TTS ની જરૂર છે

મફત પ્રયત્ન કરો

Kani TTS 2Kani TTS 2 મુક્ત

Kani-TTS-2 NineNineSix દ્દારા એક અત્યંત હળવું 400M પરિમાણ મોડેલ છે જે NVIDIA NanoCodec સાથે Liquid AI LFM2 બેકબોન પર બનાવેલ છે. તે માત્ર 3GB VRAM માં ચાલે છે અને A100 (RTF 0.2) પર ~2 સેકન્ડમાં ~10 સેકન્ડના ભાષણનું ઉત્પાદન કરે છે. વર્તમાન જાહેર રિલીઝ માત્ર અંગ્રેજી `kani-tts-2-en` ચકાસણીબિંદુને જ મોકલે છે અને અવાજ ક્લોનિંગ માટે જરૂરી સ્પીકર-અંદરભેગું કરનાર હોકને પ્રદર્શિત કરતું નથી — ક્લોનિંગ માટે Chatterbox / IndexTTS2 / F5-TTS વાપરો, અથવા Kokoro / MeloTTS અંગ્રેજી નહિં હોય તે માટે.

માટે શ્રેષ્ઠ: નીચુ-VRAM હાર્ડવેર પર ઝડપી અંગ્રેજી પેદાશ, ઝડપી પૂર્વદર્શનો

મફત પ્રયત્ન કરો

OuteTTSOuteTTS મુક્ત

OuteTTS લખાણ-થી-ભાષા ક્ષમતા સાથે મોટા ભાષા મોડેલોને વિસ્તૃત કરે છે જ્યારે મૂળભૂત આર્કિટેક્ચર સંગ્રહ કરે છે. તે llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, અને Transformers.js મારફતે બ્રાઉઝર ઇન્ફર્નેશન સહિત ઘણાં બેકએન્ડ્સને આધાર આપે છે. JSON તરીકે સંગ્રહાયેલ સ્પીકર રૂપરેખા મારફતે શૂન્ય-શૉટ અવાજ ક્લોનિંગ લાક્ષણિકતાઓ.

માટે શ્રેષ્ઠ: એજ ડિપ્લોયમેન્ટ, બ્રાઉઝર આધારિત TTS, ઓછા સ્ત્રોત પર્યાવરણો

મફત પ્રયત્ન કરો

Pocket TTSPocket TTS મુક્ત

પોકેટ TTS ક્યુટાઇ (મોશીના બનાવનારાઓ) દ્દારા સંકુચિત 100M પરિમાણ લખાણ-થી-ભાષણ મોડેલ છે કે જે તેના વજનથી વધારે સારી રીતે પંચ કરે છે. તે CPU પર અસરકારક રીતે ચલાવે છે, એક ઓડિયો નમૂનામાંથી શૂન્ય-શૉટ અવાજ ક્લોનિંગને આધાર આપે છે, અને કુદરતી-સંગીત વાક્ય ઉત્પન્ન કરે છે. નાનું મોડેલ માપ તેને આડી દિશામાં વિસ્તરણ અને ઓછા-સ્ત્રોત પર્યાવરણો માટે આદર્શ બનાવે છે.

માટે શ્રેષ્ઠ: હળવા વજનનું વિસ્તરણ, CPU-only પર્યાવરણો, ઝડપી અવાજ ક્લોનીંગ

મફત પ્રયત્ન કરો

Kitten TTSKitten TTS મુક્ત

KittenML દ્દારા Kitten TTS એ ONNX પર બનાવેલ અત્યંત હળવું લખાણ-થી-ભાષા મોડેલ છે. 15M થી 80M પરિમાણો (ડિસ્ક પર 25-80 MB) થી વિવિધતાઓ સાથે, તે GPU ની જરૂરિયાત વગર CPU પર ઉચ્ચ-ગુણવત્તાવાળા ભાષા સંયોજન પૂરા પાડે છે. 8 બિલ્ટ-ઇન ભાષાઓ, સુયોજિત ભાષા ઝડપ, અને સંખ્યાઓ, ચલણો, અને એકમો માટે બિલ્ટ-ઇન લખાણ પ્રીપ્રોસેસિંગ લાક્ષણિકતાઓ. એજ ડિપ્લોયમેન્ટ અને ઓછા-લેટન્સી કાર્યક્રમો માટે આદર્શ છે.

માટે શ્રેષ્ઠ: ઝડપી હળવા TTS, કિનારી વિસ્તરણ, ઓછા-લેટન્સી કાર્યક્રમો

મફત પ્રયત્ન કરો

Ming-Omni TTSMing-Omni TTS મુક્ત

inclusionAI દ્દારા Ming-omni-tts-0.5B એ પેચ-by-પેચ ફલો-મેચિંગ ઓડિયો ડિકોડર સાથે BailingMM ઘન બેકબોન પર બનાવેલ કોમ્પેક્ટ ઓમનિ-મોડલ સ્પીક મોડેલ છે. 44.1kHz આઉટપુટ (CD ગુણવત્તા નજીક) પૂરું પાડે છે, 3+ સેકન્ડ સંદર્ભમાંથી શૂન્ય-શૉટ અવાજ ક્લોનિંગને આધાર આપે છે, અને JSON સૂચનાઓ મારફતે બિલ્ટ-ઇન લાગણી / ભાષા / BGM નિયંત્રણને સમાવે છે. ચાઇનીઝ બેન્ચમાર્ક પર ઉત્તમ સ્થિરતા - 0.83% WER.

માટે શ્રેષ્ઠ: ઉચ્ચ-સત્યતા બહુભાષી વાર્તાલાપ, લાગણી-નિયંત્રિત અવાજ અભિનય, ચીની ઓડિયોબુક સમાવિષ્ટો

મફત પ્રયત્ન કરો

MOSS-TTS NanoMOSS-TTS Nano મુક્ત

MOSS-TTS-Nano-100M એ MOSS-TTS કુટુંબની OpenMOSS ની સંકુચિત 100M-પરિમાણીય વિવિધતા છે, વિલંબ-ટ્રાન્સફોર્મર આર્કિટેક્ચર વહેંચે છે. ~80x નાની વજન માટે 8B મોડેલની ટોચની ગુણવત્તા અને નાટ્યાત્મક રીતે નીચું પ્રતિ-અરજીઓ VRAM માટે વેપાર કરે છે, તેને મુક્ત-સ્તર અને ઉચ્ચ-થ્રુપુટ વિસ્તરણો માટે યોગ્ય બનાવે છે. સરખી 20-ભાષા પહોંચે છે.

માટે શ્રેષ્ઠ: મુક્ત-સ્તર TTS, ઉચ્ચ-વોલ્યુમ ઉત્પાદન, ઓછા-લેટન્સી ઇન્ટરેક્ટિવ વપરાશ

મફત પ્રયત્ન કરો

BarkBark મૂળભૂત

ટ્રાન્સફોર્મર આધારિત લખાણ-થી-ઓડિયો મોડેલ કે જે વાસ્તવિક ભાષા, સંગીત, અને ધ્વનિ અસરો પેદા કરે છે.

ડેવલોપર: Suno · લાઇસન્સ: MIT

પ્રયત્ન કરો

Bark SmallBark Small મૂળભૂત

ઝડપી અંદાજ અને ઓછા મેમરી વપરાશ સાથે Bark ની હળવી આવૃત્તિ.

ડેવલોપર: Suno · લાઇસન્સ: MIT

પ્રયત્ન કરો

CosyVoice 2CosyVoice 2 મૂળભૂત

અલીબાબાનું માપન કરી શકાય તેવું સ્ટ્રીમિંગ TTS માનવ-સમાનતાની કુદરતીતા અને નજીક-શૂન્ય લેટન્સી સાથે.

ડેવલોપર: Alibaba (Tongyi Lab) · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

Dia TTSDia TTS મૂળભૂત

બહુ-સ્પીકર સંવાદ ઉત્પન્ન મોડેલ કે જે સ્પીકર વચ્ચે કુદરતી વાતચીત બનાવે છે.

ડેવલોપર: Nari Labs · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

Parler TTSParler TTS મૂળભૂત

તમે પ્રાકૃતિક ભાષામાં ઇચ્છતા અવાજનું વર્ણન કરો અને Parler બંધબેસતા ભાષણને ઉત્પન્ન કરે છે.

ડેવલોપર: Hugging Face · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

IndexTTS-2IndexTTS-2 મૂળભૂત

ઝીરો-શોટ TTS, ફાઇન-ગ્રેનેડ ઇમોશન નિયંત્રણ અને ઉચ્ચ વ્યક્તીત્વ સાથે.

ડેવલોપર: Index Team · લાઇસન્સ: Bilibili Model License

પ્રયત્ન કરો

Spark TTSSpark TTS મૂળભૂત

અવાજ ક્લોનિંગ TTS નિયંત્રિત ભાવના અને પ્રોમ્પ્ટ્સ મારફતે બોલવાની શૈલી સાથે.

ડેવલોપર: SparkAudio · લાઇસન્સ: CC BY-NC-SA 4.0

પ્રયત્ન કરો

GPT-SoVITSGPT-SoVITS મૂળભૂત

થોડા-શૉટ અવાજ ક્લોનિંગ TTS કે જે ઓડિયોનાં માત્ર ૫ સેકન્ડોમાંથી કોઈપણ અવાજને નકલ કરે છે.

ડેવલોપર: RVC-Boss · લાઇસન્સ: MIT

પ્રયત્ન કરો

OrpheusOrpheus મૂળભૂત

100,000 કલાકની ભાષણ માહિતી પર તાલીમ આપવામાં આવેલ માનવ સ્તરીય લાગણીશીલ ટીટીએસ મોડેલ.

ડેવલોપર: Canopy Labs · લાઇસન્સ: Llama 3.2 Community

પ્રયત્ન કરો

Qwen3 TTSQwen3 TTS મૂળભૂત

અલીબાબાનું બહુભાષી TTS પૂર્વસુયોજિત અવાજો અને લખાણમાંથી અવાજ ડિઝાઇન સાથે.

ડેવલોપર: Alibaba (Qwen) · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

VieNeu-TTS-v2VieNeu-TTS-v2 મૂળભૂત

વિયેતનામીઝ + અંગ્રેજી કોડ-સ્વીકરણ TTS ૭ પૂર્વસુયોજિત અવાજો અને શૂન્ય-શૉટ અવાજ ક્લોનીંગ સાથે. CPU-only, GPU જરૂરી નથી.

ડેવલોપર: Phạm Nguyễn Ngọc Bảo · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

Chatterbox TurboChatterbox Turbo મૂળભૂત

ઝડપી ચેટબોક્સ સબ-200ms લેટેન્સી અને હસવા, છીંકવા અને વધુ માટે પેરાલિંગવિસ્ટિક ટેગો સાથે.

ડેવલોપર: Resemble AI · લાઇસન્સ: MIT

પ્રયત્ન કરો

VoxCPMVoxCPM મૂળભૂત

ટોકેનીઝર-મુક્ત TTS સંદર્ભ-જાગૃત ફકરો સુસંગતતા સાથે 44.1kHz ઓડિયો ઉત્પન્ન કરે છે.

ડેવલોપર: OpenBMB · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

VibeVoiceVibeVoice મૂળભૂત

પોડકાસ્ટ અને ઓડિયોબુક્સ જેવા લાંબા-આકારના બહુ-સ્પીકર સમાવિષ્ટો માટે Microsoft મોડેલ.

ડેવલોપર: Microsoft · લાઇસન્સ: MIT

પ્રયત્ન કરો

CosyVoice3CosyVoice3 મૂળભૂત

બાય-સ્ટ્રીમિંગ, ઇમોશન નિયંત્રણ, અને ઝીરો-શોટ અવાજ ક્લોનીંગ સાથે આગળની પેઢીની બહુભાષી TTS.

ડેવલોપર: Alibaba (FunAudioLLM) · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

NAMAA Saudi TTSNAMAA Saudi TTS મૂળભૂત

પહેલું ખોલો સાઉદી-અરબી TTS. ચેટબોક્સ-ગુણવત્તાવાળા અવાજ ક્લોનિંગ સાથે સ્થાનિક સાઉદી ભાષા.

ડેવલોપર: NAMAA Space · લાઇસન્સ: MIT

પ્રયત્ન કરો

Darwin TTSDarwin TTS મૂળભૂત

ક્રોસ- મોડલ Qwen3- TTS ફેરફાર FFN વજન સાથે Qwen3- 1.7B ભાષા મોડેલથી શાંત બહુભાષી ક્લોનિંગ માટે મિશ્રિત છે.

ડેવલોપર: FINAL-Bench · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

MOSS-TTSDMOSS-TTSD મૂળભૂત

બહુ-સ્પીકર સંવાદ ચાલુ રાખવાનું મોડેલ -5સ્પીકર અને 60 મિનિટ સુધીના સંકલિત ઓડિયો સાથે પોડકાસ્ટ-શૈલીના સંવાદોને ઉત્પન્ન કરો.

ડેવલોપર: OpenMOSS · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

ChatterboxChatterbox પ્રીમિયમ

Resemble AI માંથી લાગણી નિયંત્રણ સાથે state-of-the-art zero-shot અવાજ ક્લોનિંગ.

ગુણવત્તા:

પ્રયત્ન કરો

Tortoise TTSTortoise TTS પ્રીમિયમ

બહુ- અવાજ લખાણ-થી-ભાષા ગુણવત્તા પર કેન્દ્રિત છે, આત્મ-પલટાતા આર્કિટેક્ચર સાથે.

ગુણવત્તા:

પ્રયત્ન કરો

StyleTTS 2StyleTTS 2 પ્રીમિયમ

શૈલી પ્રસારણ અને વિરોધી તાલીમ મારફતે માનવ-સ્તરનું લખાણ-થી-ભાષણ.

ગુણવત્તા:

પ્રયત્ન કરો

OpenVoiceOpenVoice પ્રીમિયમ

શૈલી, લાગણી, અને ભાષા પર ઘન નિયંત્રણ સાથે તરત જ અવાજ ક્લોનિંગ.

ગુણવત્તા:

પ્રયત્ન કરો

Sesame CSMSesame CSM પ્રીમિયમ

સંવાદાત્મક ભાષાનું મોડેલ, જે યોગ્ય સમય અને લાગણી સાથે કુદરતી સંવાદ પેદા કરે છે.

ગુણવત્તા:

પ્રયત્ન કરો

CosyVoice 2CosyVoice 2

અલીબાબાનું માપન કરી શકાય તેવું સ્ટ્રીમિંગ TTS માનવ-સમાનતાની કુદરતીતા અને નજીક-શૂન્ય લેટન્સી સાથે.

ભાષાઓ: en, zh, ja, ko, fr, de, it, es

અવાજ ક્લોન કરો

IndexTTS-2IndexTTS-2

ઝીરો-શોટ TTS, ફાઇન-ગ્રેનેડ ઇમોશન નિયંત્રણ અને ઉચ્ચ વ્યક્તીત્વ સાથે.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

Spark TTSSpark TTS

અવાજ ક્લોનિંગ TTS નિયંત્રિત ભાવના અને પ્રોમ્પ્ટ્સ મારફતે બોલવાની શૈલી સાથે.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

GPT-SoVITSGPT-SoVITS

થોડા-શૉટ અવાજ ક્લોનિંગ TTS કે જે ઓડિયોનાં માત્ર ૫ સેકન્ડોમાંથી કોઈપણ અવાજને નકલ કરે છે.

ભાષાઓ: en, zh, ja, ko

અવાજ ક્લોન કરો

ChatterboxChatterbox

Resemble AI માંથી લાગણી નિયંત્રણ સાથે state-of-the-art zero-shot અવાજ ક્લોનિંગ.

ભાષાઓ: en

અવાજ ક્લોન કરો

Tortoise TTSTortoise TTS

બહુ- અવાજ લખાણ-થી-ભાષા ગુણવત્તા પર કેન્દ્રિત છે, આત્મ-પલટાતા આર્કિટેક્ચર સાથે.

ભાષાઓ: en

અવાજ ક્લોન કરો

OpenVoiceOpenVoice

શૈલી, લાગણી, અને ભાષા પર ઘન નિયંત્રણ સાથે તરત જ અવાજ ક્લોનિંગ.

ભાષાઓ: en, zh, ja, ko, fr, es

અવાજ ક્લોન કરો

VieNeu-TTS-v2VieNeu-TTS-v2

વિયેતનામીઝ + અંગ્રેજી કોડ-સ્વીકરણ TTS ૭ પૂર્વસુયોજિત અવાજો અને શૂન્ય-શૉટ અવાજ ક્લોનીંગ સાથે. CPU-only, GPU જરૂરી નથી.

ભાષાઓ: vi, en

અવાજ ક્લોન કરો

Chatterbox TurboChatterbox Turbo

ઝડપી ચેટબોક્સ સબ-200ms લેટેન્સી અને હસવા, છીંકવા અને વધુ માટે પેરાલિંગવિસ્ટિક ટેગો સાથે.

ભાષાઓ: en

અવાજ ક્લોન કરો

VoxCPMVoxCPM

ટોકેનીઝર-મુક્ત TTS સંદર્ભ-જાગૃત ફકરો સુસંગતતા સાથે 44.1kHz ઓડિયો ઉત્પન્ન કરે છે.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

OuteTTSOuteTTS

LLM-આધારિત TTS કે જે CPU, GPU, અથવા બ્રાઉઝર પર llama.cpp અને Transformers.js વડે ચલાવે છે.

ભાષાઓ: en

અવાજ ક્લોન કરો

Pocket TTSPocket TTS

એક નમૂનામાંથી અવાજ ક્લોનિંગ સાથે Kyutai દ્દારા હળવું 100M પરિમાણ મોડેલ.

ભાષાઓ: en, fr

અવાજ ક્લોન કરો

CosyVoice3CosyVoice3

બાય-સ્ટ્રીમિંગ, ઇમોશન નિયંત્રણ, અને ઝીરો-શોટ અવાજ ક્લોનીંગ સાથે આગળની પેઢીની બહુભાષી TTS.

ભાષાઓ: en, zh, ja, ko, de, es, fr, it, ru

અવાજ ક્લોન કરો

NAMAA Saudi TTSNAMAA Saudi TTS

પહેલું ખોલો સાઉદી-અરબી TTS. ચેટબોક્સ-ગુણવત્તાવાળા અવાજ ક્લોનિંગ સાથે સ્થાનિક સાઉદી ભાષા.

ભાષાઓ: ar

અવાજ ક્લોન કરો

Darwin TTSDarwin TTS

ક્રોસ- મોડલ Qwen3- TTS ફેરફાર FFN વજન સાથે Qwen3- 1.7B ભાષા મોડેલથી શાંત બહુભાષી ક્લોનિંગ માટે મિશ્રિત છે.

ભાષાઓ: en, ko, ja, zh

અવાજ ક્લોન કરો

MOSS-TTSDMOSS-TTSD

બહુ-સ્પીકર સંવાદ ચાલુ રાખવાનું મોડેલ -5સ્પીકર અને 60 મિનિટ સુધીના સંકલિત ઓડિયો સાથે પોડકાસ્ટ-શૈલીના સંવાદોને ઉત્પન્ન કરો.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

Ming-Omni TTSMing-Omni TTS

ઇન્ક્લૂઝનએઆઈમાંથી કોમ્પેક્ટ 0.5B ઓમનિ-મોડલ સ્પીકિંગ મોડેલ, હાઈ-ફાઇડેલિટી 44.1kHz આઉટપુટ અને ઝીરો-શોટ વૉઇસ ક્લોનીંગ સાથે.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

MOSS-TTS NanoMOSS-TTS Nano

ટાઇની 100M MOSS-TTS પ્રકાર - સમાન આર્કિટેક્ચર, 80x નાનું, મુક્ત-સ્તર લેટેન્સી.

ભાષાઓ: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

અવાજ ક્લોન કરો

ડેવલોપર-પહેલા API

OpenAI-સુસંગત REST API. એક અંતબિંદુ, ૨૨+ મોડેલો. વાસ્તવિક સમય કાર્યક્રમો માટે સ્ટ્રીમિંગ આધાર.

  • OpenAI-સુસંગત બંધારણ
  • રિયલ-ટાઇમ કાર્યક્રમો માટે સ્ટ્રીમિંગ TTS
  • મોટા કાર્યો માટે બેચ પ્રક્રિયા
  • વેબહોક નોંધણીઓ
API દસ્તાવેજો જુઓ
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

સરળ, પારદર્શક કિંમત

મુક્ત શરૂઆત. તમે વધો તેમ માપન કરો.

મુક્ત

$0

15,000 અક્ષરો + 5,000/દિવસ

  • કોકોરો સહિત ૭ મુક્ત મોડેલો
  • ૫,૦૦૦ અક્ષરો પ્રતિ પેઢી
  • API પ્રવેશ સમાવેલ છે
મફત નોંધણી કરો

શરુઆત કરનાર

$9/મહિનો

500 ક્રેડિટ્સ/મહિનો

  • બધા ૨૨+ મોડેલો
  • ૧૦૦,૦૦૦ અક્ષરો પ્રતિ પેઢી
  • અવાજ ક્લોનિંગ
શરૂ કરો
સૌથી લોકપ્રિય

પ્રો

$29/મહિનો

૨,૦૦૦ ક્રેડિટ્સ/મહિનો

  • શરૂઆતમાં બધું
  • API પ્રવેશ
  • પ્રાથમિકતા પ્રક્રિયા
પ્રોફેશનલ મેળવો

વ્યવસાય

$99/મહિનો

10,000 ક્રેડિટ્સ/મહિનો

  • Pro માં બધું
  • બલ્ક API
  • પ્રાથમિકતા કતાર
વ્યવસાય મેળવો

અક્ષર પેક્સને સમાવતા બધા યોજનાઓ જુઓ →

વારંવાર પૂછાતા પ્રશ્નો

TTS.ai એ સૌથી વિસ્તૃત એઆઈ અવાજ પ્લેટફોર્મ છે, જે 22+ લખાણ-થી-ભાષણ મોડેલો, ભાષા ક્લોનિંગ, ભાષા-થી-લેખન અને ઓડિયો સાધનો પ્રદાન કરે છે.

હા! TTS.ai Kokoro, Piper, VITS, અને MeloTTS મોડેલો સાથે મફત લખાણ-થી-વાક્ય પ્રદાન કરે છે. ખાતું જરૂરી નથી. 15,000 મુક્ત અક્ષરો મેળવવા માટે નોંધણી કરો અને બધા મોડેલોને વાપરો. ચૂકવણી યોજનાઓ $9/મહિનાથી શરૂ થાય છે.

ઝડપ માટે, કોકોરો અથવા પાયપર વાપરો. ગુણવત્તા માટે, કોસીવોઇસ ૨ અથવા સ્ટાઇલTTS ૨નો પ્રયત્ન કરો. અવાજ ક્લોનિંગ માટે, ચેટબોક્સ અથવા GPT-SoVITS વાપરો. સંવાદ માટે, ડાયા TTS વાપરો. સરખામણી કરવા માટે એક જ લખાણ પર ઘણાં મોડેલોનો પ્રયત્ન કરો.

હા. TTS, STT, અવાજ ક્લોનિંગ, અને ઓડિયો સાધનો માટે OpenAI-સુસંગત REST API. મફત સમાવેશ થાય છે, દર મર્યાદા સાથે કે જે સ્તર દ્વારા માપન કરે છે (મુક્ત: 10 req/min, લાઈટ: 20, સ્ટાર્ટર: 30, પ્રો: 60, બિઝનેસ: 300). tts.ai/api/ પર દસ્તાવેજો જુઓ.

અવાજની ગુણવત્તા મોડેલ અનુસાર બદલાય છે. CosyVoice ૨, StyleTTS ૨, અને Chatterbox જેવા પ્રીમિયમ મોડેલો કુદરતી અવાજો અને લાગણીઓ સાથે નજીક-માનવ ગુણવત્તાવાળા ભાષણને ઉત્પન્ન કરે છે. Kokoro જેવા મુક્ત મોડેલો મોટાભાગના ઉપયોગના કિસ્સાઓ માટે ઉત્તમ ગુણવત્તા પ્રદાન કરે છે.

TTS.ai તેની મોડેલ લાઇબ્રેરીમાં 30+ ભાષાઓને આધાર આપે છે. અંગ્રેજી પાસે સૌથી વિશાળ મોડેલ આધાર છે, પરંતુ CosyVoice2જેવા મોડેલો ચાઇનીઝ, જાપાનીઝ અને કોરીયનને આવરી લે છે; GPT-SoVITS ચાઇનીઝ, જાપાનીઝ, કોરીયન અને અંગ્રેજી સંભાળે છે; અને MeloTTS અંગ્રેજી, સ્પેનિશ, ફ્રેન્ચ, ચાઇનીઝ, જાપાનીઝ અને કોરીયનને આધાર આપે છે.

હા. બધી પ્રક્રિયા અમારા સમર્પિત GPU સર્વર પર થાય છે. અમે તમારા લખાણ ઇનપુટને સંગ્રહતા નથી અથવા પ્રદાન કર્યા પછી ઉત્પન્ન થયેલ ઓડિયો. ક્લોનિંગ માટે અપલોડ થયેલ અવાજ નમૂનાઓ ફક્ત વર્તમાન સત્ર માટે વપરાય છે અને સંગ્રહાયેલ નથી. અમે તમારી માહિતીને ત્રીજી પાર્ટીઓ સાથે કદી વહેંચતા નથી અથવા તેને મોડેલોને તાલીમ આપવા માટે વાપરી શકતા નથી.

હા. TTS.ai પર ઉત્પન્ન થયેલ બધા ઓડિયો તમારા વ્યવસાયિક ઉપયોગ માટે છે, YouTube વિડિઓઝ, પોડકાસ્ટ્સ, ઓડિયોબુક્સ, એપ્લિકેશનો, જાહેરાતો, અને ઉત્પાદનો માટે સમાવેશ થાય છે. અમારા મોડેલો પરવાનગી આપતી લાઇસન્સ (MIT, Apache 2.0) ની નીચે ઓપન સ્રોત છે. કોઈ રજિસ્ટર અથવા પ્રમાણપત્રની જરૂર નથી.

TTS.ai મહત્તમ ગુણવત્તા માટે મૂળભૂત રીતે WAV બંધારણમાં ઓડિયો પેદા કરે છે. તમે MP3, FLAC, OGG, અથવા M4A માં અમારા મફત ઓડિયો રૂપાંતર સાધનને વાપરીને રૂપાંતરિત કરી શકો છો. API એ સૂચનામાં સીધા જ તમારા પસંદગીના આઉટપુટ બંધારણને સ્પષ્ટ કરવાનો આધાર આપે છે.

તમે ક્લોન કરવા માંગતા હોવ તે અવાજના ટૂંકા ઓડિયો નમૂનાને અપલોડ કરો (5 સેકન્ડો જેટલું નાનું), પછી તે અવાજમાં બોલવાનું ઉત્પન્ન કરવા માટે કોઈપણ લખાણને લખો. Chatterbox, GPT-SoVITS, અને CosyVoice2જેવા મોડેલો અવાજ ક્લોનીંગને આધાર આપે છે. ક્લોન થયેલ અવાજ ટોન, ઉચ્ચાર, અને બોલવાની શૈલીને ઝડપે છે.

મુક્ત મોડેલો (Kokoro, Piper, VITS, MeloTTS) માટે ખાતાની જરૂર નથી અને શૂન્ય અક્ષરોનો ખર્ચ થાય છે. પ્રમાણભૂત મોડેલો (2,000 અક્ષરો/1K ઇનપુટ) માં Bark, CosyVoice 2, F5-TTS, અને Dia સમાવે છે. પ્રીમિયમ મોડેલો (4,000 અક્ષરો/1K ઇનપુટ) માં OpenVoice, Chatterbox, StyleTTS 2, અને Tortoise સમાવે છે. ચૂકવેલ મોડેલો સામાન્ય રીતે ઉચ્ચ ગુણવત્તા, વધુ અવાજો, અને વૉઇસ ક્લોનીંગ જેવી વધારાની લાક્ષણિકતાઓ પ્રદાન કરે છે.

હા. API લખાણના મોટા પ્રમાણમાં ભાષણમાં ફેરબદલી કરવા માટે બેચ પ્રક્રિયાને આધાર આપે છે. ઘણી બધી વિનંતીઓને રજૂ કરો અને કામ UUIDs ની મદદથી અસુમેળ રીતે પરિણામોને પુનઃપ્રાપ્ત કરો. બિઝનેસ યોજના ($99/mo) અને ઉચ્ચ ઝડપી બેચ પ્રક્રિયા માટે પ્રાથમિકતા કતાર પ્રવેશ સમાવે છે. ઓડિયોબુક ઉત્પાદન, કોર્સ સમાવિષ્ટો, અને મોટા પાયે વૉઇસોવર પ્રોજેક્ટ્સ માટે આદર્શ.
4.1/5 (42)

અમે શું સુધારી શકીએ? તમારો પ્રતિભાવ અમને સમસ્યાઓ ઉકેલવામાં મદદ કરે છે.

AI Voice વાપરવાનું આજે શરૂ કરો

TTS.ai ની મદદથી બનાવનારાઓ, વિકાસકર્તાઓ અને વ્યવસાયો સાથે જોડાઓ