મુક્ત AI લખાણને બોલવામાંName

31+ ઓપન-સોર્સ મોડેલ્સ, 231+ અવાજ, 34+ ભાષાઓ. ખાતું જરૂરી નથી.

8K+
બનાવનારાઓ
32K+
પેઢીઓ
31+
AI મોડેલો
231+
અવાજો
0/500 અક્ષરો · Sign up for 5,000 per generation → મુક્ત
TTS.ai ને પ્રેમ કરો છો? તમારા મિત્રોને કહી દો!

વોઇસ AI માટે તમારે જે બધું જ જરૂરી છે

30+ સાધનો ઓપન-સોર્સ એઆઈ મોડેલો દ્વારા શક્તિશાળી

31+ AI અવાજ મોડેલો

એક પ્લેટફોર્મમાં ઓપન-સોર્સ TTS મોડેલોનું સૌથી વિસ્તૃત સંગ્રહ

KokoroKokoro મુક્ત

કોકોરો એ 82 મિલિયન પરિમાણ લખાણ-થી-ભાષા મોડેલ છે કે જે તેના વજન વર્ગની ઉપર સારી રીતે ઊભું રહે છે. તેના નાનકડા કદ છતાં, તે નોંધપાત્ર રીતે કુદરતી અને વ્યક્તીગત ભાષા ઉત્પન્ન કરે છે. કોકોરો અંગ્રેજી, જાપાની, ચીની, અને કોરિયન જેવી અનેક ભાષાઓને વિવિધ વ્યક્તીગત અવાજો સાથે આધાર આપે છે. તે અત્યંત ઝડપથી ચલાવે છે - GPU પર વાસ્તવિક સમય કરતાં લગભગ 100x ઝડપથી ઓડિયો ઉત્પન્ન કરે છે.

માટે શ્રેષ્ઠ: ન્યૂનતમ લેટસી સાથે ઉચ્ચ ગુણવત્તા TTS, સ્ટ્રીમિંગ કાર્યક્રમો

મફત પ્રયત્ન કરો

PiperPiper મુક્ત

Piper એ Rhasspy દ્વારા વિકસિત થયેલ હળવું લખાણ-થી-ભાષા એન્જિન છે કે જે VITS અને larynx આર્કિટેક્ચર વાપરે છે. તે સંપૂર્ણપણે CPU પર ચાલે છે, એજ ઉપકરણો, ઘર સ્વચાલિત, અને ઓફલાઇન TTS જરૂરી કાર્યક્રમો માટે આદર્શ બનાવે છે. 30+ ભાષાઓમાં 100 થી વધુ અવાજો સાથે, Piper એ Raspberry Pi4પર પણ વાસ્તવિક સમયની ઝડપે કુદરતી-સંગીત વાક્ય પૂરુ પાડે છે.

માટે શ્રેષ્ઠ: ઝડપી પૂર્વદર્શનો, સુલભતા, અને જડિત કાર્યક્રમો

મફત પ્રયત્ન કરો

VITSVITS મુક્ત

VITS (વિવિધતા અનુમાન સાથે અંત-થી-અંત લખાણ-થી-ભાષણ માટે વિરોધી શીખવણી) એ એક સમાન અંત-થી-અંત TTS પદ્ધતિ છે કે જે વર્તમાન બે-સ્તર મોડેલો કરતાં વધુ પ્રાકૃતિક રીતે સંભળાતું ઓડિયો પેદા કરે છે. તે સામાન્યીકરણ પ્રવાહ સાથે વધારાયેલ વિવિધતા અનુમાન અને વિરોધી તાલીમ પ્રક્રિયાને સ્વીકારે છે, પ્રાકૃતિકતામાં નોંધપાત્ર સુધારો મેળવે છે.

માટે શ્રેષ્ઠ: સામાન્ય હેતુનું લખાણ-થી-વાક્ય કુદરતી રૂપરેખાંકન સાથેName

મફત પ્રયત્ન કરો

MeloTTSMeloTTS મુક્ત

MyShell.ai દ્દારા MeloTTS એ બહુભાષી TTS લાઇબ્રેરી છે જે અંગ્રેજી (અમેરિકન, બ્રિટિશ, ભારતીય, ઓસ્ટ્રેલિયાઈ), સ્પેનિશ, ફ્રેન્ચ, ચાઇનીઝ, જાપાનીઝ, અને કોરીયનને આધાર આપે છે. તે ખૂબ ઝડપી છે, CPU પર માત્રા પર નજીકના વાસ્તવિક સમયની ઝડપે લખાણને પ્રક્રિયા કરે છે. MeloTTS ઉત્પાદન વપરાશ માટે ડિઝાઇન થયેલ છે અને CPU અને GPU બંનેને આધાર આપે છે.

માટે શ્રેષ્ઠ: ઉત્પાદન કાર્યક્રમોને ઝડપી, બહુભાષી TTS ની જરૂર છે

મફત પ્રયત્ન કરો

OuteTTSOuteTTS મુક્ત

OuteTTS લખાણ-થી-ભાષા ક્ષમતા સાથે મોટા ભાષા મોડેલોને વિસ્તૃત કરે છે જ્યારે મૂળભૂત આર્કિટેક્ચર સંગ્રહ કરે છે. તે llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, અને Transformers.js મારફતે બ્રાઉઝર ઇન્ફર્નેશન સહિત ઘણાં બેકએન્ડ્સને આધાર આપે છે. JSON તરીકે સંગ્રહાયેલ સ્પીકર રૂપરેખા મારફતે શૂન્ય-શૉટ અવાજ ક્લોનિંગ લાક્ષણિકતાઓ.

માટે શ્રેષ્ઠ: એજ ડિપ્લોયમેન્ટ, બ્રાઉઝર આધારિત TTS, ઓછા સ્ત્રોત પર્યાવરણો

મફત પ્રયત્ન કરો

Pocket TTSPocket TTS મુક્ત

પોકેટ TTS ક્યુટાઇ (મોશીના બનાવનારાઓ) દ્દારા સંકુચિત 100M પરિમાણ લખાણ-થી-ભાષણ મોડેલ છે કે જે તેના વજનથી વધારે સારી રીતે પંચ કરે છે. તે CPU પર અસરકારક રીતે ચલાવે છે, એક ઓડિયો નમૂનામાંથી શૂન્ય-શૉટ અવાજ ક્લોનિંગને આધાર આપે છે, અને કુદરતી-સંગીત વાક્ય ઉત્પન્ન કરે છે. નાનું મોડેલ માપ તેને આડી દિશામાં વિસ્તરણ અને ઓછા-સ્ત્રોત પર્યાવરણો માટે આદર્શ બનાવે છે.

માટે શ્રેષ્ઠ: હળવા વજનનું વિસ્તરણ, CPU-only પર્યાવરણો, ઝડપી અવાજ ક્લોનીંગ

મફત પ્રયત્ન કરો

Kitten TTSKitten TTS મુક્ત

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

માટે શ્રેષ્ઠ: Fast lightweight TTS, edge deployment, low-latency applications

મફત પ્રયત્ન કરો

BarkBark મૂળભૂત

ટ્રાન્સફોર્મર આધારિત લખાણ-થી-ઓડિયો મોડેલ કે જે વાસ્તવિક ભાષા, સંગીત, અને ધ્વનિ અસરો પેદા કરે છે.

ડેવલોપર: Suno · લાઇસન્સ: MIT

પ્રયત્ન કરો

Bark SmallBark Small મૂળભૂત

ઝડપી અંદાજ અને ઓછા મેમરી વપરાશ સાથે Bark ની હળવી આવૃત્તિ.

ડેવલોપર: Suno · લાઇસન્સ: MIT

પ્રયત્ન કરો

CosyVoice 2CosyVoice 2 મૂળભૂત

અલીબાબાનું માપન કરી શકાય તેવું સ્ટ્રીમિંગ TTS માનવ-સમાનતાની કુદરતીતા અને નજીક-શૂન્ય લેટન્સી સાથે.

ડેવલોપર: Alibaba (Tongyi Lab) · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

Dia TTSDia TTS મૂળભૂત

બહુ-સ્પીકર સંવાદ ઉત્પન્ન મોડેલ કે જે સ્પીકર વચ્ચે કુદરતી વાતચીત બનાવે છે.

ડેવલોપર: Nari Labs · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

Parler TTSParler TTS મૂળભૂત

તમે પ્રાકૃતિક ભાષામાં ઇચ્છતા અવાજનું વર્ણન કરો અને Parler બંધબેસતા ભાષણને ઉત્પન્ન કરે છે.

ડેવલોપર: Hugging Face · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

GLM-TTSGLM-TTS મૂળભૂત

ઓપન-સોર્સ TTS મોડેલો વચ્ચે નીચલો અક્ષર ભૂલ દર મેળવે છે.

ડેવલોપર: Zhipu AI · લાઇસન્સ: GLM-4 License

પ્રયત્ન કરો

IndexTTS-2IndexTTS-2 મૂળભૂત

ઝીરો-શોટ TTS, ફાઇન-ગ્રેનેડ ઇમોશન નિયંત્રણ અને ઉચ્ચ વ્યક્તીત્વ સાથે.

ડેવલોપર: Index Team · લાઇસન્સ: Bilibili Model License

પ્રયત્ન કરો

Spark TTSSpark TTS મૂળભૂત

અવાજ ક્લોનિંગ TTS નિયંત્રિત ભાવના અને પ્રોમ્પ્ટ્સ મારફતે બોલવાની શૈલી સાથે.

ડેવલોપર: SparkAudio · લાઇસન્સ: CC BY-NC-SA 4.0

પ્રયત્ન કરો

GPT-SoVITSGPT-SoVITS મૂળભૂત

થોડા-શૉટ અવાજ ક્લોનિંગ TTS કે જે ઓડિયોનાં માત્ર ૫ સેકન્ડોમાંથી કોઈપણ અવાજને નકલ કરે છે.

ડેવલોપર: RVC-Boss · લાઇસન્સ: MIT

પ્રયત્ન કરો

OrpheusOrpheus મૂળભૂત

100,000 કલાકની ભાષણ માહિતી પર તાલીમ આપવામાં આવેલ માનવ સ્તરીય લાગણીશીલ ટીટીએસ મોડેલ.

ડેવલોપર: Canopy Labs · લાઇસન્સ: Llama 3.2 Community

પ્રયત્ન કરો

Qwen3 TTSQwen3 TTS મૂળભૂત

અલીબાબાનું બહુભાષી TTS અવાજ ક્લોનીંગ સાથે, પૂર્વસુયોજિત અવાજો, અને લખાણમાંથી અવાજ ડિઝાઇન સાથે.

ડેવલોપર: Alibaba (Qwen) · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

Chatterbox TurboChatterbox Turbo મૂળભૂત

ઝડપી ચેટબોક્સ સબ-200ms લેટેન્સી અને હસવા, છીંકવા અને વધુ માટે પેરાલિંગવિસ્ટિક ટેગો સાથે.

ડેવલોપર: Resemble AI · લાઇસન્સ: MIT

પ્રયત્ન કરો

Dia 2Dia 2 મૂળભૂત

સ્ટ્રીમિંગ-પ્રથમ સંવાદ TTS બહુ-સ્પીકર સંવાદ અને પેરાલિંગવિસ્ટિક ક્યુઝ સાથે.

ડેવલોપર: Nari Labs · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

VoxCPMVoxCPM મૂળભૂત

ટોકેનીઝર-મુક્ત TTS સંદર્ભ-જાગૃત ફકરો સુસંગતતા સાથે 44.1kHz ઓડિયો ઉત્પન્ન કરે છે.

ડેવલોપર: OpenBMB · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

TADATADA મૂળભૂત

લખાણ-અવાયુક્ત ડબલ એલિમેન્ટ સાથે શૂન્ય-હલક્યુલિનેશન TTS, સરખામણી LLM TTS કરતા ૫x ઝડપી.

ડેવલોપર: Hume AI · લાઇસન્સ: MIT

પ્રયત્ન કરો

VibeVoiceVibeVoice મૂળભૂત

પોડકાસ્ટ અને ઓડિયોબુક્સ જેવા લાંબા-આકારના બહુ-સ્પીકર સમાવિષ્ટો માટે Microsoft મોડેલ.

ડેવલોપર: Microsoft · લાઇસન્સ: MIT

પ્રયત્ન કરો

CosyVoice3CosyVoice3 મૂળભૂત

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ડેવલોપર: Alibaba (FunAudioLLM) · લાઇસન્સ: Apache 2.0

પ્રયત્ન કરો

ChatterboxChatterbox પ્રીમિયમ

Resemble AI માંથી લાગણી નિયંત્રણ સાથે state-of-the-art zero-shot અવાજ ક્લોનિંગ.

ગુણવત્તા:

પ્રયત્ન કરો

Tortoise TTSTortoise TTS પ્રીમિયમ

બહુ- અવાજ લખાણ-થી-ભાષા ગુણવત્તા પર કેન્દ્રિત છે, આત્મ-પલટાતા આર્કિટેક્ચર સાથે.

ગુણવત્તા:

પ્રયત્ન કરો

StyleTTS 2StyleTTS 2 પ્રીમિયમ

શૈલી પ્રસારણ અને વિરોધી તાલીમ મારફતે માનવ-સ્તરનું લખાણ-થી-ભાષણ.

ગુણવત્તા:

પ્રયત્ન કરો

OpenVoiceOpenVoice પ્રીમિયમ

શૈલી, લાગણી, અને ભાષા પર ઘન નિયંત્રણ સાથે તરત જ અવાજ ક્લોનિંગ.

ગુણવત્તા:

પ્રયત્ન કરો

Sesame CSMSesame CSM પ્રીમિયમ

સંવાદાત્મક ભાષાનું મોડેલ, જે યોગ્ય સમય અને લાગણી સાથે કુદરતી સંવાદ પેદા કરે છે.

ગુણવત્તા:

પ્રયત્ન કરો

MOSS-TTSMOSS-TTS પ્રીમિયમ

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

ગુણવત્તા:

પ્રયત્ન કરો

MegaTTS3MegaTTS3 પ્રીમિયમ

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

ગુણવત્તા:

પ્રયત્ન કરો

CosyVoice 2CosyVoice 2

અલીબાબાનું માપન કરી શકાય તેવું સ્ટ્રીમિંગ TTS માનવ-સમાનતાની કુદરતીતા અને નજીક-શૂન્ય લેટન્સી સાથે.

ભાષાઓ: en, zh, ja, ko, fr, de, it, es

અવાજ ક્લોન કરો

GLM-TTSGLM-TTS

ઓપન-સોર્સ TTS મોડેલો વચ્ચે નીચલો અક્ષર ભૂલ દર મેળવે છે.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

IndexTTS-2IndexTTS-2

ઝીરો-શોટ TTS, ફાઇન-ગ્રેનેડ ઇમોશન નિયંત્રણ અને ઉચ્ચ વ્યક્તીત્વ સાથે.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

Spark TTSSpark TTS

અવાજ ક્લોનિંગ TTS નિયંત્રિત ભાવના અને પ્રોમ્પ્ટ્સ મારફતે બોલવાની શૈલી સાથે.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

GPT-SoVITSGPT-SoVITS

થોડા-શૉટ અવાજ ક્લોનિંગ TTS કે જે ઓડિયોનાં માત્ર ૫ સેકન્ડોમાંથી કોઈપણ અવાજને નકલ કરે છે.

ભાષાઓ: en, zh, ja, ko

અવાજ ક્લોન કરો

ChatterboxChatterbox

Resemble AI માંથી લાગણી નિયંત્રણ સાથે state-of-the-art zero-shot અવાજ ક્લોનિંગ.

ભાષાઓ: en

અવાજ ક્લોન કરો

Tortoise TTSTortoise TTS

બહુ- અવાજ લખાણ-થી-ભાષા ગુણવત્તા પર કેન્દ્રિત છે, આત્મ-પલટાતા આર્કિટેક્ચર સાથે.

ભાષાઓ: en

અવાજ ક્લોન કરો

OpenVoiceOpenVoice

શૈલી, લાગણી, અને ભાષા પર ઘન નિયંત્રણ સાથે તરત જ અવાજ ક્લોનિંગ.

ભાષાઓ: en, zh, ja, ko, fr, de, es, it

અવાજ ક્લોન કરો

Qwen3 TTSQwen3 TTS

અલીબાબાનું બહુભાષી TTS અવાજ ક્લોનીંગ સાથે, પૂર્વસુયોજિત અવાજો, અને લખાણમાંથી અવાજ ડિઝાઇન સાથે.

ભાષાઓ: en, zh, ja, ko, de, fr, ru, pt, es, it

અવાજ ક્લોન કરો

Chatterbox TurboChatterbox Turbo

ઝડપી ચેટબોક્સ સબ-200ms લેટેન્સી અને હસવા, છીંકવા અને વધુ માટે પેરાલિંગવિસ્ટિક ટેગો સાથે.

ભાષાઓ: en

અવાજ ક્લોન કરો

VoxCPMVoxCPM

ટોકેનીઝર-મુક્ત TTS સંદર્ભ-જાગૃત ફકરો સુસંગતતા સાથે 44.1kHz ઓડિયો ઉત્પન્ન કરે છે.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

OuteTTSOuteTTS

LLM-આધારિત TTS કે જે CPU, GPU, અથવા બ્રાઉઝર પર llama.cpp અને Transformers.js વડે ચલાવે છે.

ભાષાઓ: en

અવાજ ક્લોન કરો

Pocket TTSPocket TTS

એક નમૂનામાંથી અવાજ ક્લોનિંગ સાથે Kyutai દ્દારા હળવું 100M પરિમાણ મોડેલ.

ભાષાઓ: en, fr

અવાજ ક્લોન કરો

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ભાષાઓ: en, zh, ja, ko, de, es, fr, it, ru

અવાજ ક્લોન કરો

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

ભાષાઓ: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

અવાજ ક્લોન કરો

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

ભાષાઓ: en, zh

અવાજ ક્લોન કરો

ડેવલોપર-પહેલા API

OpenAI-સુસંગત REST API. એક અંતબિંદુ, ૨૨+ મોડેલો. વાસ્તવિક સમય કાર્યક્રમો માટે સ્ટ્રીમિંગ આધાર.

  • OpenAI-સુસંગત બંધારણ
  • રિયલ-ટાઇમ કાર્યક્રમો માટે સ્ટ્રીમિંગ TTS
  • મોટા કાર્યો માટે બેચ પ્રક્રિયા
  • વેબહોક નોંધણીઓ
API દસ્તાવેજો જુઓ
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

સરળ, પારદર્શક કિંમત

મુક્ત શરૂઆત. તમે વધો તેમ માપન કરો.

મુક્ત

$0

૧૫ ક્રેડિટ્સ

  • Kokoro, Piper, VITS, MeloTTS
  • 500 અક્ષરોની મર્યાદા
  • ૩ જન/કલાક (ખાતું નથી)
મફત નોંધણી કરો

શરુઆત કરનાર

$9/મહિનો

500 ક્રેડિટ્સ/મહિનો

  • બધા ૨૨+ મોડેલો
  • ૧૦૦,૦૦૦ અક્ષરો પ્રતિ પેઢી
  • અવાજ ક્લોનિંગ
શરૂ કરો
સૌથી લોકપ્રિય

પ્રો

$29/મહિનો

૨,૦૦૦ ક્રેડિટ્સ/મહિનો

  • શરૂઆતમાં બધું
  • API પ્રવેશ
  • પ્રાથમિકતા પ્રક્રિયા
પ્રોફેશનલ મેળવો

વ્યવસાય

$99/મહિનો

10,000 ક્રેડિટ્સ/મહિનો

  • Pro માં બધું
  • બલ્ક API
  • પ્રાથમિકતા કતાર
વ્યવસાય મેળવો

અક્ષર પેક્સને સમાવતા બધા યોજનાઓ જુઓ →

વારંવાર પૂછાતા પ્રશ્નો

TTS.ai એ સૌથી વિસ્તૃત એઆઈ અવાજ પ્લેટફોર્મ છે, જે 22+ લખાણ-થી-ભાષણ મોડેલો, ભાષા ક્લોનિંગ, ભાષા-થી-લેખન અને ઓડિયો સાધનો પ્રદાન કરે છે.

હા! TTS.ai Kokoro, Piper, VITS, અને MeloTTS મોડેલો સાથે મફત લખાણ-થી-વાક્ય પ્રદાન કરે છે. ખાતું જરૂરી નથી. 15,000 મુક્ત અક્ષરો મેળવવા માટે નોંધણી કરો અને બધા મોડેલોને વાપરો. ચૂકવણી યોજનાઓ $9/મહિનાથી શરૂ થાય છે.

ઝડપ માટે, કોકોરો અથવા પાયપર વાપરો. ગુણવત્તા માટે, કોસીવોઇસ ૨ અથવા સ્ટાઇલTTS ૨નો પ્રયત્ન કરો. અવાજ ક્લોનિંગ માટે, ચેટબોક્સ અથવા GPT-SoVITS વાપરો. સંવાદ માટે, ડાયા TTS વાપરો. સરખામણી કરવા માટે એક જ લખાણ પર ઘણાં મોડેલોનો પ્રયત્ન કરો.

હા. TTS, STT, અવાજ ક્લોનિંગ, અને ઓડિયો સાધનો માટે OpenAI-સુસંગત REST API. પ્રો ($29/mo) અને એન્ટરપ્રાઇઝ ($99/mo) યોજનાઓ પર ઉપલબ્ધ. tts.ai/api/ પર દસ્તાવેજો જુઓ.

અવાજની ગુણવત્તા મોડેલ અનુસાર બદલાય છે. CosyVoice ૨, StyleTTS ૨, અને Chatterbox જેવા પ્રીમિયમ મોડેલો કુદરતી અવાજો અને લાગણીઓ સાથે નજીક-માનવ ગુણવત્તાવાળા ભાષણને ઉત્પન્ન કરે છે. Kokoro જેવા મુક્ત મોડેલો મોટાભાગના ઉપયોગના કિસ્સાઓ માટે ઉત્તમ ગુણવત્તા પ્રદાન કરે છે.

TTS.ai તેની મોડેલ લાઇબ્રેરીમાં 30+ ભાષાઓને આધાર આપે છે. અંગ્રેજી પાસે સૌથી વિશાળ મોડેલ આધાર છે, પરંતુ CosyVoice2જેવા મોડેલો ચાઇનીઝ, જાપાનીઝ અને કોરીયનને આવરી લે છે; GPT-SoVITS ચાઇનીઝ, જાપાનીઝ, કોરીયન અને અંગ્રેજી સંભાળે છે; અને MeloTTS અંગ્રેજી, સ્પેનિશ, ફ્રેન્ચ, ચાઇનીઝ, જાપાનીઝ અને કોરીયનને આધાર આપે છે.

હા. બધી પ્રક્રિયા અમારા સમર્પિત GPU સર્વર પર થાય છે. અમે તમારા લખાણ ઇનપુટને સંગ્રહતા નથી અથવા પ્રદાન કર્યા પછી ઉત્પન્ન થયેલ ઓડિયો. ક્લોનિંગ માટે અપલોડ થયેલ અવાજ નમૂનાઓ ફક્ત વર્તમાન સત્ર માટે વપરાય છે અને સંગ્રહાયેલ નથી. અમે તમારી માહિતીને ત્રીજી પાર્ટીઓ સાથે કદી વહેંચતા નથી અથવા તેને મોડેલોને તાલીમ આપવા માટે વાપરી શકતા નથી.

હા. TTS.ai પર ઉત્પન્ન થયેલ બધા ઓડિયો તમારા વ્યવસાયિક ઉપયોગ માટે છે, YouTube વિડિઓઝ, પોડકાસ્ટ્સ, ઓડિયોબુક્સ, એપ્લિકેશનો, જાહેરાતો, અને ઉત્પાદનો માટે સમાવેશ થાય છે. અમારા મોડેલો પરવાનગી આપતી લાઇસન્સ (MIT, Apache 2.0) ની નીચે ઓપન સ્રોત છે. કોઈ રજિસ્ટર અથવા પ્રમાણપત્રની જરૂર નથી.

TTS.ai મહત્તમ ગુણવત્તા માટે મૂળભૂત રીતે WAV બંધારણમાં ઓડિયો પેદા કરે છે. તમે MP3, FLAC, OGG, અથવા M4A માં અમારા મફત ઓડિયો રૂપાંતર સાધનને વાપરીને રૂપાંતરિત કરી શકો છો. API એ સૂચનામાં સીધા જ તમારા પસંદગીના આઉટપુટ બંધારણને સ્પષ્ટ કરવાનો આધાર આપે છે.

તમે ક્લોન કરવા માંગતા હોવ તે અવાજના ટૂંકા ઓડિયો નમૂનાને અપલોડ કરો (5 સેકન્ડો જેટલું નાનું), પછી તે અવાજમાં બોલવાનું ઉત્પન્ન કરવા માટે કોઈપણ લખાણને લખો. Chatterbox, GPT-SoVITS, અને CosyVoice2જેવા મોડેલો અવાજ ક્લોનીંગને આધાર આપે છે. ક્લોન થયેલ અવાજ ટોન, ઉચ્ચાર, અને બોલવાની શૈલીને ઝડપે છે.

મુક્ત મોડેલો (Kokoro, Piper, VITS, MeloTTS) માટે ખાતાની જરૂર નથી અને શૂન્ય અક્ષરોનો ખર્ચ થાય છે. પ્રમાણભૂત મોડેલો (2,000 અક્ષરો/1K ઇનપુટ) માં Bark, CosyVoice 2, F5-TTS, અને Dia સમાવે છે. પ્રીમિયમ મોડેલો (4,000 અક્ષરો/1K ઇનપુટ) માં OpenVoice, Chatterbox, StyleTTS 2, અને Tortoise સમાવે છે. ચૂકવેલ મોડેલો સામાન્ય રીતે ઉચ્ચ ગુણવત્તા, વધુ અવાજો, અને વૉઇસ ક્લોનીંગ જેવી વધારાની લાક્ષણિકતાઓ પ્રદાન કરે છે.

હા. API ભાષણમાં લખાણના મોટા વોલ્યુમોને રૂપાંતરિત કરવા માટે બેચ પ્રક્રિયાને આધાર આપે છે. ઘણી બધી વિનંતીઓને રજૂ કરો અને કામ UUIDs ની મદદથી અસુમેળ રીતે પરિણામોને પુનઃપ્રાપ્ત કરો. એન્ટરપ્રાઇઝ યોજનાઓ ($99/mo) ઝડપી બેચ પ્રક્રિયા માટે પ્રાથમિકતા કતાર પ્રવેશને સમાવે છે. ઓડિયોબુક ઉત્પાદન, કોર્સ સમાવિષ્ટો, અને મોટા પાયે વૉઇસોવર પ્રોજેક્ટ્સ માટે આદર્શ.
4.0/5 (22)

અમે શું સુધારી શકીએ? તમારો પ્રતિભાવ અમને સમસ્યાઓ ઉકેલવામાં મદદ કરે છે.

AI Voice વાપરવાનું આજે શરૂ કરો

TTS.ai ની મદદથી બનાવનારાઓ, વિકાસકર્તાઓ અને વ્યવસાયો સાથે જોડાઓ