Free AI Test għal Diskors
31+ mudelli b’sors miftuħ, 231+ vuċijiet, 34+ L-ebda kont meħtieġ.
Kollox għandek bżonn għall-vuċi AI
30+ għodda mħaddma minn mudelli tal-AI b'sors miftuħ
31+ Mudelli tal-Vuċi AI
L-aktar kollezzjoni komprensiva ta' mudelli TTS b'sors miftuħ f'pjattaforma waħda
Kokoro Free
Kokoro huwa 82 miljun parametru test-to-talk mudell li punches sew fuq il-klassi tal-piż tagħha. Minkejja d-daqs żgħir tagħha, li tipproduċi diskors notevoli naturali u espressiv. Kokoro jappoġġja lingwi multipli inklużi l-Ingliż, Ġappuniż, Ċiniż, u Korean b'varjetà ta' vuċijiet espressivi.
L-aħjar għal: Kwalità għolja TTS b'latenza minima, applikazzjonijiet streaming
Ipprova b'xejn
Piper Free
Piper huwa softwer li jbiddel it-test f’diskors, żviluppat minn Rhasspy, li juża l-arkitettura VITS u l-arkitettura tal-larinġ. Dan jaħdem kompletament fuq il-CPU, u għalhekk huwa ideali għal apparati tat-tarf, awtomazzjoni tad-dar, u applikazzjonijiet li jeħtieġu TTS offline.
L-aħjar għal: Quick previews, aċċessibbiltà, u applikazzjonijiet inkorporati
Ipprova b'xejn
VITS Free
VITS (Inferenza varjazzjonali b’tagħlim avversarju għal Test-to-Speech minn tarf sa tarf) huwa metodu parallel ta’ TTS minn tarf sa tarf li jiġġenera awdjo b’ħoss aktar naturali mill-mudelli kurrenti f’żewġ stadji.Tadotta inferenza varjazzjonali miżjuda bi flussi ta’ normalizzazzjoni u proċess ta’ taħriġ avversarju, li jikseb titjib sinifikanti fin-naturalezza.
L-aħjar għal: Test-to-speech għal skopijiet ġenerali bi prożodija naturali
Ipprova b'xejn
MeloTTS Free
MeloTTS minn MyShell.ai hija librerija TTS multilingwi li tappoġġja l-Ingliż (Amerikan, Brittanniku, Indjan, Awstraljan), l-Ispanjol, il-Franċiż, Ċiniż, Ġappuniż u Korean. Huwa estremament mgħaġġel, ipproċessar test fi kważi veloċità fil-ħin reali fuq CPU waħdu.MeloTTS huwa ddisinjat għall-użu tal-produzzjoni u jappoġġja kemm CPU u GPU inferenza.
L-aħjar għal: Applikazzjonijiet tal-produzzjoni li jeħtieġu veloċi, multilingwi TTS
Ipprova b'xejn
OuteTTS Free
OuteTTS jestendi mudelli lingwistiċi kbar b'kapaċitajiet ta' test-to-speech filwaqt li jippreserva l-arkitettura oriġinali. Huwa jappoġġja backends multipli inkluż llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, u anke inferenza tal-browser permezz ta' Transformers.js.
L-aħjar għal: Tnedija tat-tarf, TTS ibbażat fuq il-browser, ambjenti b'riżorsi baxxi
Ipprova b'xejn
Pocket TTS Free
Pocket TTS minn Kyutai (kreaturi tal-Moshi) huwa mudell kompatti 100M parametru test-to-diskors li punches sew fuq il-piż tiegħu. Huwa jimxi b'mod effiċjenti fuq CPU, jappoġġja klonazzjoni vuċi żero-shot minn kampjun awdjo wieħed, u jipproduċi diskors naturali-ħoss.
L-aħjar għal: Użu ħafif, ambjenti CPU biss, klonazzjoni tal-vuċi mgħaġġla
Ipprova b'xejn
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
L-aħjar għal: Fast lightweight TTS, edge deployment, low-latency applications
Ipprova b'xejn
Bark Standard
Mudell tat-test għall-awdjo bbażat fuq trasformatur li jiġġenera diskors realistiku, mużika u effetti tal-ħoss.
Żviluppatur: Suno · Liċenzja: MIT
Ipprovaha
Bark Small Standard
Verżjoni eħfef tal-Qoxra b'inferenza aktar mgħaġġla u użu tal-memorja aktar baxxa.
Żviluppatur: Suno · Liċenzja: MIT
Ipprovaha
CosyVoice 2 Standard
TTS streaming skalabbli ta ’Alibaba b’naturalezza ta’ parità umana u latenza kważi żero.
Żviluppatur: Alibaba (Tongyi Lab) · Liċenzja: Apache 2.0
Ipprovaha
Dia TTS Standard
Mudell ta' ġenerazzjoni ta' djalogu b'ħafna kelliema li joħloq konversazzjonijiet naturali bejn kelliema.
Żviluppatur: Nari Labs · Liċenzja: Apache 2.0
Ipprovaha
Parler TTS Standard
Tiddeskrivi l-vuċi li tixtieq fil-lingwa naturali u Parler jiġġenera diskors li jaqblu.
Żviluppatur: Hugging Face · Liċenzja: Apache 2.0
Ipprovaha
GLM-TTS Standard
Jilħaq l-aktar rata baxxa ta ’żball tal-karattru fost il-mudelli TTS b’sors miftuħ.
Żviluppatur: Zhipu AI · Liċenzja: GLM-4 License
Ipprovaha
IndexTTS-2 Standard
Zero-shot TTS b'kontroll emozzjoni granulari fina u espressività għolja.
Żviluppatur: Index Team · Liċenzja: Bilibili Model License
Ipprovaha
Spark TTS Standard
TTS tal-ikklonjar tal-vuċi b'emozzjoni kontrollabbli u stil tat-taħdit permezz ta' twissijiet.
Żviluppatur: SparkAudio · Liċenzja: CC BY-NC-SA 4.0
Ipprovaha
GPT-SoVITS Standard
Ftit-shot vuċi klonazzjoni TTS li jirreplika kwalunkwe vuċi minn biss 5 sekondi tal-awdjo.
Żviluppatur: RVC-Boss · Liċenzja: MIT
Ipprovaha
Orpheus Standard
Mudell emozzjonali TTS fil-livell tal-bniedem imħarreġ fuq 100K sigħat ta' dejta tad-diskors.
Żviluppatur: Canopy Labs · Liċenzja: Llama 3.2 Community
Ipprovaha
Qwen3 TTS Standard
TTS multilingwi ta ’Alibaba b’ikklonjar tal-vuċi, vuċijiet issettjati minn qabel, u disinn tal-vuċi mit-test.
Żviluppatur: Alibaba (Qwen) · Liċenzja: Apache 2.0
Ipprovaha
Chatterbox Turbo Standard
Chatterbox aktar mgħaġġel b'latenza sub-200ms u tags paralinguistic għal daħk, sogħla, u aktar.
Żviluppatur: Resemble AI · Liċenzja: MIT
Ipprovaha
Dia 2 Standard
Streaming-ewwel konversazzjonali TTS ma djalogu multi-speaker u cues paralinguistic.
Żviluppatur: Nari Labs · Liċenzja: Apache 2.0
Ipprovaha
VoxCPM Standard
TTS mingħajr tokenizer li jipproduċi awdjo 44.1kHz b'konsistenza tal-paragrafu konxja mill-kuntest.
Żviluppatur: OpenBMB · Liċenzja: Apache 2.0
Ipprovaha
TADA Standard
Zero-alluċinazzjoni TTS b'allinjament doppju test-akustika, 5x aktar mgħaġġel minn TTS LLM komparabbli.
Żviluppatur: Hume AI · Liċenzja: MIT
Ipprovaha
VibeVoice Standard
Mudell Microsoft għal kontenut multi-speaker f'forma twila bħal podcasts u kotba awdjo.
Żviluppatur: Microsoft · Liċenzja: MIT
Ipprovaha
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Żviluppatur: Alibaba (FunAudioLLM) · Liċenzja: Apache 2.0
Ipprovaha
CosyVoice 2
TTS streaming skalabbli ta ’Alibaba b’naturalezza ta’ parità umana u latenza kważi żero.
Lingwi: en, zh, ja, ko, fr, de, it, es
Il-vuċi tal-klonu
GLM-TTS
Jilħaq l-aktar rata baxxa ta ’żball tal-karattru fost il-mudelli TTS b’sors miftuħ.
Lingwi: en, zh
Il-vuċi tal-klonu
IndexTTS-2
Zero-shot TTS b'kontroll emozzjoni granulari fina u espressività għolja.
Lingwi: en, zh
Il-vuċi tal-klonu
Spark TTS
TTS tal-ikklonjar tal-vuċi b'emozzjoni kontrollabbli u stil tat-taħdit permezz ta' twissijiet.
Lingwi: en, zh
Il-vuċi tal-klonu
GPT-SoVITS
Ftit-shot vuċi klonazzjoni TTS li jirreplika kwalunkwe vuċi minn biss 5 sekondi tal-awdjo.
Lingwi: en, zh, ja, ko
Il-vuċi tal-klonu
Chatterbox
Stat-tal-aħħar żero-shot kklonjar vuċi mal-kontroll emozzjoni minn Resemble AI.
Lingwi: en
Il-vuċi tal-klonu
Tortoise TTS
Test-to-speech b'ħafna vuċijiet iffokat fuq il-kwalità b'arkitettura autoregressiva.
Lingwi: en
Il-vuċi tal-klonu
OpenVoice
Instant klonazzjoni vuċi b'kontroll granulari fuq l-istil, emozzjoni, u aċċent.
Lingwi: en, zh, ja, ko, fr, de, es, it
Il-vuċi tal-klonu
Qwen3 TTS
TTS multilingwi ta ’Alibaba b’ikklonjar tal-vuċi, vuċijiet issettjati minn qabel, u disinn tal-vuċi mit-test.
Lingwi: en, zh, ja, ko, de, fr, ru, pt, es, it
Il-vuċi tal-klonu
Chatterbox Turbo
Chatterbox aktar mgħaġġel b'latenza sub-200ms u tags paralinguistic għal daħk, sogħla, u aktar.
Lingwi: en
Il-vuċi tal-klonu
VoxCPM
TTS mingħajr tokenizer li jipproduċi awdjo 44.1kHz b'konsistenza tal-paragrafu konxja mill-kuntest.
Lingwi: en, zh
Il-vuċi tal-klonu
OuteTTS
TTS ibbażat fuq LLM li jaħdem fuq CPU, GPU, jew browser permezz llama.cpp u Transformers.js.
Lingwi: en
Il-vuċi tal-klonu
Pocket TTS
Mudell tal-parametru ħafif 100M minn Kyutai bi klonazzjoni tal-vuċi minn kampjun wieħed.
Lingwi: en, fr
Il-vuċi tal-klonu
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Lingwi: en, zh, ja, ko, de, es, fr, it, ru
Il-vuċi tal-klonu
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Lingwi: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Il-vuċi tal-klonu
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Lingwi: en, zh
Il-vuċi tal-klonuL-ewwel API għall-iżviluppaturi
OpenAI-kompatibbli REST API. One endpoint, 22+ mudelli. Streaming appoġġ għall-applikazzjonijiet fil-ħin reali.
- Format kompatibbli ma’ OpenAI
- Streaming TTS għall-applikazzjonijiet fil-ħin reali
- Ipproċessar tal-lott għall-impjiegi kbar
- Notifiki tal-webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Sempliċi, Prezzijiet trasparenti
Ibda b'xejn. Skala kif tikber.
Liberi
15-il kreditu
- Kokoro, Piper, VITS, MeloTTS
- Limitu ta’ 500 karattru
- 3 gen/siegħa (l-ebda kont)
Starter
500 kreditu / xahar
- Kollha 22+ mudelli
- 100,000 karattru għal kull ġenerazzjoni
- Klonazzjoni tal-vuċi
Għal
2,000 kreditu/xahar
- Kollox fi Starter
- Aċċess għall-API
- Ipproċessar ta’ prijorità
Negozju
10,000 kreditu/xahar
- Kollox fil-Pro
- API bl-ingrossa
- Kju ta’ prijorità
Mistoqsijiet Frekwenti (FAQ)
X'nistgħu ntejbu? Il-feedback tiegħek jgħinna nsolvu l-problemi.
Ibda tuża AI Voice Illum
Ingħaqad ma' kreaturi, żviluppaturi u negozji li jużaw TTS.ai