Vry Kunsmatige inteligensie Teks vir spraak
31+ oop-seurce modelle, 231+ stemme, 34+ tale. Geen rekening benodig.
Alles wat jy nodig het vir stemKI
30+ gereedskap wat deur oop-onsorce-KI-modelle aangedryf word
31+ Aol Oombliklike Boodskapper KliÃ"ntComment
Die omvattendste versameling van ope-onsorce TTS modelle in een platform
Kokoro Free
Kokoro is 'n 82 miljoen parameter teks-tot-sech model wat goed bo sy gewigsklas slaan. Ondanks sy klein grootte produseer dit merkwaardig natuurlike en drukende spraak. Kokoro ondersteun veelvuldige tale, insluitende Engels, Japannees, Chinese en Koreaans met 'n verskeidenheid van drukende stemme. Dit loop ongelooflik vinnige gtk om klank byna 100x vinniger as werklike-tyd op 'n GPU.
Beste vir: Hoog-kwaliteit TTS met minimale laatncy, stroomende toepassings
Probeer vry
Piper Free
Pyper is 'n ligte teks-tot-sech-enjin wat ontwikkel word deur Rhasspy wat VITS en strottemat argitektuur gebruik. Dit loop geheel en al op Sve, maak dit ideaal vir rand toestelle, tuis outomatisering en programme wat vanlyn TTS vereis. Met meer as 100 stemme oor 30+ tale, Pypr gee natuurlike-klank spraak teen regte-tyd versnel selfs op 'n Rapberberry Pi 4.
Beste vir: Vinnige voorskoue, toeganklikheid en ingebedde programme
Probeer vry
VITS Free
VITS (Variational Inference met adversariële leer vir einde-na-einde Teks-na-Spech) is 'n parallelle einde-na-end TTS metode wat veroorsaak meer natuurlike klank klank klank klank klank as huidige twee-fatsoens modelle. Dit neem variasie aan wat aangevul word met normale vloei en 'n adversariële opleiding proses, wat 'n aansienlike verbetering in natuurlike ontwikkeling tot gevolg het.
Beste vir: General-purpose teks- to-sech met natuurlike prosody
Probeer vry
MeloTTS Free
MetoTTS deur MyShel.ai is 'n veeltalige TTS-biblioteek wat Engels ondersteun (Amerikaanse, Britse, Indiese, Australiese), Spaans, Frans, Chinees, Japannees en Koreaans. Dit is uiters vinnig, verwerking van teks teen amper werklike-tyd spoed op Sve alleen. MetoTTS is ontwerp om Sve sowel as GPUference te vervaardig en te ondersteun.
Beste vir: Produksietoepassings wat vinnige, veeltalige TTS nodig het
Probeer vry
OuteTTS Free
OuteTTS brei groot taal modelle uit met teks-na-sech vermoëns terwyl dit die oorspronklike argitektuur bewaar. Dit ondersteun veelvuldige agterkant met inbegrip van llama.cpp (CPU/GPU), Hugging Fac Transformeerders, ExLlamaV2, VLM, en selfs blaaier inferensie deur Transformateerders.js. Kenmerke nul- hot stem kloning deur profiele gestoor as JSON.
Beste vir: Randverwerking, blaaier gebaseerde TTS, lae-reservering omgewings
Probeer vry
Pocket TTS Free
Picket TTS deur Kjoetai (skeptore van Moshi) is 'n kompak 100M parameter teks-na-sech model wat hard bo sy gewig slaan. Dit loop doeltreffend op SVE, ondersteun nul-afstand stem kloning van' n enkele klankmonster, en vervaardig natuurlike-klank spraak. Die klein model grootte maak dit ideaal vir randverwerking en lae-reurce omgewings.
Beste vir: Ligtegewig ontplooiing, CPU- alleen omgewing, vinnige stem kloning
Probeer vry
Kitten TTS Free
Kitten TTS deur KittenML is 'n ultraliggewig teks-na-sech model wat op ONNX gebou is. Met variante van 15M tot 80M parameters (25-80 mb op die skyf), lewer dit hoë-vlak stemsinte op CPU sonder om 'n GPU te vereis. Kenmerke 8 ingeboude stemme, verstelbare spraakspoed en ingeboude teksvoorwerk vir getalle, kurie, eenhede en eenhede.
Beste vir: Vinnige ligte TTS, rand ontplooiing, lae- doen aansoeke
Probeer vry
Bark Standard
Transformeer-gebaseerde teks-na-audiomodel wat realistiese spraak, musiek en klank effekte voortbring.
Ontwikkelaar: Suno · Lisensie: MIT
Probeer dit
Bark Small Standard
Ligter weergawe van Bark met vinniger inferensie en laer geheuegebruik.
Ontwikkelaar: Suno · Lisensie: MIT
Probeer dit
CosyVoice 2 Standard
Alibaba se kalableging TTS met menslike-pariteit natuurlike en naby-nu-Letncy.
Ontwikkelaar: Alibaba (Tongyi Lab) · Lisensie: Apache 2.0
Probeer dit
Dia TTS Standard
Multi- Conder dialoog model wat skep natuurlike gesprekke tussen sprekers.
Ontwikkelaar: Nari Labs · Lisensie: Apache 2.0
Probeer dit
Parler TTS Standard
Beskryf die stem wat jy in natuurlike taal wil hê en Paler genereer ooreenstemmende spraak.
Ontwikkelaar: Hugging Face · Lisensie: Apache 2.0
Probeer dit
GLM-TTS Standard
Kry die laagste karakter fout tempo onder oop-seurce TTS modelle.
Ontwikkelaar: Zhipu AI · Lisensie: GLM-4 License
Probeer dit
IndexTTS-2 Standard
Nul-skoot TTS met fyngewortelde emosiebeheer en hoë uitdrukkings.
Ontwikkelaar: Index Team · Lisensie: Bilibili Model License
Probeer dit
Spark TTS Standard
Stemkloning TTS met beheerbare emosie en spraakstyl deur middel van aansporings.
Ontwikkelaar: SparkAudio · Lisensie: CC BY-NC-SA 4.0
Probeer dit
GPT-SoVITS Standard
Min-skoot stem kloning TTS wat enige stem van net 5 sekondes van oudio naboots.
Ontwikkelaar: RVC-Boss · Lisensie: MIT
Probeer dit
Orpheus Standard
Mens-vlak emosionele TTS model opgelei op 100K ure se spraak data.
Ontwikkelaar: Canopy Labs · Lisensie: Llama 3.2 Community
Probeer dit
Qwen3 TTS Standard
Alibaba se veeltalige TTS met stemkloning, voorafgestelde stemme en stemontwerp uit teks.
Ontwikkelaar: Alibaba (Qwen) · Lisensie: Apache 2.0
Probeer dit
Chatterbox Turbo Standard
Vinniger Chatterbox met sub-200m laatncy en paralinguistiese merkers vir lag, hoes, en nog meer.
Ontwikkelaar: Resemble AI · Lisensie: MIT
Probeer dit
Dia 2 Standard
Stroom-eerste gesprek TTS met multi-preser dialoog en paralinguistiese tekens.
Ontwikkelaar: Nari Labs · Lisensie: Apache 2.0
Probeer dit
VoxCPM Standard
Tokenizer-free TTS produseer 44. 1kHz-oudio met konteks-aware paragraaf konsekwentheid.
Ontwikkelaar: OpenBMB · Lisensie: Apache 2.0
Probeer dit
TADA Standard
Zero-hallucinasie TTS met teks-austiese tweeledige belyning, 5x vinniger as vergelykbare LMM TTS.
Ontwikkelaar: Hume AI · Lisensie: MIT
Probeer dit
VibeVoice Standard
Microsoft model vir lang-vorm multi-praater inhoud soos pudcaste en oudioboeke.
Ontwikkelaar: Microsoft · Lisensie: MIT
Probeer dit
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Ontwikkelaar: Alibaba (FunAudioLLM) · Lisensie: Apache 2.0
Probeer dit
CosyVoice 2
Alibaba se kalableging TTS met menslike-pariteit natuurlike en naby-nu-Letncy.
Tale: en, zh, ja, ko, fr, de, it, es
Geveinsde stem
GLM-TTS
Kry die laagste karakter fout tempo onder oop-seurce TTS modelle.
Tale: en, zh
Geveinsde stem
IndexTTS-2
Nul-skoot TTS met fyngewortelde emosiebeheer en hoë uitdrukkings.
Tale: en, zh
Geveinsde stem
Spark TTS
Stemkloning TTS met beheerbare emosie en spraakstyl deur middel van aansporings.
Tale: en, zh
Geveinsde stem
GPT-SoVITS
Min-skoot stem kloning TTS wat enige stem van net 5 sekondes van oudio naboots.
Tale: en, zh, ja, ko
Geveinsde stem
Chatterbox
State-van-die-art nul-skoot stem kloning met emosie kontrole van Resemble-KI.
Tale: en
Geveinsde stem
Tortoise TTS
Multi- fax- to-sech gefokus op kwaliteit met outoregressiewe argitektuur.
Tale: en
Geveinsde stem
OpenVoice
Onmiddellike stem kloning met granulêre beheer oor styl, emosie en aksent.
Tale: en, zh, ja, ko, fr, de, es, it
Geveinsde stem
Qwen3 TTS
Alibaba se veeltalige TTS met stemkloning, voorafgestelde stemme en stemontwerp uit teks.
Tale: en, zh, ja, ko, de, fr, ru, pt, es, it
Geveinsde stem
Chatterbox Turbo
Vinniger Chatterbox met sub-200m laatncy en paralinguistiese merkers vir lag, hoes, en nog meer.
Tale: en
Geveinsde stem
VoxCPM
Tokenizer-free TTS produseer 44. 1kHz-oudio met konteks-aware paragraaf konsekwentheid.
Tale: en, zh
Geveinsde stem
OuteTTS
LM-gebaseerde TTS wat op Sve, GPU, of blaaier via llama loop.cpp and Transformators.js.
Tale: en
Geveinsde stem
Pocket TTS
Liggewig 100M parameter model deur Kujoetai met stem kloning van een monster.
Tale: en, fr
Geveinsde stem
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Tale: en, zh, ja, ko, de, es, fr, it, ru
Geveinsde stem
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Tale: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Geveinsde stem
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Tale: en, zh
Geveinsde stemontwikkelaar- First API
OpenAI- versoenbaar met REST API. Een punt, 22+ modelle. Stroom ondersteuning vir werklike programme.
- OpenAI- versoenbaarte formaat
- Stroom TTS vir regte tyd apps
- Moenie vir groot werk verwerk word nie
- WebwerweName
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Eenvoudig, deurskynend
Begin vry. Skaal namate jy groei.
Beskikbaar
15 krediete
- Kokoro, Piper, VITS, MeloTTS
- 500 karakterbeperking
- 3 gen/hour (geen rekening)
Pro
2 000 krediete/month
- Alles in Beginler
- API-toegang
- Prioriteitverwerking
Vrae wat dikwels gevra word
U terugvoer help ons om geskille reg te stel.
Begin vandag met die gebruik van KI-stem
Sluit by skeppers, ontwikkelaars en sakeondernemings aan deur TTS.ai te gebruik