Vry Kunsmatige inteligensie Teks vir spraak
33+ oop-seurce modelle, 273+ stemme, 33+ tale. Geen rekening benodig.
Alles wat jy nodig het vir stemKI
30+ gereedskap wat deur oop-onsorce-KI-modelle aangedryf word
33+ Aol Oombliklike Boodskapper KliÃ"ntComment
Die omvattendste versameling van ope-onsorce TTS modelle in een platform
Kokoro Beskikbaar
Kokoro is 'n 82 miljoen parameter teks-tot-sech model wat goed bo sy gewigsklas slaan. Ondanks sy klein grootte produseer dit merkwaardig natuurlike en drukende spraak. Kokoro ondersteun veelvuldige tale, insluitende Engels, Japannees, Chinese en Koreaans met 'n verskeidenheid van drukende stemme. Dit loop ongelooflik vinnige gtk om klank byna 100x vinniger as werklike-tyd op 'n GPU.
Beste vir: Hoog-kwaliteit TTS met minimale laatncy, stroomende toepassings
Probeer vry
Piper Beskikbaar
Pyper is 'n ligte teks-tot-sech-enjin wat ontwikkel word deur Rhasspy wat VITS en strottemat argitektuur gebruik. Dit loop geheel en al op Sve, maak dit ideaal vir rand toestelle, tuis outomatisering en programme wat vanlyn TTS vereis. Met meer as 100 stemme oor 30+ tale, Pypr gee natuurlike-klank spraak teen regte-tyd versnel selfs op 'n Rapberberry Pi 4.
Beste vir: Vinnige voorskoue, toeganklikheid en ingebedde programme
Probeer vry
VITS Beskikbaar
VITS (Variational Inference met adversariële leer vir einde-na-einde Teks-na-Spech) is 'n parallelle einde-na-end TTS metode wat veroorsaak meer natuurlike klank klank klank klank klank as huidige twee-fatsoens modelle. Dit neem variasie aan wat aangevul word met normale vloei en 'n adversariële opleiding proses, wat 'n aansienlike verbetering in natuurlike ontwikkeling tot gevolg het.
Beste vir: General-purpose teks- to-sech met natuurlike prosody
Probeer vry
MeloTTS Beskikbaar
MetoTTS deur MyShel.ai is 'n veeltalige TTS-biblioteek wat Engels ondersteun (Amerikaanse, Britse, Indiese, Australiese), Spaans, Frans, Chinees, Japannees en Koreaans. Dit is uiters vinnig, verwerking van teks teen amper werklike-tyd spoed op Sve alleen. MetoTTS is ontwerp om Sve sowel as GPUference te vervaardig en te ondersteun.
Beste vir: Produksietoepassings wat vinnige, veeltalige TTS nodig het
Probeer vry
Kani TTS 2 Beskikbaar
Kani-TTS-2 deur NegeNineSix is 'n ultraliggewig 400M parameter model wat gebou is op 'n vloeistof-KI LFM2 ruggraat met NVIDIA NanoCodec. Dit loop in slegs 3GB VRAM en bring ~10 sekondes van spraak in ~2 sekondes op' n A100 (RTF 0. 2). Die huidige publieke vrystelling van skepe 'n Engelse- alleen igitani-ts-2-enpologikapunt en doen nie die luidspreker wat nodig is vir die clovall-fel (RTances).
Beste vir: Vinnige Engelse geslag op lae-VRAM hardeware, vinnige voorskoue
Probeer vry
OuteTTS Beskikbaar
OuteTTS brei groot taal modelle uit met teks-na-sech vermoëns terwyl dit die oorspronklike argitektuur bewaar. Dit ondersteun veelvuldige agterkant met inbegrip van llama.cpp (CPU/GPU), Hugging Fac Transformeerders, ExLlamaV2, VLM, en selfs blaaier inferensie deur Transformateerders.js. Kenmerke nul- hot stem kloning deur profiele gestoor as JSON.
Beste vir: Randverwerking, blaaier gebaseerde TTS, lae-reservering omgewings
Probeer vry
Pocket TTS Beskikbaar
Picket TTS deur Kjoetai (skeptore van Moshi) is 'n kompak 100M parameter teks-na-sech model wat hard bo sy gewig slaan. Dit loop doeltreffend op SVE, ondersteun nul-afstand stem kloning van' n enkele klankmonster, en vervaardig natuurlike-klank spraak. Die klein model grootte maak dit ideaal vir randverwerking en lae-reurce omgewings.
Beste vir: Ligtegewig ontplooiing, CPU- alleen omgewing, vinnige stem kloning
Probeer vry
Kitten TTS Beskikbaar
Kitten TTS deur KittenML is 'n ultraliggewig teks-na-sech model wat op ONNX gebou is. Met variante van 15M tot 80M parameters (25-80 mb op die skyf), lewer dit hoë-vlak stemsinte op CPU sonder om 'n GPU te vereis. Kenmerke 8 ingeboude stemme, verstelbare spraakspoed en ingeboude teksvoorwerk vir getalle, kurie, eenhede en eenhede.
Beste vir: Vinnige ligte TTS, rand ontplooiing, lae- doen aansoeke
Probeer vry
Ming-Omni TTS Beskikbaar
Ming-omni-tts- 0,5B deur sluitingAI is 'n kompak omni-modal spraak model wat gebou is op die BailingM- dig ruggraat met' n Lap-by-Patch-vloei- Compressed-mading klank dekodeerder. Aflewerings 44. 1kHz uitset (naby CD-kwaliteit), ondersteun zero-afstand stem kloning van 'n 3+ tweede verwysing, en sluit in ingeboude emosie / dialek / BGM beheer deur middel van die instruksies JSON. Uitstekende l3% lin' n Chinese bankie.
Beste vir: Hoog-fideliteit tweetalige vertelling, emosiebeheer stem toneelwerk, Chinese klankboek inhoud
Probeer vry
MOSS-TTS Nano Beskikbaar
MOSS-TTS-Nano-100M is OpenMOSS se kompak 100M-parameter variant van die MOS-TTS-familie, deel die vertraging-transformer argitektuur. Handels die 8B model se hoogste kwaliteit vir ~80x kleiner gewigte en aansienlik laer per-request VRAM, wat dit geskik maak vir vryter- en hoë-deurverdragings. Dieselfde 20-taal bereik.
Beste vir: Free-tier TTS, hoÃ"- volmeme produksie, lae- doen interaktiewe gebruik
Probeer vry
Bark Kalender
Transformeer-gebaseerde teks-na-audiomodel wat realistiese spraak, musiek en klank effekte voortbring.
Ontwikkelaar: Suno · Lisensie: MIT
Probeer dit
Bark Small Kalender
Ligter weergawe van Bark met vinniger inferensie en laer geheuegebruik.
Ontwikkelaar: Suno · Lisensie: MIT
Probeer dit
CosyVoice 2 Kalender
Alibaba se kalableging TTS met menslike-pariteit natuurlike en naby-nu-Letncy.
Ontwikkelaar: Alibaba (Tongyi Lab) · Lisensie: Apache 2.0
Probeer dit
Dia TTS Kalender
Multi- Conder dialoog model wat skep natuurlike gesprekke tussen sprekers.
Ontwikkelaar: Nari Labs · Lisensie: Apache 2.0
Probeer dit
Parler TTS Kalender
Beskryf die stem wat jy in natuurlike taal wil hê en Paler genereer ooreenstemmende spraak.
Ontwikkelaar: Hugging Face · Lisensie: Apache 2.0
Probeer dit
IndexTTS-2 Kalender
Nul-skoot TTS met fyngewortelde emosiebeheer en hoë uitdrukkings.
Ontwikkelaar: Index Team · Lisensie: Bilibili Model License
Probeer dit
Spark TTS Kalender
Stemkloning TTS met beheerbare emosie en spraakstyl deur middel van aansporings.
Ontwikkelaar: SparkAudio · Lisensie: CC BY-NC-SA 4.0
Probeer dit
GPT-SoVITS Kalender
Min-skoot stem kloning TTS wat enige stem van net 5 sekondes van oudio naboots.
Ontwikkelaar: RVC-Boss · Lisensie: MIT
Probeer dit
Orpheus Kalender
Mens-vlak emosionele TTS model opgelei op 100K ure se spraak data.
Ontwikkelaar: Canopy Labs · Lisensie: Llama 3.2 Community
Probeer dit
Qwen3 TTS Kalender
Alibaba se veeltalige TTS met voorafgestelde stemme en stemontwerp uit teks.
Ontwikkelaar: Alibaba (Qwen) · Lisensie: Apache 2.0
Probeer dit
VieNeu-TTS-v2 Kalender
Viëtnamese + Engelse kode-switching TTS met 7 voorafgestelde stemme en nul-skoot stem kloning. Sve-net, nee GPU benodig.
Ontwikkelaar: Phạm Nguyễn Ngọc Bảo · Lisensie: Apache 2.0
Probeer dit
Chatterbox Turbo Kalender
Vinniger Chatterbox met sub-200m laatncy en paralinguistiese merkers vir lag, hoes, en nog meer.
Ontwikkelaar: Resemble AI · Lisensie: MIT
Probeer dit
VoxCPM Kalender
Tokenizer-free TTS produseer 44. 1kHz-oudio met konteks-aware paragraaf konsekwentheid.
Ontwikkelaar: OpenBMB · Lisensie: Apache 2.0
Probeer dit
VibeVoice Kalender
Microsoft model vir lang-vorm multi-praater inhoud soos pudcaste en oudioboeke.
Ontwikkelaar: Microsoft · Lisensie: MIT
Probeer dit
CosyVoice3 Kalender
Volgende geslag veeltalige TTS met bi-stroom, emosie beheer, en nul-kie stem kloning.
Ontwikkelaar: Alibaba (FunAudioLLM) · Lisensie: Apache 2.0
Probeer dit
NAMAA Saudi TTS Kalender
Eers open Saoedi-Arabies TTS. Indiaanse Saoediese dialek met Chaterbox-quarity stem kloning.
Ontwikkelaar: NAMAA Space · Lisensie: MIT
Probeer dit
Darwin TTS Kalender
Kruis-modal Qwen3-TTS-varing met FFN gewigs vermeng van die Qwen3- 1. 7B-taal model vir skerper veeltalige kloning.
Ontwikkelaar: FINAL-Bench · Lisensie: Apache 2.0
Probeer dit
MOSS-TTSD Kalender
Multi- Consion- Contraction model verbly cacated- style gesprekke met tot 5 sprekers en 60 minute van samehangende oudio.
Ontwikkelaar: OpenMOSS · Lisensie: Apache 2.0
Probeer dit
CosyVoice 2
Alibaba se kalableging TTS met menslike-pariteit natuurlike en naby-nu-Letncy.
Tale: en, zh, ja, ko, fr, de, it, es
Geveinsde stem
IndexTTS-2
Nul-skoot TTS met fyngewortelde emosiebeheer en hoë uitdrukkings.
Tale: en, zh
Geveinsde stem
Spark TTS
Stemkloning TTS met beheerbare emosie en spraakstyl deur middel van aansporings.
Tale: en, zh
Geveinsde stem
GPT-SoVITS
Min-skoot stem kloning TTS wat enige stem van net 5 sekondes van oudio naboots.
Tale: en, zh, ja, ko
Geveinsde stem
Chatterbox
State-van-die-art nul-skoot stem kloning met emosie kontrole van Resemble-KI.
Tale: en
Geveinsde stem
Tortoise TTS
Multi- fax- to-sech gefokus op kwaliteit met outoregressiewe argitektuur.
Tale: en
Geveinsde stem
OpenVoice
Onmiddellike stem kloning met granulêre beheer oor styl, emosie en aksent.
Tale: en, zh, ja, ko, fr, es
Geveinsde stem
VieNeu-TTS-v2
Viëtnamese + Engelse kode-switching TTS met 7 voorafgestelde stemme en nul-skoot stem kloning. Sve-net, nee GPU benodig.
Tale: vi, en
Geveinsde stem
Chatterbox Turbo
Vinniger Chatterbox met sub-200m laatncy en paralinguistiese merkers vir lag, hoes, en nog meer.
Tale: en
Geveinsde stem
VoxCPM
Tokenizer-free TTS produseer 44. 1kHz-oudio met konteks-aware paragraaf konsekwentheid.
Tale: en, zh
Geveinsde stem
OuteTTS
LM-gebaseerde TTS wat op Sve, GPU, of blaaier via llama loop.cpp and Transformators.js.
Tale: en
Geveinsde stem
Pocket TTS
Liggewig 100M parameter model deur Kujoetai met stem kloning van een monster.
Tale: en, fr
Geveinsde stem
CosyVoice3
Volgende geslag veeltalige TTS met bi-stroom, emosie beheer, en nul-kie stem kloning.
Tale: en, zh, ja, ko, de, es, fr, it, ru
Geveinsde stem
NAMAA Saudi TTS
Eers open Saoedi-Arabies TTS. Indiaanse Saoediese dialek met Chaterbox-quarity stem kloning.
Tale: ar
Geveinsde stem
Darwin TTS
Kruis-modal Qwen3-TTS-varing met FFN gewigs vermeng van die Qwen3- 1. 7B-taal model vir skerper veeltalige kloning.
Tale: en, ko, ja, zh
Geveinsde stem
MOSS-TTSD
Multi- Consion- Contraction model verbly cacated- style gesprekke met tot 5 sprekers en 60 minute van samehangende oudio.
Tale: en, zh
Geveinsde stem
Ming-Omni TTS
Kompak 0,5B omni-modale spraakmodel van ingesluiteAI met hoë-deloosheid 44.1kHz afvoer en zero-kie stem kloning.
Tale: en, zh
Geveinsde stem
MOSS-TTS Nano
Klein 100M MOS-TTS-varing dieselfde argitektuur, 80x kleiner, vryer laatncy.
Tale: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Geveinsde stemontwikkelaar- First API
OpenAI- versoenbaar met REST API. Een punt, 22+ modelle. Stroom ondersteuning vir werklike programme.
- OpenAI- versoenbaarte formaat
- Stroom TTS vir regte tyd apps
- Moenie vir groot werk verwerk word nie
- WebwerweName
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Eenvoudig, deurskynend
Begin vry. Skaal namate jy groei.
Beskikbaar
15 000 karakters + 5 000/dag
- 7 gratis modelle, waaronder Kokoro
- 5 000 karakters per geslag
- API toegang het ingesluit
Pro
2 000 krediete/month
- Alles in Beginler
- API-toegang
- Prioriteitverwerking
Vrae wat dikwels gevra word
U terugvoer help ons om geskille reg te stel.
Begin vandag met die gebruik van KI-stem
Sluit by skeppers, ontwikkelaars en sakeondernemings aan deur TTS.ai te gebruik