Vry Kunsmatige inteligensie Teks vir spraak

31+ oop-seurce modelle, 231+ stemme, 34+ tale. Geen rekening benodig.

8K+
Konfigators
32K+
geslagte
31+
Kunsmatige inteligensie modelle
231+
stemme
0/500 karakters · Sign up for 5,000 per generation → Beskikbaar
5 000 karakters per geslag 15 000 vry karakters Geen kredietkaart nie Kommersiële gebruik OK
Teken gratis op
Aflaai klaar gemaak Skakel verstrek in 24h
Liefde TTS.ai, vertel jou vriende!

Alles wat jy nodig het vir stemKI

30+ gereedskap wat deur oop-onsorce-KI-modelle aangedryf word

31+ Aol Oombliklike Boodskapper KliÃ"ntComment

Die omvattendste versameling van ope-onsorce TTS modelle in een platform

KokoroKokoro Free

Kokoro is 'n 82 miljoen parameter teks-tot-sech model wat goed bo sy gewigsklas slaan. Ondanks sy klein grootte produseer dit merkwaardig natuurlike en drukende spraak. Kokoro ondersteun veelvuldige tale, insluitende Engels, Japannees, Chinese en Koreaans met 'n verskeidenheid van drukende stemme. Dit loop ongelooflik vinnige gtk om klank byna 100x vinniger as werklike-tyd op 'n GPU.

Beste vir: Hoog-kwaliteit TTS met minimale laatncy, stroomende toepassings

Probeer vry

PiperPiper Free

Pyper is 'n ligte teks-tot-sech-enjin wat ontwikkel word deur Rhasspy wat VITS en strottemat argitektuur gebruik. Dit loop geheel en al op Sve, maak dit ideaal vir rand toestelle, tuis outomatisering en programme wat vanlyn TTS vereis. Met meer as 100 stemme oor 30+ tale, Pypr gee natuurlike-klank spraak teen regte-tyd versnel selfs op 'n Rapberberry Pi 4.

Beste vir: Vinnige voorskoue, toeganklikheid en ingebedde programme

Probeer vry

VITSVITS Free

VITS (Variational Inference met adversariële leer vir einde-na-einde Teks-na-Spech) is 'n parallelle einde-na-end TTS metode wat veroorsaak meer natuurlike klank klank klank klank klank as huidige twee-fatsoens modelle. Dit neem variasie aan wat aangevul word met normale vloei en 'n adversariële opleiding proses, wat 'n aansienlike verbetering in natuurlike ontwikkeling tot gevolg het.

Beste vir: General-purpose teks- to-sech met natuurlike prosody

Probeer vry

MeloTTSMeloTTS Free

MetoTTS deur MyShel.ai is 'n veeltalige TTS-biblioteek wat Engels ondersteun (Amerikaanse, Britse, Indiese, Australiese), Spaans, Frans, Chinees, Japannees en Koreaans. Dit is uiters vinnig, verwerking van teks teen amper werklike-tyd spoed op Sve alleen. MetoTTS is ontwerp om Sve sowel as GPUference te vervaardig en te ondersteun.

Beste vir: Produksietoepassings wat vinnige, veeltalige TTS nodig het

Probeer vry

OuteTTSOuteTTS Free

OuteTTS brei groot taal modelle uit met teks-na-sech vermoëns terwyl dit die oorspronklike argitektuur bewaar. Dit ondersteun veelvuldige agterkant met inbegrip van llama.cpp (CPU/GPU), Hugging Fac Transformeerders, ExLlamaV2, VLM, en selfs blaaier inferensie deur Transformateerders.js. Kenmerke nul- hot stem kloning deur profiele gestoor as JSON.

Beste vir: Randverwerking, blaaier gebaseerde TTS, lae-reservering omgewings

Probeer vry

Pocket TTSPocket TTS Free

Picket TTS deur Kjoetai (skeptore van Moshi) is 'n kompak 100M parameter teks-na-sech model wat hard bo sy gewig slaan. Dit loop doeltreffend op SVE, ondersteun nul-afstand stem kloning van' n enkele klankmonster, en vervaardig natuurlike-klank spraak. Die klein model grootte maak dit ideaal vir randverwerking en lae-reurce omgewings.

Beste vir: Ligtegewig ontplooiing, CPU- alleen omgewing, vinnige stem kloning

Probeer vry

Kitten TTSKitten TTS Free

Kitten TTS deur KittenML is 'n ultraliggewig teks-na-sech model wat op ONNX gebou is. Met variante van 15M tot 80M parameters (25-80 mb op die skyf), lewer dit hoë-vlak stemsinte op CPU sonder om 'n GPU te vereis. Kenmerke 8 ingeboude stemme, verstelbare spraakspoed en ingeboude teksvoorwerk vir getalle, kurie, eenhede en eenhede.

Beste vir: Vinnige ligte TTS, rand ontplooiing, lae- doen aansoeke

Probeer vry

BarkBark Standard

Transformeer-gebaseerde teks-na-audiomodel wat realistiese spraak, musiek en klank effekte voortbring.

Ontwikkelaar: Suno · Lisensie: MIT

Probeer dit

Bark SmallBark Small Standard

Ligter weergawe van Bark met vinniger inferensie en laer geheuegebruik.

Ontwikkelaar: Suno · Lisensie: MIT

Probeer dit

CosyVoice 2CosyVoice 2 Standard

Alibaba se kalableging TTS met menslike-pariteit natuurlike en naby-nu-Letncy.

Ontwikkelaar: Alibaba (Tongyi Lab) · Lisensie: Apache 2.0

Probeer dit

Dia TTSDia TTS Standard

Multi- Conder dialoog model wat skep natuurlike gesprekke tussen sprekers.

Ontwikkelaar: Nari Labs · Lisensie: Apache 2.0

Probeer dit

Parler TTSParler TTS Standard

Beskryf die stem wat jy in natuurlike taal wil hê en Paler genereer ooreenstemmende spraak.

Ontwikkelaar: Hugging Face · Lisensie: Apache 2.0

Probeer dit

GLM-TTSGLM-TTS Standard

Kry die laagste karakter fout tempo onder oop-seurce TTS modelle.

Ontwikkelaar: Zhipu AI · Lisensie: GLM-4 License

Probeer dit

IndexTTS-2IndexTTS-2 Standard

Nul-skoot TTS met fyngewortelde emosiebeheer en hoë uitdrukkings.

Ontwikkelaar: Index Team · Lisensie: Bilibili Model License

Probeer dit

Spark TTSSpark TTS Standard

Stemkloning TTS met beheerbare emosie en spraakstyl deur middel van aansporings.

Ontwikkelaar: SparkAudio · Lisensie: CC BY-NC-SA 4.0

Probeer dit

GPT-SoVITSGPT-SoVITS Standard

Min-skoot stem kloning TTS wat enige stem van net 5 sekondes van oudio naboots.

Ontwikkelaar: RVC-Boss · Lisensie: MIT

Probeer dit

OrpheusOrpheus Standard

Mens-vlak emosionele TTS model opgelei op 100K ure se spraak data.

Ontwikkelaar: Canopy Labs · Lisensie: Llama 3.2 Community

Probeer dit

Qwen3 TTSQwen3 TTS Standard

Alibaba se veeltalige TTS met stemkloning, voorafgestelde stemme en stemontwerp uit teks.

Ontwikkelaar: Alibaba (Qwen) · Lisensie: Apache 2.0

Probeer dit

Chatterbox TurboChatterbox Turbo Standard

Vinniger Chatterbox met sub-200m laatncy en paralinguistiese merkers vir lag, hoes, en nog meer.

Ontwikkelaar: Resemble AI · Lisensie: MIT

Probeer dit

Dia 2Dia 2 Standard

Stroom-eerste gesprek TTS met multi-preser dialoog en paralinguistiese tekens.

Ontwikkelaar: Nari Labs · Lisensie: Apache 2.0

Probeer dit

VoxCPMVoxCPM Standard

Tokenizer-free TTS produseer 44. 1kHz-oudio met konteks-aware paragraaf konsekwentheid.

Ontwikkelaar: OpenBMB · Lisensie: Apache 2.0

Probeer dit

TADATADA Standard

Zero-hallucinasie TTS met teks-austiese tweeledige belyning, 5x vinniger as vergelykbare LMM TTS.

Ontwikkelaar: Hume AI · Lisensie: MIT

Probeer dit

VibeVoiceVibeVoice Standard

Microsoft model vir lang-vorm multi-praater inhoud soos pudcaste en oudioboeke.

Ontwikkelaar: Microsoft · Lisensie: MIT

Probeer dit

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Ontwikkelaar: Alibaba (FunAudioLLM) · Lisensie: Apache 2.0

Probeer dit

ChatterboxChatterbox Premium

State-van-die-art nul-skoot stem kloning met emosie kontrole van Resemble-KI.

Kwaliteit:

Probeer dit

Tortoise TTSTortoise TTS Premium

Multi- fax- to-sech gefokus op kwaliteit met outoregressiewe argitektuur.

Kwaliteit:

Probeer dit

StyleTTS 2StyleTTS 2 Premium

Human-vlak teks-na-sech deur styl diffusie en adversariële opleiding.

Kwaliteit:

Probeer dit

OpenVoiceOpenVoice Premium

Onmiddellike stem kloning met granulêre beheer oor styl, emosie en aksent.

Kwaliteit:

Probeer dit

Sesame CSMSesame CSM Premium

Gesprekvoeringsmodel skep natuurlike dialoog met gepaste tydsberekening en emosie.

Kwaliteit:

Probeer dit

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Kwaliteit:

Probeer dit

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Kwaliteit:

Probeer dit

CosyVoice 2CosyVoice 2

Alibaba se kalableging TTS met menslike-pariteit natuurlike en naby-nu-Letncy.

Tale: en, zh, ja, ko, fr, de, it, es

Geveinsde stem

GLM-TTSGLM-TTS

Kry die laagste karakter fout tempo onder oop-seurce TTS modelle.

Tale: en, zh

Geveinsde stem

IndexTTS-2IndexTTS-2

Nul-skoot TTS met fyngewortelde emosiebeheer en hoë uitdrukkings.

Tale: en, zh

Geveinsde stem

Spark TTSSpark TTS

Stemkloning TTS met beheerbare emosie en spraakstyl deur middel van aansporings.

Tale: en, zh

Geveinsde stem

GPT-SoVITSGPT-SoVITS

Min-skoot stem kloning TTS wat enige stem van net 5 sekondes van oudio naboots.

Tale: en, zh, ja, ko

Geveinsde stem

ChatterboxChatterbox

State-van-die-art nul-skoot stem kloning met emosie kontrole van Resemble-KI.

Tale: en

Geveinsde stem

Tortoise TTSTortoise TTS

Multi- fax- to-sech gefokus op kwaliteit met outoregressiewe argitektuur.

Tale: en

Geveinsde stem

OpenVoiceOpenVoice

Onmiddellike stem kloning met granulêre beheer oor styl, emosie en aksent.

Tale: en, zh, ja, ko, fr, de, es, it

Geveinsde stem

Qwen3 TTSQwen3 TTS

Alibaba se veeltalige TTS met stemkloning, voorafgestelde stemme en stemontwerp uit teks.

Tale: en, zh, ja, ko, de, fr, ru, pt, es, it

Geveinsde stem

Chatterbox TurboChatterbox Turbo

Vinniger Chatterbox met sub-200m laatncy en paralinguistiese merkers vir lag, hoes, en nog meer.

Tale: en

Geveinsde stem

VoxCPMVoxCPM

Tokenizer-free TTS produseer 44. 1kHz-oudio met konteks-aware paragraaf konsekwentheid.

Tale: en, zh

Geveinsde stem

OuteTTSOuteTTS

LM-gebaseerde TTS wat op Sve, GPU, of blaaier via llama loop.cpp and Transformators.js.

Tale: en

Geveinsde stem

Pocket TTSPocket TTS

Liggewig 100M parameter model deur Kujoetai met stem kloning van een monster.

Tale: en, fr

Geveinsde stem

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Tale: en, zh, ja, ko, de, es, fr, it, ru

Geveinsde stem

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Tale: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Geveinsde stem

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Tale: en, zh

Geveinsde stem

ontwikkelaar- First API

OpenAI- versoenbaar met REST API. Een punt, 22+ modelle. Stroom ondersteuning vir werklike programme.

  • OpenAI- versoenbaarte formaat
  • Stroom TTS vir regte tyd apps
  • Moenie vir groot werk verwerk word nie
  • WebwerweName
Besigtig API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Eenvoudig, deurskynend

Begin vry. Skaal namate jy groei.

Beskikbaar

$0

15 krediete

  • Kokoro, Piper, VITS, MeloTTS
  • 500 karakterbeperking
  • 3 gen/hour (geen rekening)
Meld aan om vry te wees

Beginer

$9/mo

500 krediete/onth

  • Al 22+ modelle
  • 100 000 chars per geslag
  • Stemverkleuring
Begin
Die gewildste

Pro

$29/mo

2 000 krediete/month

  • Alles in Beginler
  • API-toegang
  • Prioriteitverwerking
Kry Pro

Besigheid

$99/mo

10 000 krediete/onth

  • Alles in Procrect
  • Grootmaat API
  • Prioriteit wagtou
Kry sake

Bekyk alle planne met inbegrip van karakterpakkies →

Vrae wat dikwels gevra word

TTS.ai is die omvattendste KI-klankplatform, bied 22+ teks-na-sech modelle, stemkloning, spraak-tot-teks en oudiogereedskap aan. Alle modelle is oop bron met geen verkoper slot-in nie.

Yes! TTS.ai offers free text-to-speech with Kokoro, Piper, VITS, and MeloTTS models. No account required. Sign up to get 15,000 free characters and access all models. Paid plans start at $9/month.

Vir spoed, gebruik Kokoro of Piper. Vir kwaliteit, probeer CosyVoice 2 of StyltTS 2. Vir stem kloning, gebruik Chatterbox of GPT-SoVITS. Vir dialoog, gebruik Dia TTS. Probeer veelvuldige modelle op dieselfde teks om te vergelyk.

Ja. OpenAI- compatible REST API vir TTS, STT, stemkloning en oudiogereedskap. Beskikbaar op Pro ($29/mo) en buiteneming ($99/mo) planne. Bekyk dokumentasie by tts.ai/api/.

Stem kwaliteit wissel deur model. Premium modelle soos CosyVoice 2, StylTTS 2, en Chaterbox produseer naby-menslike kwaliteitsrede met natuurlike intonasie en emosie. Vry modelle soos Kokoro bied uitstekende kwaliteit vir die meeste gebruik van gevalle.

TTS.ai ondersteun 30+ tale oor sy modelbiblioteek. Engels het die breedste model ondersteun, maar modelle soos CosyVice 2 dek Chinese, Japannese en Koreaans; GPT-SoVITS hanteer Chinese, Japannese, Koreaanse en Engelse; en MeloTTS ondersteun Engels, Spaans, Frans, Chinees, Japannees en Koreaans.

Ja. Alle verwerking gebeur op ons toegewyde GPU bedieners. Ons stoor nie jou teks invoer of genereer klank na aflewering nie. Oplaai stemmonsters vir kloning word slegs gebruik vir die huidige sessie en word nie behou nie. Ons deel nooit jou data met derde partye of gebruik dit om modelle op te lei nie.

Ja. Al die oudio wat op TTS.ai opgewek word, is joune om kommersieel te gebruik, onder andere vir YouTube video's, poste, oudioboeke, - apps, advertensies en produkte. Ons modelle is oop bron onder permissiewe lisensies (MIT, Apaches 2.0). Geen koninklikes of verklaring nodig nie.

TTS.ai genereer klank in WAV formaat deur verstek vir maksimum kwaliteit. Jy kan skakel na MP3, FLAC, OG, of M4A te gebruik ons vry Audio Omskakelaar program. Die API ondersteun spesifiseer jou verkies uitset formaat direk in die versoek.

Oplaai 'n kort klankmonster (so min as 5 sekondes) van die stem wat jy wil kloon, en tik dan enige teks om spraak in daardie stem op te wek. Modelle soos Chatterbox, GPT- SoVITS en CosyVoice 2 ondersteun stemkloning. Die gekloonde stem vang toon, aksent en praatstyl.

Vry modelle (Kokoro, Pyper, VITS, MloTTS) vereis geen rekening nie en kos nul karakters. Standaard modelle (2 000 karakters/1K toevoer) sluit in Bark, CosyVoice 2, F5-TTS, en Dia. Premium modelle (4 000 karakters/1K toevoer) sluit OpenVoice, Chatbox, StylTTS en Torise. Paid modelle bied gewoonlik hoër kwaliteit, meer stemme en bykomende kenmerke soos clon.

Ja. Die API ondersteun klomp verwerking vir omskakeling van groot bundels van teks na spraak. Instuur veelvuldige versoeke en onttrek resultate asynchronous te gebruik werk UUIDs. Ondernemingsplanne ($99/mo) sluit prioriteit wagtou toegang in vir vinniger versameling. Ideale vir klankboekproduksie, natuurlik inhoud en groot-skaal stemoor projekte.
4.0/5 (22)

U terugvoer help ons om geskille reg te stel.

Begin vandag met die gebruik van KI-stem

Sluit by skeppers, ontwikkelaars en sakeondernemings aan deur TTS.ai te gebruik