Vry Kunsmatige inteligensie Teks vir spraak

33+ oop-seurce modelle, 273+ stemme, 33+ tale. Geen rekening benodig.

18K+
Konfigators
71K+
geslagte
33+
Kunsmatige inteligensie modelle
273+
stemme
0/500 karakters · Teken 5 000 per geslag aan → Beskikbaar
5 000 karakters per geslag 15 000 vry karakters Geen kredietkaart nie Kommersiële gebruik OK
Teken gratis op
Aflaai klaar gemaak Skakel verstrek in 24h
Liefde TTS.ai, vertel jou vriende!

33+ Aol Oombliklike Boodskapper KliÃ"ntComment

Die omvattendste versameling van ope-onsorce TTS modelle in een platform

KokoroKokoro Beskikbaar

Kokoro is 'n 82 miljoen parameter teks-tot-sech model wat goed bo sy gewigsklas slaan. Ondanks sy klein grootte produseer dit merkwaardig natuurlike en drukende spraak. Kokoro ondersteun veelvuldige tale, insluitende Engels, Japannees, Chinese en Koreaans met 'n verskeidenheid van drukende stemme. Dit loop ongelooflik vinnige gtk om klank byna 100x vinniger as werklike-tyd op 'n GPU.

Beste vir: Hoog-kwaliteit TTS met minimale laatncy, stroomende toepassings

Probeer vry

PiperPiper Beskikbaar

Pyper is 'n ligte teks-tot-sech-enjin wat ontwikkel word deur Rhasspy wat VITS en strottemat argitektuur gebruik. Dit loop geheel en al op Sve, maak dit ideaal vir rand toestelle, tuis outomatisering en programme wat vanlyn TTS vereis. Met meer as 100 stemme oor 30+ tale, Pypr gee natuurlike-klank spraak teen regte-tyd versnel selfs op 'n Rapberberry Pi 4.

Beste vir: Vinnige voorskoue, toeganklikheid en ingebedde programme

Probeer vry

VITSVITS Beskikbaar

VITS (Variational Inference met adversariële leer vir einde-na-einde Teks-na-Spech) is 'n parallelle einde-na-end TTS metode wat veroorsaak meer natuurlike klank klank klank klank klank as huidige twee-fatsoens modelle. Dit neem variasie aan wat aangevul word met normale vloei en 'n adversariële opleiding proses, wat 'n aansienlike verbetering in natuurlike ontwikkeling tot gevolg het.

Beste vir: General-purpose teks- to-sech met natuurlike prosody

Probeer vry

MeloTTSMeloTTS Beskikbaar

MetoTTS deur MyShel.ai is 'n veeltalige TTS-biblioteek wat Engels ondersteun (Amerikaanse, Britse, Indiese, Australiese), Spaans, Frans, Chinees, Japannees en Koreaans. Dit is uiters vinnig, verwerking van teks teen amper werklike-tyd spoed op Sve alleen. MetoTTS is ontwerp om Sve sowel as GPUference te vervaardig en te ondersteun.

Beste vir: Produksietoepassings wat vinnige, veeltalige TTS nodig het

Probeer vry

Kani TTS 2Kani TTS 2 Beskikbaar

Kani-TTS-2 deur NegeNineSix is 'n ultraliggewig 400M parameter model wat gebou is op 'n vloeistof-KI LFM2 ruggraat met NVIDIA NanoCodec. Dit loop in slegs 3GB VRAM en bring ~10 sekondes van spraak in ~2 sekondes op' n A100 (RTF 0. 2). Die huidige publieke vrystelling van skepe 'n Engelse- alleen igitani-ts-2-enpologikapunt en doen nie die luidspreker wat nodig is vir die clovall-fel (RTances).

Beste vir: Vinnige Engelse geslag op lae-VRAM hardeware, vinnige voorskoue

Probeer vry

OuteTTSOuteTTS Beskikbaar

OuteTTS brei groot taal modelle uit met teks-na-sech vermoëns terwyl dit die oorspronklike argitektuur bewaar. Dit ondersteun veelvuldige agterkant met inbegrip van llama.cpp (CPU/GPU), Hugging Fac Transformeerders, ExLlamaV2, VLM, en selfs blaaier inferensie deur Transformateerders.js. Kenmerke nul- hot stem kloning deur profiele gestoor as JSON.

Beste vir: Randverwerking, blaaier gebaseerde TTS, lae-reservering omgewings

Probeer vry

Pocket TTSPocket TTS Beskikbaar

Picket TTS deur Kjoetai (skeptore van Moshi) is 'n kompak 100M parameter teks-na-sech model wat hard bo sy gewig slaan. Dit loop doeltreffend op SVE, ondersteun nul-afstand stem kloning van' n enkele klankmonster, en vervaardig natuurlike-klank spraak. Die klein model grootte maak dit ideaal vir randverwerking en lae-reurce omgewings.

Beste vir: Ligtegewig ontplooiing, CPU- alleen omgewing, vinnige stem kloning

Probeer vry

Kitten TTSKitten TTS Beskikbaar

Kitten TTS deur KittenML is 'n ultraliggewig teks-na-sech model wat op ONNX gebou is. Met variante van 15M tot 80M parameters (25-80 mb op die skyf), lewer dit hoë-vlak stemsinte op CPU sonder om 'n GPU te vereis. Kenmerke 8 ingeboude stemme, verstelbare spraakspoed en ingeboude teksvoorwerk vir getalle, kurie, eenhede en eenhede.

Beste vir: Vinnige ligte TTS, rand ontplooiing, lae- doen aansoeke

Probeer vry

Ming-Omni TTSMing-Omni TTS Beskikbaar

Ming-omni-tts- 0,5B deur sluitingAI is 'n kompak omni-modal spraak model wat gebou is op die BailingM- dig ruggraat met' n Lap-by-Patch-vloei- Compressed-mading klank dekodeerder. Aflewerings 44. 1kHz uitset (naby CD-kwaliteit), ondersteun zero-afstand stem kloning van 'n 3+ tweede verwysing, en sluit in ingeboude emosie / dialek / BGM beheer deur middel van die instruksies JSON. Uitstekende l3% lin' n Chinese bankie.

Beste vir: Hoog-fideliteit tweetalige vertelling, emosiebeheer stem toneelwerk, Chinese klankboek inhoud

Probeer vry

MOSS-TTS NanoMOSS-TTS Nano Beskikbaar

MOSS-TTS-Nano-100M is OpenMOSS se kompak 100M-parameter variant van die MOS-TTS-familie, deel die vertraging-transformer argitektuur. Handels die 8B model se hoogste kwaliteit vir ~80x kleiner gewigte en aansienlik laer per-request VRAM, wat dit geskik maak vir vryter- en hoë-deurverdragings. Dieselfde 20-taal bereik.

Beste vir: Free-tier TTS, hoÃ"- volmeme produksie, lae- doen interaktiewe gebruik

Probeer vry

BarkBark Kalender

Transformeer-gebaseerde teks-na-audiomodel wat realistiese spraak, musiek en klank effekte voortbring.

Ontwikkelaar: Suno · Lisensie: MIT

Probeer dit

Bark SmallBark Small Kalender

Ligter weergawe van Bark met vinniger inferensie en laer geheuegebruik.

Ontwikkelaar: Suno · Lisensie: MIT

Probeer dit

CosyVoice 2CosyVoice 2 Kalender

Alibaba se kalableging TTS met menslike-pariteit natuurlike en naby-nu-Letncy.

Ontwikkelaar: Alibaba (Tongyi Lab) · Lisensie: Apache 2.0

Probeer dit

Dia TTSDia TTS Kalender

Multi- Conder dialoog model wat skep natuurlike gesprekke tussen sprekers.

Ontwikkelaar: Nari Labs · Lisensie: Apache 2.0

Probeer dit

Parler TTSParler TTS Kalender

Beskryf die stem wat jy in natuurlike taal wil hê en Paler genereer ooreenstemmende spraak.

Ontwikkelaar: Hugging Face · Lisensie: Apache 2.0

Probeer dit

IndexTTS-2IndexTTS-2 Kalender

Nul-skoot TTS met fyngewortelde emosiebeheer en hoë uitdrukkings.

Ontwikkelaar: Index Team · Lisensie: Bilibili Model License

Probeer dit

Spark TTSSpark TTS Kalender

Stemkloning TTS met beheerbare emosie en spraakstyl deur middel van aansporings.

Ontwikkelaar: SparkAudio · Lisensie: CC BY-NC-SA 4.0

Probeer dit

GPT-SoVITSGPT-SoVITS Kalender

Min-skoot stem kloning TTS wat enige stem van net 5 sekondes van oudio naboots.

Ontwikkelaar: RVC-Boss · Lisensie: MIT

Probeer dit

OrpheusOrpheus Kalender

Mens-vlak emosionele TTS model opgelei op 100K ure se spraak data.

Ontwikkelaar: Canopy Labs · Lisensie: Llama 3.2 Community

Probeer dit

Qwen3 TTSQwen3 TTS Kalender

Alibaba se veeltalige TTS met voorafgestelde stemme en stemontwerp uit teks.

Ontwikkelaar: Alibaba (Qwen) · Lisensie: Apache 2.0

Probeer dit

VieNeu-TTS-v2VieNeu-TTS-v2 Kalender

Viëtnamese + Engelse kode-switching TTS met 7 voorafgestelde stemme en nul-skoot stem kloning. Sve-net, nee GPU benodig.

Ontwikkelaar: Phạm Nguyễn Ngọc Bảo · Lisensie: Apache 2.0

Probeer dit

Chatterbox TurboChatterbox Turbo Kalender

Vinniger Chatterbox met sub-200m laatncy en paralinguistiese merkers vir lag, hoes, en nog meer.

Ontwikkelaar: Resemble AI · Lisensie: MIT

Probeer dit

VoxCPMVoxCPM Kalender

Tokenizer-free TTS produseer 44. 1kHz-oudio met konteks-aware paragraaf konsekwentheid.

Ontwikkelaar: OpenBMB · Lisensie: Apache 2.0

Probeer dit

VibeVoiceVibeVoice Kalender

Microsoft model vir lang-vorm multi-praater inhoud soos pudcaste en oudioboeke.

Ontwikkelaar: Microsoft · Lisensie: MIT

Probeer dit

CosyVoice3CosyVoice3 Kalender

Volgende geslag veeltalige TTS met bi-stroom, emosie beheer, en nul-kie stem kloning.

Ontwikkelaar: Alibaba (FunAudioLLM) · Lisensie: Apache 2.0

Probeer dit

NAMAA Saudi TTSNAMAA Saudi TTS Kalender

Eers open Saoedi-Arabies TTS. Indiaanse Saoediese dialek met Chaterbox-quarity stem kloning.

Ontwikkelaar: NAMAA Space · Lisensie: MIT

Probeer dit

Darwin TTSDarwin TTS Kalender

Kruis-modal Qwen3-TTS-varing met FFN gewigs vermeng van die Qwen3- 1. 7B-taal model vir skerper veeltalige kloning.

Ontwikkelaar: FINAL-Bench · Lisensie: Apache 2.0

Probeer dit

MOSS-TTSDMOSS-TTSD Kalender

Multi- Consion- Contraction model verbly cacated- style gesprekke met tot 5 sprekers en 60 minute van samehangende oudio.

Ontwikkelaar: OpenMOSS · Lisensie: Apache 2.0

Probeer dit

ChatterboxChatterbox Premium

State-van-die-art nul-skoot stem kloning met emosie kontrole van Resemble-KI.

Kwaliteit:

Probeer dit

Tortoise TTSTortoise TTS Premium

Multi- fax- to-sech gefokus op kwaliteit met outoregressiewe argitektuur.

Kwaliteit:

Probeer dit

StyleTTS 2StyleTTS 2 Premium

Human-vlak teks-na-sech deur styl diffusie en adversariële opleiding.

Kwaliteit:

Probeer dit

OpenVoiceOpenVoice Premium

Onmiddellike stem kloning met granulêre beheer oor styl, emosie en aksent.

Kwaliteit:

Probeer dit

Sesame CSMSesame CSM Premium

Gesprekvoeringsmodel skep natuurlike dialoog met gepaste tydsberekening en emosie.

Kwaliteit:

Probeer dit

CosyVoice 2CosyVoice 2

Alibaba se kalableging TTS met menslike-pariteit natuurlike en naby-nu-Letncy.

Tale: en, zh, ja, ko, fr, de, it, es

Geveinsde stem

IndexTTS-2IndexTTS-2

Nul-skoot TTS met fyngewortelde emosiebeheer en hoë uitdrukkings.

Tale: en, zh

Geveinsde stem

Spark TTSSpark TTS

Stemkloning TTS met beheerbare emosie en spraakstyl deur middel van aansporings.

Tale: en, zh

Geveinsde stem

GPT-SoVITSGPT-SoVITS

Min-skoot stem kloning TTS wat enige stem van net 5 sekondes van oudio naboots.

Tale: en, zh, ja, ko

Geveinsde stem

ChatterboxChatterbox

State-van-die-art nul-skoot stem kloning met emosie kontrole van Resemble-KI.

Tale: en

Geveinsde stem

Tortoise TTSTortoise TTS

Multi- fax- to-sech gefokus op kwaliteit met outoregressiewe argitektuur.

Tale: en

Geveinsde stem

OpenVoiceOpenVoice

Onmiddellike stem kloning met granulêre beheer oor styl, emosie en aksent.

Tale: en, zh, ja, ko, fr, es

Geveinsde stem

VieNeu-TTS-v2VieNeu-TTS-v2

Viëtnamese + Engelse kode-switching TTS met 7 voorafgestelde stemme en nul-skoot stem kloning. Sve-net, nee GPU benodig.

Tale: vi, en

Geveinsde stem

Chatterbox TurboChatterbox Turbo

Vinniger Chatterbox met sub-200m laatncy en paralinguistiese merkers vir lag, hoes, en nog meer.

Tale: en

Geveinsde stem

VoxCPMVoxCPM

Tokenizer-free TTS produseer 44. 1kHz-oudio met konteks-aware paragraaf konsekwentheid.

Tale: en, zh

Geveinsde stem

OuteTTSOuteTTS

LM-gebaseerde TTS wat op Sve, GPU, of blaaier via llama loop.cpp and Transformators.js.

Tale: en

Geveinsde stem

Pocket TTSPocket TTS

Liggewig 100M parameter model deur Kujoetai met stem kloning van een monster.

Tale: en, fr

Geveinsde stem

CosyVoice3CosyVoice3

Volgende geslag veeltalige TTS met bi-stroom, emosie beheer, en nul-kie stem kloning.

Tale: en, zh, ja, ko, de, es, fr, it, ru

Geveinsde stem

NAMAA Saudi TTSNAMAA Saudi TTS

Eers open Saoedi-Arabies TTS. Indiaanse Saoediese dialek met Chaterbox-quarity stem kloning.

Tale: ar

Geveinsde stem

Darwin TTSDarwin TTS

Kruis-modal Qwen3-TTS-varing met FFN gewigs vermeng van die Qwen3- 1. 7B-taal model vir skerper veeltalige kloning.

Tale: en, ko, ja, zh

Geveinsde stem

MOSS-TTSDMOSS-TTSD

Multi- Consion- Contraction model verbly cacated- style gesprekke met tot 5 sprekers en 60 minute van samehangende oudio.

Tale: en, zh

Geveinsde stem

Ming-Omni TTSMing-Omni TTS

Kompak 0,5B omni-modale spraakmodel van ingesluiteAI met hoë-deloosheid 44.1kHz afvoer en zero-kie stem kloning.

Tale: en, zh

Geveinsde stem

MOSS-TTS NanoMOSS-TTS Nano

Klein 100M MOS-TTS-varing dieselfde argitektuur, 80x kleiner, vryer laatncy.

Tale: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Geveinsde stem

ontwikkelaar- First API

OpenAI- versoenbaar met REST API. Een punt, 22+ modelle. Stroom ondersteuning vir werklike programme.

  • OpenAI- versoenbaarte formaat
  • Stroom TTS vir regte tyd apps
  • Moenie vir groot werk verwerk word nie
  • WebwerweName
Besigtig API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Eenvoudig, deurskynend

Begin vry. Skaal namate jy groei.

Beskikbaar

$0

15 000 karakters + 5 000/dag

  • 7 gratis modelle, waaronder Kokoro
  • 5 000 karakters per geslag
  • API toegang het ingesluit
Meld aan om vry te wees

Beginer

$9/mo

500 krediete/onth

  • Al 22+ modelle
  • 100 000 chars per geslag
  • Stemverkleuring
Begin
Die gewildste

Pro

$29/mo

2 000 krediete/month

  • Alles in Beginler
  • API-toegang
  • Prioriteitverwerking
Kry Pro

Besigheid

$99/mo

10 000 krediete/onth

  • Alles in Procrect
  • Grootmaat API
  • Prioriteit wagtou
Kry sake

Bekyk alle planne met inbegrip van karakterpakkies →

Vrae wat dikwels gevra word

TTS.ai is die omvattendste KI-klankplatform, bied 22+ teks-na-sech modelle, stemkloning, spraak-tot-teks en oudiogereedskap aan. Alle modelle is oop bron met geen verkoper slot-in nie.

Yes! TTS.ai offers free text-to-speech with Kokoro, Piper, VITS, and MeloTTS models. No account required. Sign up to get 15,000 free characters and access all models. Paid plans start at $9/month.

Vir spoed, gebruik Kokoro of Piper. Vir kwaliteit, probeer CosyVoice 2 of StyltTS 2. Vir stem kloning, gebruik Chatterbox of GPT-SoVITS. Vir dialoog, gebruik Dia TTS. Probeer veelvuldige modelle op dieselfde teks om te vergelyk.

Ja. OpenAI- compatible RST API vir TTS, STT, stem kloning en oudiogereedskap. Sluit elke plan in, insluitend vry, met tempo beperk wat vlak (V: 10 req/min, Lite: 20, Beginler: 30 Pro: 60, Business: 300). Besigtig dokumentasie by tts.ai/api/.

Stem kwaliteit wissel deur model. Premium modelle soos CosyVoice 2, StylTTS 2, en Chaterbox produseer naby-menslike kwaliteitsrede met natuurlike intonasie en emosie. Vry modelle soos Kokoro bied uitstekende kwaliteit vir die meeste gebruik van gevalle.

TTS.ai ondersteun 30+ tale oor sy modelbiblioteek. Engels het die breedste model ondersteun, maar modelle soos CosyVice 2 dek Chinese, Japannese en Koreaans; GPT-SoVITS hanteer Chinese, Japannese, Koreaanse en Engelse; en MeloTTS ondersteun Engels, Spaans, Frans, Chinees, Japannees en Koreaans.

Ja. Alle verwerking gebeur op ons toegewyde GPU bedieners. Ons stoor nie jou teks invoer of genereer klank na aflewering nie. Oplaai stemmonsters vir kloning word slegs gebruik vir die huidige sessie en word nie behou nie. Ons deel nooit jou data met derde partye of gebruik dit om modelle op te lei nie.

Ja. Al die oudio wat op TTS.ai opgewek word, is joune om kommersieel te gebruik, onder andere vir YouTube video's, poste, oudioboeke, - apps, advertensies en produkte. Ons modelle is oop bron onder permissiewe lisensies (MIT, Apaches 2.0). Geen koninklikes of verklaring nodig nie.

TTS.ai genereer klank in WAV formaat deur verstek vir maksimum kwaliteit. Jy kan skakel na MP3, FLAC, OG, of M4A te gebruik ons vry Audio Omskakelaar program. Die API ondersteun spesifiseer jou verkies uitset formaat direk in die versoek.

Oplaai 'n kort klankmonster (so min as 5 sekondes) van die stem wat jy wil kloon, en tik dan enige teks om spraak in daardie stem op te wek. Modelle soos Chatterbox, GPT- SoVITS en CosyVoice 2 ondersteun stemkloning. Die gekloonde stem vang toon, aksent en praatstyl.

Vry modelle (Kokoro, Pyper, VITS, MloTTS) vereis geen rekening nie en kos nul karakters. Standaard modelle (2 000 karakters/1K toevoer) sluit in Bark, CosyVoice 2, F5-TTS, en Dia. Premium modelle (4 000 karakters/1K toevoer) sluit OpenVoice, Chatbox, StylTTS en Torise. Paid modelle bied gewoonlik hoër kwaliteit, meer stemme en bykomende kenmerke soos clon.

Ja. Die API ondersteun klomp verwerking vir omskakeling van groot bundels van teks na spraak. Instuur veelvuldige versoeke en onttrek resultate asynchronous te gebruik werk UUIDs. Die Besigheid plan ($99/mo) en hoër sluit toegang tot vinniger verwerking in. Ideale vir klankboek produksie, natuurlik inhoud en groot-skaal stemoor projekte.
4.1/5 (42)

U terugvoer help ons om geskille reg te stel.

Begin vandag met die gebruik van KI-stem

Sluit by skeppers, ontwikkelaars en sakeondernemings aan deur TTS.ai te gebruik