Vry Kunsmatige inteligensie Teks vir spraak

20+ oop-seurce modelle, 107+ stemme, 32+ tale. Geen rekening benodig.

1K+
Konfigators
2K+
geslagte
20+
Kunsmatige inteligensie modelle
107+
stemme
0/500 karakters Beskikbaar
5 000 karakters per geslag 15 000 vry karakters Geen kredietkaart nie Kommersiële gebruik OK
Teken gratis op
0:00 / 0:00
Aflaai klaar gemaak Skakel verstrek in 24h
Soos TTS.ai, vertel jou vriende!

20+ Aol Oombliklike Boodskapper KliÃ"ntComment

Die omvattendste versameling van ope-onsorce TTS modelle in een platform

KokoroKokoro Free

Kokoro is 'n 82 miljoen parameter teks-tot-sech model wat goed bo sy gewigsklas slaan. Ondanks sy klein grootte produseer dit merkwaardig natuurlike en drukende spraak. Kokoro ondersteun veelvuldige tale, insluitende Engels, Japannees, Chinese en Koreaans met 'n verskeidenheid van drukende stemme. Dit loop ongelooflik vinnige gtk om klank byna 100x vinniger as werklike-tyd op 'n GPU.

Beste vir: Hoog-kwaliteit TTS met minimale laatncy, stroomende toepassings

Probeer vry

PiperPiper Free

Pyper is 'n ligte teks-tot-sech-enjin wat ontwikkel word deur Rhasspy wat VITS en strottemat argitektuur gebruik. Dit loop geheel en al op Sve, maak dit ideaal vir rand toestelle, tuis outomatisering en programme wat vanlyn TTS vereis. Met meer as 100 stemme oor 30+ tale, Pypr gee natuurlike-klank spraak teen regte-tyd versnel selfs op 'n Rapberberry Pi 4.

Beste vir: Vinnige voorskoue, toeganklikheid en ingebedde programme

Probeer vry

VITSVITS Free

VITS (Variational Inference met adversariële leer vir einde-na-einde Teks-na-Spech) is 'n parallelle einde-na-end TTS metode wat veroorsaak meer natuurlike klank klank klank klank klank as huidige twee-fatsoens modelle. Dit neem variasie aan wat aangevul word met normale vloei en 'n adversariële opleiding proses, wat 'n aansienlike verbetering in natuurlike ontwikkeling tot gevolg het.

Beste vir: General-purpose teks- to-sech met natuurlike prosody

Probeer vry

MeloTTSMeloTTS Free

MetoTTS deur MyShel.ai is 'n veeltalige TTS-biblioteek wat Engels ondersteun (Amerikaanse, Britse, Indiese, Australiese), Spaans, Frans, Chinees, Japannees en Koreaans. Dit is uiters vinnig, verwerking van teks teen amper werklike-tyd spoed op Sve alleen. MetoTTS is ontwerp om Sve sowel as GPUference te vervaardig en te ondersteun.

Beste vir: Produksietoepassings wat vinnige, veeltalige TTS nodig het

Probeer vry

BarkBark Standard

Transformeer-gebaseerde teks-na-audiomodel wat realistiese spraak, musiek en klank effekte voortbring.

Ontwikkelaar: Suno · Lisensie: MIT

Probeer dit

Bark SmallBark Small Standard

Ligter weergawe van Bark met vinniger inferensie en laer geheuegebruik.

Ontwikkelaar: Suno · Lisensie: MIT

Probeer dit

CosyVoice 2CosyVoice 2 Standard

Alibaba se kalableging TTS met menslike-pariteit natuurlike en naby-nu-Letncy.

Ontwikkelaar: Alibaba (Tongyi Lab) · Lisensie: Apache 2.0

Probeer dit

Dia TTSDia TTS Standard

Multi- Conder dialoog model wat skep natuurlike gesprekke tussen sprekers.

Ontwikkelaar: Nari Labs · Lisensie: Apache 2.0

Probeer dit

Parler TTSParler TTS Standard

Beskryf die stem wat jy in natuurlike taal wil hê en Paler genereer ooreenstemmende spraak.

Ontwikkelaar: Hugging Face · Lisensie: Apache 2.0

Probeer dit

GLM-TTSGLM-TTS Standard

Kry die laagste karakter fout tempo onder oop-seurce TTS modelle.

Ontwikkelaar: Zhipu AI · Lisensie: GLM-4 License

Probeer dit

IndexTTS-2IndexTTS-2 Standard

Nul-skoot TTS met fyngewortelde emosiebeheer en hoë uitdrukkings.

Ontwikkelaar: Index Team · Lisensie: Bilibili Model License

Probeer dit

Spark TTSSpark TTS Standard

Stemkloning TTS met beheerbare emosie en spraakstyl deur middel van aansporings.

Ontwikkelaar: SparkAudio · Lisensie: CC BY-NC-SA 4.0

Probeer dit

GPT-SoVITSGPT-SoVITS Standard

Min-skoot stem kloning TTS wat enige stem van net 5 sekondes van oudio naboots.

Ontwikkelaar: RVC-Boss · Lisensie: MIT

Probeer dit

OrpheusOrpheus Standard

Mens-vlak emosionele TTS model opgelei op 100K ure se spraak data.

Ontwikkelaar: Canopy Labs · Lisensie: Llama 3.2 Community

Probeer dit

Qwen3 TTSQwen3 TTS Standard

Alibaba se veeltalige TTS met stemkloning, voorafgestelde stemme en stemontwerp uit teks.

Ontwikkelaar: Alibaba (Qwen) · Lisensie: Apache 2.0

Probeer dit

ChatterboxChatterbox Premium

State-van-die-art nul-skoot stem kloning met emosie kontrole van Resemble-KI.

Kwaliteit:

Probeer dit

Tortoise TTSTortoise TTS Premium

Multi- fax- to-sech gefokus op kwaliteit met outoregressiewe argitektuur.

Kwaliteit:

Probeer dit

StyleTTS 2StyleTTS 2 Premium

Human-vlak teks-na-sech deur styl diffusie en adversariële opleiding.

Kwaliteit:

Probeer dit

OpenVoiceOpenVoice Premium

Onmiddellike stem kloning met granulêre beheer oor styl, emosie en aksent.

Kwaliteit:

Probeer dit

Sesame CSMSesame CSM Premium

Gesprekvoeringsmodel skep natuurlike dialoog met gepaste tydsberekening en emosie.

Kwaliteit:

Probeer dit

CosyVoice 2CosyVoice 2

Alibaba se kalableging TTS met menslike-pariteit natuurlike en naby-nu-Letncy.

Tale: en, zh, ja, ko, fr, de, it, es

Geveinsde stem

GLM-TTSGLM-TTS

Kry die laagste karakter fout tempo onder oop-seurce TTS modelle.

Tale: en, zh

Geveinsde stem

IndexTTS-2IndexTTS-2

Nul-skoot TTS met fyngewortelde emosiebeheer en hoë uitdrukkings.

Tale: en, zh

Geveinsde stem

Spark TTSSpark TTS

Stemkloning TTS met beheerbare emosie en spraakstyl deur middel van aansporings.

Tale: en, zh

Geveinsde stem

GPT-SoVITSGPT-SoVITS

Min-skoot stem kloning TTS wat enige stem van net 5 sekondes van oudio naboots.

Tale: en, zh, ja, ko

Geveinsde stem

ChatterboxChatterbox

State-van-die-art nul-skoot stem kloning met emosie kontrole van Resemble-KI.

Tale: en

Geveinsde stem

Tortoise TTSTortoise TTS

Multi- fax- to-sech gefokus op kwaliteit met outoregressiewe argitektuur.

Tale: en

Geveinsde stem

OpenVoiceOpenVoice

Onmiddellike stem kloning met granulêre beheer oor styl, emosie en aksent.

Tale: en, zh, ja, ko, fr, de, es, it

Geveinsde stem

Qwen3 TTSQwen3 TTS

Alibaba se veeltalige TTS met stemkloning, voorafgestelde stemme en stemontwerp uit teks.

Tale: en, zh, ja, ko, de, fr, ru, pt, es, it

Geveinsde stem

ontwikkelaar- First API

OpenAI- versoenbaar met REST API. Een punt, 22+ modelle. Stroom ondersteuning vir werklike programme.

  • OpenAI- versoenbaarte formaat
  • Stroom TTS vir regte tyd apps
  • Moenie vir groot werk verwerk word nie
  • WebwerweName
Besigtig API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Eenvoudig, deurskynend

Begin vry. Skaal namate jy groei.

Beskikbaar

$0

15 krediete

  • Kokoro, Piper, VITS, MeloTTS
  • 500 karakterbeperking
  • 3 gen/hour (geen rekening)
Meld aan om vry te wees

Beginer

$9/mo

500 krediete/onth

  • Al 22+ modelle
  • 100 000 chars per geslag
  • Stemverkleuring
Begin
Die gewildste

Pro

$29/mo

2 000 krediete/month

  • Alles in Beginler
  • API-toegang
  • Prioriteitverwerking
Kry Pro

Besigheid

$99/mo

10 000 krediete/onth

  • Alles in Procrect
  • Grootmaat API
  • Prioriteit wagtou
Kry sake

Bekyk alle planne met inbegrip van karakterpakkies →

Vrae wat dikwels gevra word

TTS.ai is die omvattendste KI-klankplatform, bied 22+ teks-na-sech modelle, stemkloning, spraak-tot-teks en oudiogereedskap aan. Alle modelle is oop bron met geen verkoper slot-in nie.

Yes! TTS.ai offers free text-to-speech with Kokoro, Piper, VITS, and MeloTTS models. No account required. Sign up to get 15,000 free characters and access all models. Paid plans start at $9/month.

Vir spoed, gebruik Kokoro of Piper. Vir kwaliteit, probeer CosyVoice 2 of StyltTS 2. Vir stem kloning, gebruik Chatterbox of GPT-SoVITS. Vir dialoog, gebruik Dia TTS. Probeer veelvuldige modelle op dieselfde teks om te vergelyk.

Ja. OpenAI- compatible REST API vir TTS, STT, stemkloning en oudiogereedskap. Beskikbaar op Pro ($29/mo) en buiteneming ($99/mo) planne. Bekyk dokumentasie by tts.ai/api/.

Stem kwaliteit wissel deur model. Premium modelle soos CosyVoice 2, StylTTS 2, en Chaterbox produseer naby-menslike kwaliteitsrede met natuurlike intonasie en emosie. Vry modelle soos Kokoro bied uitstekende kwaliteit vir die meeste gebruik van gevalle.

TTS.ai ondersteun 30+ tale oor sy modelbiblioteek. Engels het die breedste model ondersteun, maar modelle soos CosyVice 2 dek Chinese, Japannese en Koreaans; GPT-SoVITS hanteer Chinese, Japannese, Koreaanse en Engelse; en MeloTTS ondersteun Engels, Spaans, Frans, Chinees, Japannees en Koreaans.

Ja. Alle verwerking gebeur op ons toegewyde GPU bedieners. Ons stoor nie jou teks invoer of genereer klank na aflewering nie. Oplaai stemmonsters vir kloning word slegs gebruik vir die huidige sessie en word nie behou nie. Ons deel nooit jou data met derde partye of gebruik dit om modelle op te lei nie.

Ja. Al die oudio wat op TTS.ai opgewek word, is joune om kommersieel te gebruik, onder andere vir YouTube video's, poste, oudioboeke, - apps, advertensies en produkte. Ons modelle is oop bron onder permissiewe lisensies (MIT, Apaches 2.0). Geen koninklikes of verklaring nodig nie.

TTS.ai genereer klank in WAV formaat deur verstek vir maksimum kwaliteit. Jy kan skakel na MP3, FLAC, OG, of M4A te gebruik ons vry Audio Omskakelaar program. Die API ondersteun spesifiseer jou verkies uitset formaat direk in die versoek.

Oplaai 'n kort klankmonster (so min as 5 sekondes) van die stem wat jy wil kloon, en tik dan enige teks om spraak in daardie stem op te wek. Modelle soos Chatterbox, GPT- SoVITS en CosyVoice 2 ondersteun stemkloning. Die gekloonde stem vang toon, aksent en praatstyl.

Vry modelle (Kokoro, Pyper, VITS, MloTTS) vereis geen rekening nie en kos nul karakters. Standaard modelle (2 000 karakters/1K toevoer) sluit in Bark, CosyVoice 2, F5-TTS, en Dia. Premium modelle (4 000 karakters/1K toevoer) sluit OpenVoice, Chatbox, StylTTS en Torise. Paid modelle bied gewoonlik hoër kwaliteit, meer stemme en bykomende kenmerke soos clon.

Ja. Die API ondersteun klomp verwerking vir omskakeling van groot bundels van teks na spraak. Instuur veelvuldige versoeke en onttrek resultate asynchronous te gebruik werk UUIDs. Ondernemingsplanne ($99/mo) sluit prioriteit wagtou toegang in vir vinniger versameling. Ideale vir klankboekproduksie, natuurlik inhoud en groot-skaal stemoor projekte.
4.0/5 (8)

Begin vandag met die gebruik van KI-stem

Sluit by skeppers, ontwikkelaars en sakeondernemings aan deur TTS.ai te gebruik