Prosti AI Besedilo v govor

20+ modeli odprtega izvora, 107+ glasovi, 32+ jeziki. Račun ni potreben.

1K+
ustvarjalci
2K+
generacije
20+
AI modeli
107+
glasovi
0/500 znaki Prosto
Like TTS.ai? Tell your friends!

20+ AI Glasovni modeli

Najobsežnejša zbirka modelov TTS na odprtem viru v eni platformi

KokoroKokoro Free

Kokoro je 82 milijonov parametrov besedila do jezika modela, ki udarja veliko nad svojo težo razreda. Kljub svoji majhni velikosti, proizvaja izredno naravno in izrazito govor. Kokoro podpira več jezikov, vključno angleško, japonsko, kitajsko in korejsko z različnimi izrazitivne glasove. Teče neverjetno hitro – ustvarjanje avdio skoraj 100x hitreje kot v realnem času na GPU.

Najboljše za: visokokakovostni TTS z minimalno latenco, streaming aplikacije

Poskusite svobodno

PiperPiper Free

Piper je lahek tekst-to-speech motor, ki ga je razvil Rhaspy, ki uporablja VITS in grla arhitekture. To deluje v celoti na CPU, kar je idealen za robne naprave, hišna avtomatizacija in aplikacije, ki zahtevajo offline TTS. Z več kot 100 glasov v 30+ jezikih, Piper zagotavlja naravno-zvočni govor pri hitrosti v realnem času tudi na Raspberry Pi 4.

Najboljše za: Hitri pregledi, dostopnost in vgrajeni programi

Poskusite svobodno

VITSVITS Free

VITS (Variacionalni sklepi z nasprotnim učenjem za končni na koncu besedila v govor) je vzporedna metoda TTS od konca do konca, ki ustvarja bolj naravni zvočni zvok kot trenutni dvostopenjski modeli. Prevzema variacijski zaključek, ki se povečuje z normalizacijskimi tokovi in procesom vertikalnega usposabljanja, ki doseže znatno izboljšanje narave.

Najboljše za: Splošni namenski tekstilni govor z naravno prozodijo

Poskusite svobodno

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai je večjezična knjižnica TTS, ki podpira angleščino (ameriški, britanski, indijski, avstralski), španski, francoski, kitajski, japonski in korejski. Je izjemno hitro, obdelava besedila z skoraj realno hitrostjo samo na CPU. MeloTTS je zasnovan za uporabo v proizvodnji in podpira tako CPU in GPU zaključek.

Najboljše za: Zahtevki za proizvodnjo, ki potrebujejo hitro, večjezično TTS

Poskusite svobodno

BarkBark Standard

Transformer-na-audio model, ki ustvarja realen govor, glasbo in zvočne učinke.

Razvijalec: Suno · Licenca: MIT

Poskusi.

Bark SmallBark Small Standard

Lažja različica Barka z hitrejšim zaključkom in manjšim uporabo pomnilnika.

Razvijalec: Suno · Licenca: MIT

Poskusi.

CosyVoice 2CosyVoice 2 Standard

Alibabov skalabilni TTS s človeško pariteto naravo in skoraj nula latencijo.

Razvijalec: Alibaba (Tongyi Lab) · Licenca: Apache 2.0

Poskusi.

Dia TTSDia TTS Standard

Večzvočniški dialogski model, ki ustvarja naravne pogovore med zvočniki.

Razvijalec: Nari Labs · Licenca: Apache 2.0

Poskusi.

Parler TTSParler TTS Standard

Opišite glas, ki ga želite v naravnem jeziku in Parler ustvarja enak govor.

Razvijalec: Hugging Face · Licenca: Apache 2.0

Poskusi.

GLM-TTSGLM-TTS Standard

Doseže najnižjo stopnjo znakovnih napak med modeli TTS odprtega izvora.

Razvijalec: Zhipu AI · Licenca: GLM-4 License

Poskusi.

IndexTTS-2IndexTTS-2 Standard

Zero strelja TTS z dobro zrelim nadzorom čustev in visoko izrazitostjo.

Razvijalec: Index Team · Licenca: Bilibili Model License

Poskusi.

Spark TTSSpark TTS Standard

Glasovno kloniranje TTS z nadzorovanimi čustvi in govorniški slog prek nasvetov.

Razvijalec: SparkAudio · Licenca: CC BY-NC-SA 4.0

Poskusi.

GPT-SoVITSGPT-SoVITS Standard

Nekajkratno kloniranje glasu TTS, ki replicira vsak glas iz samo 5 sekund zvoka.

Razvijalec: RVC-Boss · Licenca: MIT

Poskusi.

OrpheusOrpheus Standard

Emocionalni TTS model na človeški ravni je izurjen na 100K urah govora.

Razvijalec: Canopy Labs · Licenca: Llama 3.2 Community

Poskusi.

Qwen3 TTSQwen3 TTS Standard

Alibabov večjezični TTS z kloniranjem glasu, predstavljenimi glasovi in oblikovanjem glasu iz besedila.

Razvijalec: Alibaba (Qwen) · Licenca: Apache 2.0

Poskusi.

ChatterboxChatterbox Premium

Najmodernejši kloniranje glasu z obvladovanjem čustev iz Resemble AI.

Kakovost:

Poskusi.

Tortoise TTSTortoise TTS Premium

Večglasno besedilo-to-speech osredotočen na kakovost z avtoregresivno arhitekturo.

Kakovost:

Poskusi.

StyleTTS 2StyleTTS 2 Premium

Z difuzijo sloga in nasprotnim usposabljanjem na ravni ljudi.

Kakovost:

Poskusi.

OpenVoiceOpenVoice Premium

Trenutno kloniranje glasu z granuliranim nadzorom nad slogom, čustvi in naglasom.

Kakovost:

Poskusi.

Sesame CSMSesame CSM Premium

Pogovorni model govora ustvarja naravni dialog z ustreznim časovnim razporedom in čustvi.

Kakovost:

Poskusi.

CosyVoice 2CosyVoice 2

Alibabov skalabilni TTS s človeško pariteto naravo in skoraj nula latencijo.

Jeziki: en, zh, ja, ko, fr, de, it, es

Klonov glas

GLM-TTSGLM-TTS

Doseže najnižjo stopnjo znakovnih napak med modeli TTS odprtega izvora.

Jeziki: en, zh

Klonov glas

IndexTTS-2IndexTTS-2

Zero strelja TTS z dobro zrelim nadzorom čustev in visoko izrazitostjo.

Jeziki: en, zh

Klonov glas

Spark TTSSpark TTS

Glasovno kloniranje TTS z nadzorovanimi čustvi in govorniški slog prek nasvetov.

Jeziki: en, zh

Klonov glas

GPT-SoVITSGPT-SoVITS

Nekajkratno kloniranje glasu TTS, ki replicira vsak glas iz samo 5 sekund zvoka.

Jeziki: en, zh, ja, ko

Klonov glas

ChatterboxChatterbox

Najmodernejši kloniranje glasu z obvladovanjem čustev iz Resemble AI.

Jeziki: en

Klonov glas

Tortoise TTSTortoise TTS

Večglasno besedilo-to-speech osredotočen na kakovost z avtoregresivno arhitekturo.

Jeziki: en

Klonov glas

OpenVoiceOpenVoice

Trenutno kloniranje glasu z granuliranim nadzorom nad slogom, čustvi in naglasom.

Jeziki: en, zh, ja, ko, fr, de, es, it

Klonov glas

Qwen3 TTSQwen3 TTS

Alibabov večjezični TTS z kloniranjem glasu, predstavljenimi glasovi in oblikovanjem glasu iz besedila.

Jeziki: en, zh, ja, ko, de, fr, ru, pt, es, it

Klonov glas

Razvijalec-prva API

Združljiv z OpenAI REST API. En opazovani dogodek, 22+ modeli. Pogon podpore za aplikacije v realnem času.

  • Združljiva z OpenAI formatom
  • Streaming TTS za aplikacije v realnem času
  • Serija obdelave za velika delovna mesta
  • Spletna obvestila
Poglejte API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Preprosta, pregledna cena

Začnite svobodno.

Prosto

$0

15 kreditov

  • Kokoro, Piper, VITS, MeloTTS
  • Omejitev 500 znakov
  • 3 gen/ur (brez računa)
Prosto se prijavite

Začetek

$9/Mo

500 kreditov/mesec

  • Vsi 22+ modeli
  • 100,000 chars per generation
  • Kloniranje glasu
Začnite
Najbolj priljubljeno

Prof.

$29/Mo

2.000 kreditov mesečno

  • Vse v zagonu
  • Dostop API
  • Prednostna obdelava
Get Prof

Podjetje

$99/Mo

10.000 kreditov/mesec

  • Vse v prof.
  • Masovni API
  • Prednostna vrstica
Poslovno pridobivanje

Oglejte si vse načrte, vključno z znaki →

Pogosta vprašanja

TTS.ai je najbolj celovita AI glasovna platforma, ki ponuja 22+ modelov besedila-na-špice, kloniranje glasu, govor-na-tekst in zvočna orodja. Vsi modeli so odprt vir brez priključka prodajalca.

Da! TTS.ai ponuja brezplačno besedilo-to-speech z modeli Kokoro, Piper, VITS in MeloTTS. Ni potreben račun. Prijavite se, da bi dobili 15.000 brezplačnih znakov in dostop do vseh modelov. Plačani načrti se začnejo z 9 $/mesec.

Za hitrost uporabite Kokoro ali Piper. Za kakovost poskusite CosyVoice 2 ali StyleTTS 2. Za kloniranje glasu uporabite Chatterbox ali GPT-SoviTS. Za dialog uporabite Dia TTS. Primerjajte več modelov v istem besedilu.

Da. Združljiv z OpenAI REST API za TTS, STT, glasovno kloniranje in zvočno orodje. Na voljo na Pro (29/mo) in Enterprise ($99/mo) načrtih. Poglej dokumentacijo na tts.ai/api /.

Kvaliteta glasu se razlikuje po modelu.Premium modeli, kot je CosyVoice 2, StyleTTS 2, in Chatterbox proizvajajo skoraj človeški kakovostni govor z naravnim intonacijo in čustvi. Brezplačni modeli kot Kokoro ponujajo odlično kakovost za večino primerov uporabe.

TTS.ai podpira 30+ jezikov v svoji modelski knjižnici. Angleški ima najširši model podpore, vendar modeli kot CosyVoice 2 naslovnica kitajske, japonske in korejske; GPT-SoviTS upravlja kitajsko, japonsko, korejsko in angleško; in MelotTS podpira angleško, špansko, francosko, kitajsko, japonsko in korejsko.

Da. Vse obdelava se zgodi na naših namenskih strežnikih GPU. Ne shranjujemo vnosa vašega besedila ali ustvariti zvoka po dostavi. Nalagani glasovni vzorci za kloniranje se uporabljajo samo za trenutno sejo in niso obdržani. Vaši podatki nikoli ne delimo s tretjimi stranmi ali jih uporabljamo za usposabljanje modelov.

Da. Vsi zvočniki, ki so ustvarjeni na TTS.ai je vaš za komercialno uporabo, vključno z YouTube video posnetki, podcasti, audioknjige, aplikacije, oglasi in izdelki. Naši modeli so odprt vir pod popustnimi licencami (MIT, Apache 2.0). Ni potreben licenčnine ali pripis.

TTS.ai ustvarja zvok v WAV formatu privzeto za maksimalno kakovost. Lahko pretvorite v MP3, FLAC, OGG, ali M4A z uporabo našega brezplačnega orodja Audio Converter. API podpira navedbo vaše prednostne izhodne oblike neposredno v zahtevi.

Pošljite kratek zvočni vzorec (najmanj 5 sekund) glasu, ki ga želite klonirati, nato vpišite katero koli besedilo za ustvarjanje govora v tem glasu. Modeli, kot so Chatterbox, GPT-SoviTS in CosyVoice 2 podpira kloniranje glasu. Klonirani glas zajema ton, naglas in govorni stil.

Brezplačni modeli (Kokoro, Piper, VITS, MeloTTS) ne zahtevajo nikakršnih računov in stroškov. Standardni modeli (2.000 znakov/1K vnos) vključujejo Bark, CosyVoice 2, F5-TTS in Dia. Premium modeli (4.000 znakov/1K vnosov) vključujejo OpenVoice, Chatterbox, StyleTTS 2 in Tortoise. Plačani modeli na splošno ponujajo višjo kakovost, več glasov in dodatne funkcije, kot je kloniranje glasu.

Da. API podpira obdelavo serije za pretvorbo velike količine besedila v govor. Pošljite več zahtev in dobite rezultate asinhronizirano z uporabo delovnega mesta UUIDs. Podjetniški načrti (99 $/mo) vključujejo prednostni dostop v vrsto za hitrejše obdelavo serije. Idealno za produkcijo zvočnih knjig, vsebino tečaja in obsežno glasovno-preglednih projektov.
4.0/5 (8)

Začnite uporabljati AI glas danes

Pridružite se ustvarjalcem, razvijalcem in podjetjem z uporabo TTS.ai