Prosti AI Besedilo v govor
20+ modeli odprtega izvora, 107+ glasovi, 32+ jeziki. Račun ni potreben.
Vse, kar potrebuješ za glasovno inteligenco
30+ orodja, ki jih poganjajo modeli AI z odprtim virom
20+ AI Glasovni modeli
Najobsežnejša zbirka modelov TTS na odprtem viru v eni platformi
Kokoro Free
Kokoro je 82 milijonov parametrov besedila do jezika modela, ki udarja veliko nad svojo težo razreda. Kljub svoji majhni velikosti, proizvaja izredno naravno in izrazito govor. Kokoro podpira več jezikov, vključno angleško, japonsko, kitajsko in korejsko z različnimi izrazitivne glasove. Teče neverjetno hitro – ustvarjanje avdio skoraj 100x hitreje kot v realnem času na GPU.
Najboljše za: visokokakovostni TTS z minimalno latenco, streaming aplikacije
Poskusite svobodno
Piper Free
Piper je lahek tekst-to-speech motor, ki ga je razvil Rhaspy, ki uporablja VITS in grla arhitekture. To deluje v celoti na CPU, kar je idealen za robne naprave, hišna avtomatizacija in aplikacije, ki zahtevajo offline TTS. Z več kot 100 glasov v 30+ jezikih, Piper zagotavlja naravno-zvočni govor pri hitrosti v realnem času tudi na Raspberry Pi 4.
Najboljše za: Hitri pregledi, dostopnost in vgrajeni programi
Poskusite svobodno
VITS Free
VITS (Variacionalni sklepi z nasprotnim učenjem za končni na koncu besedila v govor) je vzporedna metoda TTS od konca do konca, ki ustvarja bolj naravni zvočni zvok kot trenutni dvostopenjski modeli. Prevzema variacijski zaključek, ki se povečuje z normalizacijskimi tokovi in procesom vertikalnega usposabljanja, ki doseže znatno izboljšanje narave.
Najboljše za: Splošni namenski tekstilni govor z naravno prozodijo
Poskusite svobodno
MeloTTS Free
MeloTTS by MyShell.ai je večjezična knjižnica TTS, ki podpira angleščino (ameriški, britanski, indijski, avstralski), španski, francoski, kitajski, japonski in korejski. Je izjemno hitro, obdelava besedila z skoraj realno hitrostjo samo na CPU. MeloTTS je zasnovan za uporabo v proizvodnji in podpira tako CPU in GPU zaključek.
Najboljše za: Zahtevki za proizvodnjo, ki potrebujejo hitro, večjezično TTS
Poskusite svobodno
Bark Standard
Transformer-na-audio model, ki ustvarja realen govor, glasbo in zvočne učinke.
Razvijalec: Suno · Licenca: MIT
Poskusi.
Bark Small Standard
Lažja različica Barka z hitrejšim zaključkom in manjšim uporabo pomnilnika.
Razvijalec: Suno · Licenca: MIT
Poskusi.
CosyVoice 2 Standard
Alibabov skalabilni TTS s človeško pariteto naravo in skoraj nula latencijo.
Razvijalec: Alibaba (Tongyi Lab) · Licenca: Apache 2.0
Poskusi.
Dia TTS Standard
Večzvočniški dialogski model, ki ustvarja naravne pogovore med zvočniki.
Razvijalec: Nari Labs · Licenca: Apache 2.0
Poskusi.
Parler TTS Standard
Opišite glas, ki ga želite v naravnem jeziku in Parler ustvarja enak govor.
Razvijalec: Hugging Face · Licenca: Apache 2.0
Poskusi.
GLM-TTS Standard
Doseže najnižjo stopnjo znakovnih napak med modeli TTS odprtega izvora.
Razvijalec: Zhipu AI · Licenca: GLM-4 License
Poskusi.
IndexTTS-2 Standard
Zero strelja TTS z dobro zrelim nadzorom čustev in visoko izrazitostjo.
Razvijalec: Index Team · Licenca: Bilibili Model License
Poskusi.
Spark TTS Standard
Glasovno kloniranje TTS z nadzorovanimi čustvi in govorniški slog prek nasvetov.
Razvijalec: SparkAudio · Licenca: CC BY-NC-SA 4.0
Poskusi.
GPT-SoVITS Standard
Nekajkratno kloniranje glasu TTS, ki replicira vsak glas iz samo 5 sekund zvoka.
Razvijalec: RVC-Boss · Licenca: MIT
Poskusi.
Orpheus Standard
Emocionalni TTS model na človeški ravni je izurjen na 100K urah govora.
Razvijalec: Canopy Labs · Licenca: Llama 3.2 Community
Poskusi.
Qwen3 TTS Standard
Alibabov večjezični TTS z kloniranjem glasu, predstavljenimi glasovi in oblikovanjem glasu iz besedila.
Razvijalec: Alibaba (Qwen) · Licenca: Apache 2.0
Poskusi.
CosyVoice 2
Alibabov skalabilni TTS s človeško pariteto naravo in skoraj nula latencijo.
Jeziki: en, zh, ja, ko, fr, de, it, es
Klonov glas
GLM-TTS
Doseže najnižjo stopnjo znakovnih napak med modeli TTS odprtega izvora.
Jeziki: en, zh
Klonov glas
IndexTTS-2
Zero strelja TTS z dobro zrelim nadzorom čustev in visoko izrazitostjo.
Jeziki: en, zh
Klonov glas
Spark TTS
Glasovno kloniranje TTS z nadzorovanimi čustvi in govorniški slog prek nasvetov.
Jeziki: en, zh
Klonov glas
GPT-SoVITS
Nekajkratno kloniranje glasu TTS, ki replicira vsak glas iz samo 5 sekund zvoka.
Jeziki: en, zh, ja, ko
Klonov glas
Chatterbox
Najmodernejši kloniranje glasu z obvladovanjem čustev iz Resemble AI.
Jeziki: en
Klonov glas
Tortoise TTS
Večglasno besedilo-to-speech osredotočen na kakovost z avtoregresivno arhitekturo.
Jeziki: en
Klonov glas
OpenVoice
Trenutno kloniranje glasu z granuliranim nadzorom nad slogom, čustvi in naglasom.
Jeziki: en, zh, ja, ko, fr, de, es, it
Klonov glas
Qwen3 TTS
Alibabov večjezični TTS z kloniranjem glasu, predstavljenimi glasovi in oblikovanjem glasu iz besedila.
Jeziki: en, zh, ja, ko, de, fr, ru, pt, es, it
Klonov glasRazvijalec-prva API
Združljiv z OpenAI REST API. En opazovani dogodek, 22+ modeli. Pogon podpore za aplikacije v realnem času.
- Združljiva z OpenAI formatom
- Streaming TTS za aplikacije v realnem času
- Serija obdelave za velika delovna mesta
- Spletna obvestila
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Preprosta, pregledna cena
Začnite svobodno.
Prosto
15 kreditov
- Kokoro, Piper, VITS, MeloTTS
- Omejitev 500 znakov
- 3 gen/ur (brez računa)
Začetek
500 kreditov/mesec
- Vsi 22+ modeli
- 100,000 chars per generation
- Kloniranje glasu
Prof.
2.000 kreditov mesečno
- Vse v zagonu
- Dostop API
- Prednostna obdelava
Podjetje
10.000 kreditov/mesec
- Vse v prof.
- Masovni API
- Prednostna vrstica
Pogosta vprašanja
Začnite uporabljati AI glas danes
Pridružite se ustvarjalcem, razvijalcem in podjetjem z uporabo TTS.ai