Prosti AI Besedilo v govor

28+ modeli odprtega izvora, 219+ glasovi, 33+ jeziki. Račun ni potreben.

9K+
ustvarjalci
35K+
generacije
28+
AI modeli
219+
glasovi
0/500 znaki · Sign up for 5,000 per generation → Prosto
Ljubi TTS.ai, povej prijateljem!

Vse, kar potrebuješ za glasovno inteligenco

30+ orodja, ki jih poganjajo modeli AI z odprtim virom

28+ AI Glasovni modeli

Najobsežnejša zbirka modelov TTS na odprtem viru v eni platformi

KokoroKokoro Free

Kokoro je 82 milijonov parametrov besedila do jezika modela, ki udarja veliko nad svojo težo razreda. Kljub svoji majhni velikosti, proizvaja izredno naravno in izrazito govor. Kokoro podpira več jezikov, vključno angleško, japonsko, kitajsko in korejsko z različnimi izrazitivne glasove. Teče neverjetno hitro – ustvarjanje avdio skoraj 100x hitreje kot v realnem času na GPU.

Najboljše za: visokokakovostni TTS z minimalno latenco, streaming aplikacije

Poskusite svobodno

PiperPiper Free

Piper je lahek tekst-to-speech motor, ki ga je razvil Rhaspy, ki uporablja VITS in grla arhitekture. To deluje v celoti na CPU, kar je idealen za robne naprave, hišna avtomatizacija in aplikacije, ki zahtevajo offline TTS. Z več kot 100 glasov v 30+ jezikih, Piper zagotavlja naravno-zvočni govor pri hitrosti v realnem času tudi na Raspberry Pi 4.

Najboljše za: Hitri pregledi, dostopnost in vgrajeni programi

Poskusite svobodno

VITSVITS Free

VITS (Variacionalni sklepi z nasprotnim učenjem za končni na koncu besedila v govor) je vzporedna metoda TTS od konca do konca, ki ustvarja bolj naravni zvočni zvok kot trenutni dvostopenjski modeli. Prevzema variacijski zaključek, ki se povečuje z normalizacijskimi tokovi in procesom vertikalnega usposabljanja, ki doseže znatno izboljšanje narave.

Najboljše za: Splošni namenski tekstilni govor z naravno prozodijo

Poskusite svobodno

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai je večjezična knjižnica TTS, ki podpira angleščino (ameriški, britanski, indijski, avstralski), španski, francoski, kitajski, japonski in korejski. Je izjemno hitro, obdelava besedila z skoraj realno hitrostjo samo na CPU. MeloTTS je zasnovan za uporabo v proizvodnji in podpira tako CPU in GPU zaključek.

Najboljše za: Zahtevki za proizvodnjo, ki potrebujejo hitro, večjezično TTS

Poskusite svobodno

OuteTTSOuteTTS Free

OutetTS razširja velike jezikovne modele z besedilnimi zmožnostmi pri ohranjanju izvirne arhitekture. Podpira več podstavkov, vključno z lama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM in celo brskalnik zaključek preko Transformers.js. Značilnosti brez strelnega kloniranja glasu skozi zvočniške profile, shranjene kot JSON.

Najboljše za: Uporaba roba, TTS na podlagi brskalnika, okolja z nizkimi viri

Poskusite svobodno

Pocket TTSPocket TTS Free

Pocket TTS s strani Kyutai (kreatorji Moshi) je kompakten model 100M parametrov besedila-na-špeih, ki udarja veliko nad svojo težo. Teče učinkovito na CPU, podpira kloniranje glasu brez utripa iz enega zvočnega vzorca in ustvarja naravno-zvočni govor. Mala velikost modela ga naredi idealnega za uvajanje roba in okolja z nizkimi viri.

Najboljše za: Lahka uporaba, okolje samo za CPU, hitro kloniranje glasu

Poskusite svobodno

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Najboljše za: Fast lightweight TTS, edge deployment, low-latency applications

Poskusite svobodno

BarkBark Standard

Transformer-na-audio model, ki ustvarja realen govor, glasbo in zvočne učinke.

Razvijalec: Suno · Licenca: MIT

Poskusi.

Bark SmallBark Small Standard

Lažja različica Barka z hitrejšim zaključkom in manjšim uporabo pomnilnika.

Razvijalec: Suno · Licenca: MIT

Poskusi.

CosyVoice 2CosyVoice 2 Standard

Alibabov skalabilni TTS s človeško pariteto naravo in skoraj nula latencijo.

Razvijalec: Alibaba (Tongyi Lab) · Licenca: Apache 2.0

Poskusi.

Dia TTSDia TTS Standard

Večzvočniški dialogski model, ki ustvarja naravne pogovore med zvočniki.

Razvijalec: Nari Labs · Licenca: Apache 2.0

Poskusi.

Parler TTSParler TTS Standard

Opišite glas, ki ga želite v naravnem jeziku in Parler ustvarja enak govor.

Razvijalec: Hugging Face · Licenca: Apache 2.0

Poskusi.

GLM-TTSGLM-TTS Standard

Doseže najnižjo stopnjo znakovnih napak med modeli TTS odprtega izvora.

Razvijalec: Zhipu AI · Licenca: GLM-4 License

Poskusi.

IndexTTS-2IndexTTS-2 Standard

Zero strelja TTS z dobro zrelim nadzorom čustev in visoko izrazitostjo.

Razvijalec: Index Team · Licenca: Bilibili Model License

Poskusi.

Spark TTSSpark TTS Standard

Glasovno kloniranje TTS z nadzorovanimi čustvi in govorniški slog prek nasvetov.

Razvijalec: SparkAudio · Licenca: CC BY-NC-SA 4.0

Poskusi.

GPT-SoVITSGPT-SoVITS Standard

Nekajkratno kloniranje glasu TTS, ki replicira vsak glas iz samo 5 sekund zvoka.

Razvijalec: RVC-Boss · Licenca: MIT

Poskusi.

OrpheusOrpheus Standard

Emocionalni TTS model na človeški ravni je izurjen na 100K urah govora.

Razvijalec: Canopy Labs · Licenca: Llama 3.2 Community

Poskusi.

Qwen3 TTSQwen3 TTS Standard

Alibabov večjezični TTS z kloniranjem glasu, predstavljenimi glasovi in oblikovanjem glasu iz besedila.

Razvijalec: Alibaba (Qwen) · Licenca: Apache 2.0

Poskusi.

Chatterbox TurboChatterbox Turbo Standard

Hitreje Chatterbox z pod-200ms latency in paralinguistične oznake za smeh, kašelj in več.

Razvijalec: Resemble AI · Licenca: MIT

Poskusi.

VoxCPMVoxCPM Standard

TTS brez tokenizerja, ki proizvaja zvok 44.1kHz z doslednostjo iz konteksta.

Razvijalec: OpenBMB · Licenca: Apache 2.0

Poskusi.

VibeVoiceVibeVoice Standard

Microsoft model za dolgoformne večzvočniške vsebine, kot so podcasti in zvočne knjige.

Razvijalec: Microsoft · Licenca: MIT

Poskusi.

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Razvijalec: Alibaba (FunAudioLLM) · Licenca: Apache 2.0

Poskusi.

ChatterboxChatterbox Premium

Najmodernejši kloniranje glasu z obvladovanjem čustev iz Resemble AI.

Kakovost:

Poskusi.

Tortoise TTSTortoise TTS Premium

Večglasno besedilo-to-speech osredotočen na kakovost z avtoregresivno arhitekturo.

Kakovost:

Poskusi.

StyleTTS 2StyleTTS 2 Premium

Z difuzijo sloga in nasprotnim usposabljanjem na ravni ljudi.

Kakovost:

Poskusi.

OpenVoiceOpenVoice Premium

Trenutno kloniranje glasu z granuliranim nadzorom nad slogom, čustvi in naglasom.

Kakovost:

Poskusi.

Sesame CSMSesame CSM Premium

Pogovorni model govora ustvarja naravni dialog z ustreznim časovnim razporedom in čustvi.

Kakovost:

Poskusi.

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Kakovost:

Poskusi.

CosyVoice 2CosyVoice 2

Alibabov skalabilni TTS s človeško pariteto naravo in skoraj nula latencijo.

Jeziki: en, zh, ja, ko, fr, de, it, es

Klonov glas

GLM-TTSGLM-TTS

Doseže najnižjo stopnjo znakovnih napak med modeli TTS odprtega izvora.

Jeziki: en, zh

Klonov glas

IndexTTS-2IndexTTS-2

Zero strelja TTS z dobro zrelim nadzorom čustev in visoko izrazitostjo.

Jeziki: en, zh

Klonov glas

Spark TTSSpark TTS

Glasovno kloniranje TTS z nadzorovanimi čustvi in govorniški slog prek nasvetov.

Jeziki: en, zh

Klonov glas

GPT-SoVITSGPT-SoVITS

Nekajkratno kloniranje glasu TTS, ki replicira vsak glas iz samo 5 sekund zvoka.

Jeziki: en, zh, ja, ko

Klonov glas

ChatterboxChatterbox

Najmodernejši kloniranje glasu z obvladovanjem čustev iz Resemble AI.

Jeziki: en

Klonov glas

Tortoise TTSTortoise TTS

Večglasno besedilo-to-speech osredotočen na kakovost z avtoregresivno arhitekturo.

Jeziki: en

Klonov glas

OpenVoiceOpenVoice

Trenutno kloniranje glasu z granuliranim nadzorom nad slogom, čustvi in naglasom.

Jeziki: en, zh, ja, ko, fr, de, es, it

Klonov glas

Qwen3 TTSQwen3 TTS

Alibabov večjezični TTS z kloniranjem glasu, predstavljenimi glasovi in oblikovanjem glasu iz besedila.

Jeziki: en, zh, ja, ko, de, fr, ru, pt, es, it

Klonov glas

Chatterbox TurboChatterbox Turbo

Hitreje Chatterbox z pod-200ms latency in paralinguistične oznake za smeh, kašelj in več.

Jeziki: en

Klonov glas

VoxCPMVoxCPM

TTS brez tokenizerja, ki proizvaja zvok 44.1kHz z doslednostjo iz konteksta.

Jeziki: en, zh

Klonov glas

OuteTTSOuteTTS

LLM-based TTS, ki deluje na CPU, GPU ali brskalnik preko lama.cpp in Transformers.js.

Jeziki: en

Klonov glas

Pocket TTSPocket TTS

Lahek model parametrov 100M s strani Kyutai z kloniranjem glasu iz enega vzorca.

Jeziki: en, fr

Klonov glas

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Jeziki: en, zh, ja, ko, de, es, fr, it, ru

Klonov glas

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Jeziki: en, zh

Klonov glas

Razvijalec-prva API

Združljiv z OpenAI REST API. En opazovani dogodek, 22+ modeli. Pogon podpore za aplikacije v realnem času.

  • Združljiva z OpenAI formatom
  • Streaming TTS za aplikacije v realnem času
  • Serija obdelave za velika delovna mesta
  • Spletna obvestila
Poglejte API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Preprosta, pregledna cena

Začnite svobodno.

Prosto

$0

15 kreditov

  • Kokoro, Piper, VITS, MeloTTS
  • Omejitev 500 znakov
  • 3 gen/ur (brez računa)
Prosto se prijavite

Začetek

$9/Mo

500 kreditov/mesec

  • Vsi 22+ modeli
  • 100.000 znakov na generacijo
  • Kloniranje glasu
Začnite
Najbolj priljubljeno

Prof.

$29/Mo

2.000 kreditov mesečno

  • Vse v zagonu
  • Dostop API
  • Prednostna obdelava
Get Prof

Podjetje

$99/Mo

10.000 kreditov/mesec

  • Vse v prof.
  • Masovni API
  • Prednostna vrstica
Poslovno pridobivanje

Oglejte si vse načrte, vključno z znaki →

Pogosta vprašanja

TTS.ai je najbolj obsežna AI glasovna platforma, ki ponuja 22+ modelov besedila-na-špeh, kloniranje glasu, govor-na-tekst in zvočna orodja. Vsi modeli so odprt vir brez prodajalca zakleniti.

Da! TTS.ai ponuja brezplačno besedilo-to-speech z modeli Kokoro, Piper, VITS in MeloTTS. Ni potreben račun. Prijavite se, da bi dobili 15.000 brezplačnih znakov in dostop do vseh modelov. Plačani načrti se začnejo z 9 $/mesec.

Za hitrost uporabite Kokoro ali Piper. Za kakovost poskusite CosyVoice 2 ali StyleTTS 2. Za kloniranje glasu uporabite Chatterbox ali GPT-SoviTS. Za dialog uporabite Dia TTS. Primerjajte več modelov v istem besedilu.

Da. Združljiv z OpenAI REST API za TTS, STT, glasovno kloniranje in zvočno orodje. Na voljo na Pro (29/mo) in Enterprise ($99/mo) načrtih. Poglej dokumentacijo na tts.ai/api /.

Kvaliteta glasu se razlikuje po modelu.Premium modeli, kot je CosyVoice 2, StyleTTS 2, in Chatterbox proizvajajo skoraj človeški kakovostni govor z naravnim intonacijo in čustvi. Brezplačni modeli kot Kokoro ponujajo odlično kakovost za večino primerov uporabe.

TTS.ai podpira 30+ jezikov v svoji modelski knjižnici. Angleški ima najširši model podpore, vendar modeli, kot je CosyVoice 2 naslovnica kitajske, japonske in korejske; GPT-SoviTS upravlja kitajsko, japonsko, korejsko in angleško; in MelotTS podpira angleško, špansko, francosko, kitajsko, japonsko in korejsko.

Da. Vse obdelava se zgodi na naših namenskih strežnikih GPU. Ne shranjujemo vnosa vašega besedila ali ustvariti zvoka po dostavi. Nalagani glasovni vzorci za kloniranje se uporabljajo samo za trenutno sejo in niso obdržani. Vaši podatki nikoli ne delimo s tretjimi stranmi ali jih uporabljamo za usposabljanje modelov.

Da. Vsi zvočniki, ki so ustvarjeni na TTS.ai je vaš za komercialno uporabo, vključno z YouTube video posnetki, podcasti, audioknjige, aplikacije, oglasi in izdelki. Naši modeli so odprt vir pod popustnimi licencami (MIT, Apache 2.0). Ni potreben licenčnine ali pripis.

TTS.ai ustvarja zvok v WAV formatu privzeto za največjo kakovost. Lahko pretvorite v MP3, FLAC, OGG ali M4A z uporabo našega brezplačnega orodja Audio Converter. API podpira navedbo vašega najprimernejšega izhodnega formata neposredno v zahtevi.

Pošljite kratek zvočni vzorec (najmanj 5 sekund) glasu, ki ga želite klonirati, nato vpišite katero koli besedilo za ustvarjanje govora v tem glasu. Modeli, kot so Chatterbox, GPT-SoviTS in CosyVoice 2 podpira kloniranje glasu. Klonirani glas zajema ton, naglas in govorni stil.

Brezplačni modeli (Kokoro, Piper, VITS, MeloTTS) ne zahtevajo nikakršnih računov in stroškov. Standardni modeli (2.000 znakov/1K vnos) vključujejo Bark, CosyVoice 2, F5-TTS in Dia. Premium modeli (4.000 znakov/1K vnosov) vključujejo OpenVoice, Chatterbox, StyleTTS 2 in Tortoise. Plačani modeli na splošno ponujajo višjo kakovost, več glasov in dodatne funkcije, kot je kloniranje glasu.

Da. API podpira obdelavo serije za pretvorbo velike količine besedila v govor. Pošljite več zahtev in dobite rezultate asinhronizirano z uporabo delovnega mesta UUIDs. Podjetniški načrti (99 $/mo) vključujejo prednostni dostop v vrsto za hitrejše obdelavo serije. Idealno za produkcijo zvočnih knjig, vsebino tečaja in obsežno glasovno-preglednih projektov.
4.0/5 (22)

Kaj bi lahko izboljšali? Vaša povratna informacija nam pomaga rešiti vprašanja.

Začnite uporabljati AI glas danes

Pridružite se ustvarjalcem, razvijalcem in podjetjem z uporabo TTS.ai