Free AI Testutik hizketara
31+ kode irekiko ereduak, 231+ ahotsak, 34+ Hizkuntzak. Ez da konturik behar.
Ahots-AIrako behar duzun guztia
Iturburu irekiko AI ereduetan oinarritutako 30+ tresna
31+ AI ahots modeloak
Iturburu irekiko TTS ereduen bildumarik osoena plataforma bakar batean
Kokoro Libre
Kokoro 82 milioi parametro dituen testu-hizketa modelo bat da, bere pisu-klasearen gainetik dagoena. Bere tamaina txikia izan arren, hizketa oso naturala eta adierazgarria ekoizten du. Kokorok hainbat hizkuntza onartzen ditu, besteak beste, ingelesa, japoniera, txinera eta koreera, hainbat ahots adierazgarrirekin. Oso azkar exekutatzen da — GPU batean denbora errealean baino ia 100 aldiz azkarrago sortzen du audioa.
Honako hauentzako onena: Kalitate handiko TTS, atzerapen minimoa, streaming aplikazioak
Saiatu doan
Piper Libre
Piper Rhasspy-k garatutako testu-hizketa motor arina da, VITS eta larynx arkitekturak erabiltzen dituena. Erabat PUZ-n exekutatzen da, eta, beraz, ezin hobea da ertz-gailuetarako, etxeko automatizaziorako eta lineaz kanpoko TTS behar duten aplikazioetarako. 30 hizkuntza baino gehiagoko 100 ahots baino gehiagorekin, Piper-ek hizketa naturala ematen du denbora errealean, Raspberry Pi 4-n ere bai.
Honako hauentzako onena: Aurrebista azkarrak, erabilerraztasuna eta aplikazio kapsulatuak
Saiatu doan
VITS Libre
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) amaieratik amaierara TTS metodo paralelo bat da, gaur egungo bi faseko ereduek baino soinu naturalagoa sortzen duena. Inferentzia bariazionala hartzen du, fluxu normalizatzaileekin eta entrenamendu-prozesu aurkariarekin handitua, naturaltasunean hobekuntza nabarmena lortzeko.
Honako hauentzako onena: Helburu orokorreko testu-hizketa prosodia naturalekin
Saiatu doan
MeloTTS Libre
MyShell.ai-ren MeloTTS hizkuntz anitzeko TTS liburutegi bat da, ingelesa (amerikarra, britainiarra, indiarra, australiarra), gaztelania, frantsesa, txinera, japoniera eta koreera onartzen dituena. Oso azkarra da, testua ia denbora errealean prozesatzen du PUZ soilarekin. MeloTTS ekoizpenerako diseinatuta dago, eta PUZ eta GPU inferentzia onartzen ditu.
Honako hauentzako onena: TTS azkarra eta hizkuntza anitzekoa behar duten ekoizpen-aplikazioak
Saiatu doan
OuteTTS Libre
OuteTTS-ek hizkuntza-eredu handiak testu-hizketa gaitasunekin hedatzen ditu, jatorrizko arkitektura mantenduz. Hainbat backend onartzen ditu, hala nola llama.cpp (PUZ/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, eta baita arakatzailearen inferentzia Transformers.js-en bidez ere. Ahots-klonaketa zero-shot-a eskaintzen du JSON gisa gordetako hiztun-profilen bidez.
Honako hauentzako onena: Edge deployment, arakatzailean oinarritutako TTS, baliabide gutxiko inguruneak
Saiatu doan
Pocket TTS Libre
Kyutai-ren (Moshi-ren sortzaileak) Pocket TTS 100M parametro dituen testu-hizketa modelo trinkoa da, bere pisua gainditzen duena. PUZ-an eraginkortasunez exekutatzen da, audio-lagin bakar batetik zero-shot ahots klonaketa onartzen du, eta soinu naturala duen hizketa sortzen du. Modeloaren tamaina txikiak ezin hobea egiten du ertz-hedapenetarako eta baliabide gutxiko inguruneetarako.
Honako hauentzako onena: Banaketa arina, PUZ-soilik inguruneak, ahots klonazio azkarra
Saiatu doan
Kitten TTS Libre
Kitten TTS, KittenML-k garatua, testu-hizketa modelo ultra-arina da, ONNX-en oinarrituta. 15M eta 80M parametroen arteko aldaerak ditu (25-80 MB diskoan), eta kalitate handiko ahots-sintesia eskaintzen du PUZ-n GPUrik behar izan gabe. 8 ahots barneratu, hizketa-abiadura doigarria eta zenbaki, diru eta unitateetarako testu-aurreprozesatzaile barneratua ditu. Oso egokia da ertz-hedapenerako eta latentzia txikiko aplikazioetarako.
Honako hauentzako onena: TTS arin eta azkarra, ertz-hedapena, latentzia txikiko aplikazioak
Saiatu doan
Bark Lehenetsia
Transformadorean oinarritutako testu-audio eredua, hizketa, musika eta soinu-efektu errealistak sortzen dituena.
Garatzailea: Suno · Lizentzia: MIT
Saiatu.
Bark Small Lehenetsia
Bark-en bertsio arinagoa, inferentzia azkarragoa eta memoria-erabilera txikiagoa.
Garatzailea: Suno · Lizentzia: MIT
Saiatu.
CosyVoice 2 Lehenetsia
Alibabaren streaming TTS eskalagarria, giza paritatearen naturaltasunarekin eta ia zero latentziarekin.
Garatzailea: Alibaba (Tongyi Lab) · Lizentzia: Apache 2.0
Saiatu.
Dia TTS Lehenetsia
Multi-hiztun elkarrizketa sortzeko eredua, hiztun arteko elkarrizketak sortzen dituena.
Garatzailea: Nari Labs · Lizentzia: Apache 2.0
Saiatu.
Parler TTS Lehenetsia
Deskribatu nahi duzun ahotsa hizkuntza naturalean eta Parler-ek bat datorren hizketa sortuko du.
Garatzailea: Hugging Face · Lizentzia: Apache 2.0
Saiatu.
GLM-TTS Lehenetsia
Iturburu irekiko TTS ereduen artean karaktere-errore-tasa txikiena lortzen du.
Garatzailea: Zhipu AI · Lizentzia: GLM-4 License
Saiatu.
IndexTTS-2 Lehenetsia
Zero-shot TTS, emozioen kontrol finarekin eta adierazkortasun handiarekin.
Garatzailea: Index Team · Lizentzia: Bilibili Model License
Saiatu.
Spark TTS Lehenetsia
TTS ahots klonaketa, emozio kontrolagarriekin eta hizketa-estiloarekin, aholkuen bidez.
Garatzailea: SparkAudio · Lizentzia: CC BY-NC-SA 4.0
Saiatu.
GPT-SoVITS Lehenetsia
Ahotsa klonatzeko TTS, edozein ahots erreplikatzen duena 5 segundoko audio batetik.
Garatzailea: RVC-Boss · Lizentzia: MIT
Saiatu.
Orpheus Lehenetsia
100.000 orduko hizketa-datuetan trebatutako giza mailako TTS emozionalaren eredua.
Garatzailea: Canopy Labs · Lizentzia: Llama 3.2 Community
Saiatu.
Qwen3 TTS Lehenetsia
Alibabaren hizkuntza anitzeko TTS ahots klonazioarekin, aurrezarritako ahotsak eta ahots diseinua testutik.
Garatzailea: Alibaba (Qwen) · Lizentzia: Apache 2.0
Saiatu.
Chatterbox Turbo Lehenetsia
Chatterbox azkarragoa, 200 ms-tik beherako latentzia eta etiketa paralinguistikoekin barreak, eztula eta abar adierazteko.
Garatzailea: Resemble AI · Lizentzia: MIT
Saiatu.
Dia 2 Lehenetsia
Transmisio-lehen TTS elkarrizketa, hiztun anitzeko elkarrizketa eta seinale paralinguistikoekin.
Garatzailea: Nari Labs · Lizentzia: Apache 2.0
Saiatu.
VoxCPM Lehenetsia
Tokenizerrik gabeko TTS-ak 44.1kHz-ko audioa ekoizten du testuinguru-kontzienteko paragrafo-koherentziarekin.
Garatzailea: OpenBMB · Lizentzia: Apache 2.0
Saiatu.
TADA Lehenetsia
Zero haluzinazio TTS testu-akustiko lerrokatze bikoitzarekin, LLM TTS konparagarria baino 5x azkarragoa.
Garatzailea: Hume AI · Lizentzia: MIT
Saiatu.
VibeVoice Lehenetsia
Microsoft-en modeloa forma luzeko hiztun anitzeko edukietarako, podcastak eta audioliburuak adibidez.
Garatzailea: Microsoft · Lizentzia: MIT
Saiatu.
CosyVoice3 Lehenetsia
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Garatzailea: Alibaba (FunAudioLLM) · Lizentzia: Apache 2.0
Saiatu.
CosyVoice 2
Alibabaren streaming TTS eskalagarria, giza paritatearen naturaltasunarekin eta ia zero latentziarekin.
Hizkuntzak: en, zh, ja, ko, fr, de, it, es
Klonatu ahotsa
GLM-TTS
Iturburu irekiko TTS ereduen artean karaktere-errore-tasa txikiena lortzen du.
Hizkuntzak: en, zh
Klonatu ahotsa
IndexTTS-2
Zero-shot TTS, emozioen kontrol finarekin eta adierazkortasun handiarekin.
Hizkuntzak: en, zh
Klonatu ahotsa
Spark TTS
TTS ahots klonaketa, emozio kontrolagarriekin eta hizketa-estiloarekin, aholkuen bidez.
Hizkuntzak: en, zh
Klonatu ahotsa
GPT-SoVITS
Ahotsa klonatzeko TTS, edozein ahots erreplikatzen duena 5 segundoko audio batetik.
Hizkuntzak: en, zh, ja, ko
Klonatu ahotsa
Chatterbox
Zero-shot ahots klonazio modernoa, Resemble AI-ren emozioen kontrolarekin.
Hizkuntzak: en
Klonatu ahotsa
Tortoise TTS
Multi-ahots testu-hizketa arkitektura autoregresiboarekin kalitatean zentratzen da.
Hizkuntzak: en
Klonatu ahotsa
OpenVoice
Berehalako ahots klonaketa, estilo, emozio eta akzentuen kontrol zorrotzarekin.
Hizkuntzak: en, zh, ja, ko, fr, de, es, it
Klonatu ahotsa
Qwen3 TTS
Alibabaren hizkuntza anitzeko TTS ahots klonazioarekin, aurrezarritako ahotsak eta ahots diseinua testutik.
Hizkuntzak: en, zh, ja, ko, de, fr, ru, pt, es, it
Klonatu ahotsa
Chatterbox Turbo
Chatterbox azkarragoa, 200 ms-tik beherako latentzia eta etiketa paralinguistikoekin barreak, eztula eta abar adierazteko.
Hizkuntzak: en
Klonatu ahotsa
VoxCPM
Tokenizerrik gabeko TTS-ak 44.1kHz-ko audioa ekoizten du testuinguru-kontzienteko paragrafo-koherentziarekin.
Hizkuntzak: en, zh
Klonatu ahotsa
OuteTTS
LLMn oinarritutako TTS bat, PUZ, GPU edo nabigatzaile batean exekutatzen dena llama.cpp eta Transformers.js bidez.
Hizkuntzak: en
Klonatu ahotsa
Pocket TTS
Kyutai-ren 100M parametrodun modelo arina, ahots klonaketa lagin bakar batetik.
Hizkuntzak: en, fr
Klonatu ahotsa
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Hizkuntzak: en, zh, ja, ko, de, es, fr, it, ru
Klonatu ahotsa
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Hizkuntzak: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Klonatu ahotsa
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Hizkuntzak: en, zh
Klonatu ahotsaGaratzaileentzako lehen APIa
OpenAI-rekin bateragarria den REST APIa. Amaierako puntu bat, 22 modelo baino gehiago. Denbora errealeko aplikazioentzako streaming euskarria.
- OpenAI-rekin bateragarria den formatua
- TTS streaming-a denbora errealeko aplikazioetarako
- Batch prozesamendua lan handietarako
- Webhook jakinarazpenak
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Prezio sinple eta gardenak
Hasi libre. Eskalatu hazten zarenean.
Libre
15.000 karaktere
- Kokoro, Piper, VITS, MeloTTS
- 500 karaktereko muga
- 3 gen/ordua (konturik ez)
Abiarazlea
500 kreditu/hilabete
- 22+ modelo guztiak
- 100.000 karaktere belaunaldiko
- Ahots klonaketa
Pro
2.000 kreditu/hilabete
- Hasierako dena
- API atzipena
- Lehentasunaren prozesamendua
Negozioak
10.000 kreditu/hilean
- Dena Pro-n
- Bulk APIa
- Lehentasunaren ilara
Maiz egiten diren galderak
Zer hobetu dezakegu? Zure iritziak arazoak konpontzen laguntzen digu.
Hasi AI ahotsa erabiltzen gaur
Bat egin TTS.ai erabiltzen duten sortzaile, garatzaile eta enpresekin