Free AI Testutik hizketara
33+ kode irekiko ereduak, 273+ ahotsak, 33+ Hizkuntzak. Ez da konturik behar.
Ahots-AIrako behar duzun guztia
Iturburu irekiko AI ereduetan oinarritutako 30+ tresna
33+ AI ahots modeloak
Iturburu irekiko TTS ereduen bildumarik osoena plataforma bakar batean
Kokoro Libre
Kokoro 82 milioi parametro dituen testu-hizketa modelo bat da, bere pisu-klasearen gainetik dagoena. Bere tamaina txikia izan arren, hizketa oso naturala eta adierazgarria ekoizten du. Kokorok hainbat hizkuntza onartzen ditu, besteak beste, ingelesa, japoniera, txinera eta koreera, hainbat ahots adierazgarrirekin. Oso azkar exekutatzen da — GPU batean denbora errealean baino ia 100 aldiz azkarrago sortzen du audioa.
Honako hauentzako onena: Kalitate handiko TTS, atzerapen minimoa, streaming aplikazioak
Saiatu doan
Piper Libre
Piper Rhasspy-k garatutako testu-hizketa motor arina da, VITS eta larynx arkitekturak erabiltzen dituena. Erabat PUZ-n exekutatzen da, eta, beraz, ezin hobea da ertz-gailuetarako, etxeko automatizaziorako eta lineaz kanpoko TTS behar duten aplikazioetarako. 30 hizkuntza baino gehiagoko 100 ahots baino gehiagorekin, Piper-ek hizketa naturala ematen du denbora errealean, Raspberry Pi 4-n ere bai.
Honako hauentzako onena: Aurrebista azkarrak, erabilerraztasuna eta aplikazio kapsulatuak
Saiatu doan
VITS Libre
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) amaieratik amaierara TTS metodo paralelo bat da, gaur egungo bi faseko ereduek baino soinu naturalagoa sortzen duena. Inferentzia bariazionala hartzen du, fluxu normalizatzaileekin eta entrenamendu-prozesu aurkariarekin handitua, naturaltasunean hobekuntza nabarmena lortzeko.
Honako hauentzako onena: Helburu orokorreko testu-hizketa prosodia naturalekin
Saiatu doan
MeloTTS Libre
MyShell.ai-ren MeloTTS hizkuntz anitzeko TTS liburutegi bat da, ingelesa (amerikarra, britainiarra, indiarra, australiarra), gaztelania, frantsesa, txinera, japoniera eta koreera onartzen dituena. Oso azkarra da, testua ia denbora errealean prozesatzen du PUZ soilarekin. MeloTTS ekoizpenerako diseinatuta dago, eta PUZ eta GPU inferentzia onartzen ditu.
Honako hauentzako onena: TTS azkarra eta hizkuntza anitzekoa behar duten ekoizpen-aplikazioak
Saiatu doan
Kani TTS 2 Libre
NineNineSix-en Kani-TTS-2 400M parametrodun modelo ultra-arina da, LiquidAI LFM2 bizkarrezurra eta Nvidia NanoCodec-ekin eraikia. 3 GB-ko VRAM-ean bakarrik exekutatzen da eta 10 segundoko hizketa lortzen du ~2 segundotan (RTF 0.2). Ahots-klonaketa zero-shot onartzen du bozgorailuen kapsulazioen bidez.
Honako hauentzako onena: Sorkuntza azkarra, baliabide gutxiko inguruneak, aurrebista azkarrak
Saiatu doan
OuteTTS Libre
OuteTTS-ek hizkuntza-eredu handiak testu-hizketa gaitasunekin hedatzen ditu, jatorrizko arkitektura mantenduz. Hainbat backend onartzen ditu, hala nola llama.cpp (PUZ/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, eta baita arakatzailearen inferentzia Transformers.js-en bidez ere. Ahots-klonaketa zero-shot-a eskaintzen du JSON gisa gordetako hiztun-profilen bidez.
Honako hauentzako onena: Edge deployment, arakatzailean oinarritutako TTS, baliabide gutxiko inguruneak
Saiatu doan
Pocket TTS Libre
Kyutai-ren (Moshi-ren sortzaileak) Pocket TTS 100M parametro dituen testu-hizketa modelo trinkoa da, bere pisua gainditzen duena. PUZ-an eraginkortasunez exekutatzen da, audio-lagin bakar batetik zero-shot ahots klonaketa onartzen du, eta soinu naturala duen hizketa sortzen du. Modeloaren tamaina txikiak ezin hobea egiten du ertz-hedapenetarako eta baliabide gutxiko inguruneetarako.
Honako hauentzako onena: Banaketa arina, PUZ-soilik inguruneak, ahots klonazio azkarra
Saiatu doan
Kitten TTS Libre
Kitten TTS, KittenML-k garatua, testu-hizketa modelo ultra-arina da, ONNX-en oinarrituta. 15M eta 80M parametroen arteko aldaerak ditu (25-80 MB diskoan), eta kalitate handiko ahots-sintesia eskaintzen du PUZ-n GPUrik behar izan gabe. 8 ahots barneratu, hizketa-abiadura doigarria eta zenbaki, diru eta unitateetarako testu-aurreprozesatzaile barneratua ditu. Oso egokia da ertz-hedapenerako eta latentzia txikiko aplikazioetarako.
Honako hauentzako onena: TTS arin eta azkarra, ertz-hedapena, latentzia txikiko aplikazioak
Saiatu doan
Ming-Omni TTS Libre
Ming-omni-tts-0.5B, inclusionAI-k garatua, hizketa-eredu omnimodal trinkoa da, BailingMM bizkarrezur dentsoan eraikia, adabakiz adabaki fluxua parekatzen duen audio-deskodetzaile batekin. 44,1 kHz-ko irteera eskaintzen du (CD kalitatearen antzekoa), zero-shot ahots klonaketa onartzen du 3 segundotik gorako erreferentzia batetik, eta barneko emozio / dialekto / BGM kontrola JSON aginduen bidez. Egonkortasun bikaina — %0,83 WER txinatar erreferentzia-balioetan.
Honako hauentzako onena: Hizkuntza biko narrazio fidela, emozioz kontrolaturiko ahots-aktorea, audioliburu txinatarraren edukia
Saiatu doan
MOSS-TTS Nano Libre
MOSS-TTS-Nano-100M OpenMOSS-en MOSS-TTS familiaren 100M parametro-aldaera trinkoa da, atzerapen-transformadorearen arkitektura partekatzen duena. 8B modeloaren kalitate gorena ~80 aldiz pisu txikiagoengatik eta eskaera bakoitzeko VRAM nabarmen txikiagoengatik trukatzen du, free-layer eta abiadura handiko hedapenetarako egokia bihurtuz. 20 hizkuntza-eremu bera.
Honako hauentzako onena: Free-layer TTS, ekoizpen bolumen handia, erabilera interaktiboaren latentzia baxua
Saiatu doan
Bark Lehenetsia
Transformadorean oinarritutako testu-audio eredua, hizketa, musika eta soinu-efektu errealistak sortzen dituena.
Garatzailea: Suno · Lizentzia: MIT
Saiatu.
Bark Small Lehenetsia
Bark-en bertsio arinagoa, inferentzia azkarragoa eta memoria-erabilera txikiagoa.
Garatzailea: Suno · Lizentzia: MIT
Saiatu.
CosyVoice 2 Lehenetsia
Alibabaren streaming TTS eskalagarria, giza paritatearen naturaltasunarekin eta ia zero latentziarekin.
Garatzailea: Alibaba (Tongyi Lab) · Lizentzia: Apache 2.0
Saiatu.
Dia TTS Lehenetsia
Multi-hiztun elkarrizketa sortzeko eredua, hiztun arteko elkarrizketak sortzen dituena.
Garatzailea: Nari Labs · Lizentzia: Apache 2.0
Saiatu.
Parler TTS Lehenetsia
Deskribatu nahi duzun ahotsa hizkuntza naturalean eta Parler-ek bat datorren hizketa sortuko du.
Garatzailea: Hugging Face · Lizentzia: Apache 2.0
Saiatu.
IndexTTS-2 Lehenetsia
Zero-shot TTS, emozioen kontrol finarekin eta adierazkortasun handiarekin.
Garatzailea: Index Team · Lizentzia: Bilibili Model License
Saiatu.
Spark TTS Lehenetsia
TTS ahots klonaketa, emozio kontrolagarriekin eta hizketa-estiloarekin, aholkuen bidez.
Garatzailea: SparkAudio · Lizentzia: CC BY-NC-SA 4.0
Saiatu.
GPT-SoVITS Lehenetsia
Ahotsa klonatzeko TTS, edozein ahots erreplikatzen duena 5 segundoko audio batetik.
Garatzailea: RVC-Boss · Lizentzia: MIT
Saiatu.
Orpheus Lehenetsia
100.000 orduko hizketa-datuetan trebatutako giza mailako TTS emozionalaren eredua.
Garatzailea: Canopy Labs · Lizentzia: Llama 3.2 Community
Saiatu.
Qwen3 TTS Lehenetsia
Alibabaren hizkuntza anitzeko TTS ahots klonazioarekin, aurrezarritako ahotsak eta ahots diseinua testutik.
Garatzailea: Alibaba (Qwen) · Lizentzia: Apache 2.0
Saiatu.
VieNeu-TTS-v2 Lehenetsia
Vietnamera + ingelesa kode-aldatze TTS, 7 aurrezarritako ahots eta zero-shot ahots klonatzearekin. PUZ soilik, GPUrik ez.
Garatzailea: Phạm Nguyễn Ngọc Bảo · Lizentzia: Apache 2.0
Saiatu.
Chatterbox Turbo Lehenetsia
Chatterbox azkarragoa, 200 ms-tik beherako latentzia eta etiketa paralinguistikoekin barreak, eztula eta abar adierazteko.
Garatzailea: Resemble AI · Lizentzia: MIT
Saiatu.
VoxCPM Lehenetsia
Tokenizerrik gabeko TTS-ak 44.1kHz-ko audioa ekoizten du testuinguru-kontzienteko paragrafo-koherentziarekin.
Garatzailea: OpenBMB · Lizentzia: Apache 2.0
Saiatu.
VibeVoice Lehenetsia
Microsoft-en modeloa forma luzeko hiztun anitzeko edukietarako, podcastak eta audioliburuak adibidez.
Garatzailea: Microsoft · Lizentzia: MIT
Saiatu.
CosyVoice3 Lehenetsia
Hurrengo belaunaldiko hizkuntza anitzeko TTS bi-streaming, emozio kontrol eta zero-shot ahots klonazioarekin.
Garatzailea: Alibaba (FunAudioLLM) · Lizentzia: Apache 2.0
Saiatu.
NAMAA Saudi TTS Lehenetsia
Lehen arabiar-saudiar TTS irekia. Saudiar dialektoa, Chatterbox-en kalitatezko ahots klonatzearekin.
Garatzailea: NAMAA Space · Lizentzia: MIT
Saiatu.
Darwin TTS Lehenetsia
Qwen3-TTS aldaera cross-modal bat FFN pisuekin Qwen3-1.7B hizkuntza ereduarekin nahasita, hizkuntza anitzeko klonazio zehatzagoa lortzeko.
Garatzailea: FINAL-Bench · Lizentzia: Apache 2.0
Saiatu.
MOSS-TTSD Lehenetsia
Hizlari anitzeko elkarrizketa-jarduera modeloa — podcast-estiloko elkarrizketak sortzen ditu, gehienez 5 hizlarirekin eta 60 minutuko audio koherentearekin.
Garatzailea: OpenMOSS · Lizentzia: Apache 2.0
Saiatu.
CosyVoice 2
Alibabaren streaming TTS eskalagarria, giza paritatearen naturaltasunarekin eta ia zero latentziarekin.
Hizkuntzak: en, zh, ja, ko, fr, de, it, es
Klonatu ahotsa
IndexTTS-2
Zero-shot TTS, emozioen kontrol finarekin eta adierazkortasun handiarekin.
Hizkuntzak: en, zh
Klonatu ahotsa
Spark TTS
TTS ahots klonaketa, emozio kontrolagarriekin eta hizketa-estiloarekin, aholkuen bidez.
Hizkuntzak: en, zh
Klonatu ahotsa
GPT-SoVITS
Ahotsa klonatzeko TTS, edozein ahots erreplikatzen duena 5 segundoko audio batetik.
Hizkuntzak: en, zh, ja, ko
Klonatu ahotsa
Chatterbox
Zero-shot ahots klonazio modernoa, Resemble AI-ren emozioen kontrolarekin.
Hizkuntzak: en
Klonatu ahotsa
Tortoise TTS
Multi-ahots testu-hizketa arkitektura autoregresiboarekin kalitatean zentratzen da.
Hizkuntzak: en
Klonatu ahotsa
OpenVoice
Berehalako ahots klonaketa, estilo, emozio eta akzentuen kontrol zorrotzarekin.
Hizkuntzak: en, zh, ja, ko, fr, es
Klonatu ahotsa
VieNeu-TTS-v2
Vietnamera + ingelesa kode-aldatze TTS, 7 aurrezarritako ahots eta zero-shot ahots klonatzearekin. PUZ soilik, GPUrik ez.
Hizkuntzak: vi, en
Klonatu ahotsa
Chatterbox Turbo
Chatterbox azkarragoa, 200 ms-tik beherako latentzia eta etiketa paralinguistikoekin barreak, eztula eta abar adierazteko.
Hizkuntzak: en
Klonatu ahotsa
VoxCPM
Tokenizerrik gabeko TTS-ak 44.1kHz-ko audioa ekoizten du testuinguru-kontzienteko paragrafo-koherentziarekin.
Hizkuntzak: en, zh
Klonatu ahotsa
OuteTTS
LLMn oinarritutako TTS bat, PUZ, GPU edo nabigatzaile batean exekutatzen dena llama.cpp eta Transformers.js bidez.
Hizkuntzak: en
Klonatu ahotsa
Pocket TTS
Kyutai-ren 100M parametrodun modelo arina, ahots klonaketa lagin bakar batetik.
Hizkuntzak: en, fr
Klonatu ahotsa
CosyVoice3
Hurrengo belaunaldiko hizkuntza anitzeko TTS bi-streaming, emozio kontrol eta zero-shot ahots klonazioarekin.
Hizkuntzak: en, zh, ja, ko, de, es, fr, it, ru
Klonatu ahotsa
NAMAA Saudi TTS
Lehen arabiar-saudiar TTS irekia. Saudiar dialektoa, Chatterbox-en kalitatezko ahots klonatzearekin.
Hizkuntzak: ar
Klonatu ahotsa
Darwin TTS
Qwen3-TTS aldaera cross-modal bat FFN pisuekin Qwen3-1.7B hizkuntza ereduarekin nahasita, hizkuntza anitzeko klonazio zehatzagoa lortzeko.
Hizkuntzak: en, ko, ja, zh
Klonatu ahotsa
MOSS-TTSD
Hizlari anitzeko elkarrizketa-jarduera modeloa — podcast-estiloko elkarrizketak sortzen ditu, gehienez 5 hizlarirekin eta 60 minutuko audio koherentearekin.
Hizkuntzak: en, zh
Klonatu ahotsa
Ming-Omni TTS
0,5B hizketa-eredu omni-modal trinkoa inclusionAI-tik, fideltasun handiko 44,1 kHz irteera eta zero-shot ahots klonazioarekin.
Hizkuntzak: en, zh
Klonatu ahotsa
MOSS-TTS Nano
100M MOSS-TTS aldaera txikia — arkitektura bera, 80x txikiagoa, free-layer latentzia.
Hizkuntzak: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Klonatu ahotsaGaratzaileentzako lehen APIa
OpenAI-rekin bateragarria den REST APIa. Amaierako puntu bat, 22 modelo baino gehiago. Denbora errealeko aplikazioentzako streaming euskarria.
- OpenAI-rekin bateragarria den formatua
- TTS streaming-a denbora errealeko aplikazioetarako
- Batch prozesamendua lan handietarako
- Webhook jakinarazpenak
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Prezio sinple eta gardenak
Hasi libre. Eskalatu hazten zarenean.
Libre
15.000 karaktere + 5.000/egunean
- 7 modelo libre, Kokoro barne
- 5.000 karaktere belaunaldiko
- API sarbide barne
Abiarazlea
500 kreditu/hilabete
- 22+ modelo guztiak
- 100.000 karaktere belaunaldiko
- Ahots klonaketa
Pro
2.000 kreditu/hilabete
- Hasierako dena
- API atzipena
- Lehentasunaren prozesamendua
Negozioak
10.000 kreditu/hilean
- Dena Pro-n
- Bulk APIa
- Lehentasunaren ilara
Maiz egiten diren galderak
Zer hobetu dezakegu? Zure iritziak arazoak konpontzen laguntzen digu.
Hasi AI ahotsa erabiltzen gaur
Bat egin TTS.ai erabiltzen duten sortzaile, garatzaile eta enpresekin