Free AI Testutik hizketara

31+ kode irekiko ereduak, 231+ ahotsak, 34+ Hizkuntzak. Ez da konturik behar.

8K+
sortzaileak
30K+
belaunaldi
31+
AI modeloak
231+
ahotsak
0/500 karaktereak · Sign up for 5,000 per generation → Libre
Maite TTS.ai? Esan zure lagunei!

Ahots-AIrako behar duzun guztia

Iturburu irekiko AI ereduetan oinarritutako 30+ tresna

31+ AI ahots modeloak

Iturburu irekiko TTS ereduen bildumarik osoena plataforma bakar batean

KokoroKokoro Libre

Kokoro 82 milioi parametro dituen testu-hizketa modelo bat da, bere pisu-klasearen gainetik dagoena. Bere tamaina txikia izan arren, hizketa oso naturala eta adierazgarria ekoizten du. Kokorok hainbat hizkuntza onartzen ditu, besteak beste, ingelesa, japoniera, txinera eta koreera, hainbat ahots adierazgarrirekin. Oso azkar exekutatzen da — GPU batean denbora errealean baino ia 100 aldiz azkarrago sortzen du audioa.

Honako hauentzako onena: Kalitate handiko TTS, atzerapen minimoa, streaming aplikazioak

Saiatu doan

PiperPiper Libre

Piper Rhasspy-k garatutako testu-hizketa motor arina da, VITS eta larynx arkitekturak erabiltzen dituena. Erabat PUZ-n exekutatzen da, eta, beraz, ezin hobea da ertz-gailuetarako, etxeko automatizaziorako eta lineaz kanpoko TTS behar duten aplikazioetarako. 30 hizkuntza baino gehiagoko 100 ahots baino gehiagorekin, Piper-ek hizketa naturala ematen du denbora errealean, Raspberry Pi 4-n ere bai.

Honako hauentzako onena: Aurrebista azkarrak, erabilerraztasuna eta aplikazio kapsulatuak

Saiatu doan

VITSVITS Libre

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) amaieratik amaierara TTS metodo paralelo bat da, gaur egungo bi faseko ereduek baino soinu naturalagoa sortzen duena. Inferentzia bariazionala hartzen du, fluxu normalizatzaileekin eta entrenamendu-prozesu aurkariarekin handitua, naturaltasunean hobekuntza nabarmena lortzeko.

Honako hauentzako onena: Helburu orokorreko testu-hizketa prosodia naturalekin

Saiatu doan

MeloTTSMeloTTS Libre

MyShell.ai-ren MeloTTS hizkuntz anitzeko TTS liburutegi bat da, ingelesa (amerikarra, britainiarra, indiarra, australiarra), gaztelania, frantsesa, txinera, japoniera eta koreera onartzen dituena. Oso azkarra da, testua ia denbora errealean prozesatzen du PUZ soilarekin. MeloTTS ekoizpenerako diseinatuta dago, eta PUZ eta GPU inferentzia onartzen ditu.

Honako hauentzako onena: TTS azkarra eta hizkuntza anitzekoa behar duten ekoizpen-aplikazioak

Saiatu doan

OuteTTSOuteTTS Libre

OuteTTS-ek hizkuntza-eredu handiak testu-hizketa gaitasunekin hedatzen ditu, jatorrizko arkitektura mantenduz. Hainbat backend onartzen ditu, hala nola llama.cpp (PUZ/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, eta baita arakatzailearen inferentzia Transformers.js-en bidez ere. Ahots-klonaketa zero-shot-a eskaintzen du JSON gisa gordetako hiztun-profilen bidez.

Honako hauentzako onena: Edge deployment, arakatzailean oinarritutako TTS, baliabide gutxiko inguruneak

Saiatu doan

Pocket TTSPocket TTS Libre

Kyutai-ren (Moshi-ren sortzaileak) Pocket TTS 100M parametro dituen testu-hizketa modelo trinkoa da, bere pisua gainditzen duena. PUZ-an eraginkortasunez exekutatzen da, audio-lagin bakar batetik zero-shot ahots klonaketa onartzen du, eta soinu naturala duen hizketa sortzen du. Modeloaren tamaina txikiak ezin hobea egiten du ertz-hedapenetarako eta baliabide gutxiko inguruneetarako.

Honako hauentzako onena: Banaketa arina, PUZ-soilik inguruneak, ahots klonazio azkarra

Saiatu doan

Kitten TTSKitten TTS Libre

Kitten TTS, KittenML-k garatua, testu-hizketa modelo ultra-arina da, ONNX-en oinarrituta. 15M eta 80M parametroen arteko aldaerak ditu (25-80 MB diskoan), eta kalitate handiko ahots-sintesia eskaintzen du PUZ-n GPUrik behar izan gabe. 8 ahots barneratu, hizketa-abiadura doigarria eta zenbaki, diru eta unitateetarako testu-aurreprozesatzaile barneratua ditu. Oso egokia da ertz-hedapenerako eta latentzia txikiko aplikazioetarako.

Honako hauentzako onena: TTS arin eta azkarra, ertz-hedapena, latentzia txikiko aplikazioak

Saiatu doan

BarkBark Lehenetsia

Transformadorean oinarritutako testu-audio eredua, hizketa, musika eta soinu-efektu errealistak sortzen dituena.

Garatzailea: Suno · Lizentzia: MIT

Saiatu.

Bark SmallBark Small Lehenetsia

Bark-en bertsio arinagoa, inferentzia azkarragoa eta memoria-erabilera txikiagoa.

Garatzailea: Suno · Lizentzia: MIT

Saiatu.

CosyVoice 2CosyVoice 2 Lehenetsia

Alibabaren streaming TTS eskalagarria, giza paritatearen naturaltasunarekin eta ia zero latentziarekin.

Garatzailea: Alibaba (Tongyi Lab) · Lizentzia: Apache 2.0

Saiatu.

Dia TTSDia TTS Lehenetsia

Multi-hiztun elkarrizketa sortzeko eredua, hiztun arteko elkarrizketak sortzen dituena.

Garatzailea: Nari Labs · Lizentzia: Apache 2.0

Saiatu.

Parler TTSParler TTS Lehenetsia

Deskribatu nahi duzun ahotsa hizkuntza naturalean eta Parler-ek bat datorren hizketa sortuko du.

Garatzailea: Hugging Face · Lizentzia: Apache 2.0

Saiatu.

GLM-TTSGLM-TTS Lehenetsia

Iturburu irekiko TTS ereduen artean karaktere-errore-tasa txikiena lortzen du.

Garatzailea: Zhipu AI · Lizentzia: GLM-4 License

Saiatu.

IndexTTS-2IndexTTS-2 Lehenetsia

Zero-shot TTS, emozioen kontrol finarekin eta adierazkortasun handiarekin.

Garatzailea: Index Team · Lizentzia: Bilibili Model License

Saiatu.

Spark TTSSpark TTS Lehenetsia

TTS ahots klonaketa, emozio kontrolagarriekin eta hizketa-estiloarekin, aholkuen bidez.

Garatzailea: SparkAudio · Lizentzia: CC BY-NC-SA 4.0

Saiatu.

GPT-SoVITSGPT-SoVITS Lehenetsia

Ahotsa klonatzeko TTS, edozein ahots erreplikatzen duena 5 segundoko audio batetik.

Garatzailea: RVC-Boss · Lizentzia: MIT

Saiatu.

OrpheusOrpheus Lehenetsia

100.000 orduko hizketa-datuetan trebatutako giza mailako TTS emozionalaren eredua.

Garatzailea: Canopy Labs · Lizentzia: Llama 3.2 Community

Saiatu.

Qwen3 TTSQwen3 TTS Lehenetsia

Alibabaren hizkuntza anitzeko TTS ahots klonazioarekin, aurrezarritako ahotsak eta ahots diseinua testutik.

Garatzailea: Alibaba (Qwen) · Lizentzia: Apache 2.0

Saiatu.

Chatterbox TurboChatterbox Turbo Lehenetsia

Chatterbox azkarragoa, 200 ms-tik beherako latentzia eta etiketa paralinguistikoekin barreak, eztula eta abar adierazteko.

Garatzailea: Resemble AI · Lizentzia: MIT

Saiatu.

Dia 2Dia 2 Lehenetsia

Transmisio-lehen TTS elkarrizketa, hiztun anitzeko elkarrizketa eta seinale paralinguistikoekin.

Garatzailea: Nari Labs · Lizentzia: Apache 2.0

Saiatu.

VoxCPMVoxCPM Lehenetsia

Tokenizerrik gabeko TTS-ak 44.1kHz-ko audioa ekoizten du testuinguru-kontzienteko paragrafo-koherentziarekin.

Garatzailea: OpenBMB · Lizentzia: Apache 2.0

Saiatu.

TADATADA Lehenetsia

Zero haluzinazio TTS testu-akustiko lerrokatze bikoitzarekin, LLM TTS konparagarria baino 5x azkarragoa.

Garatzailea: Hume AI · Lizentzia: MIT

Saiatu.

VibeVoiceVibeVoice Lehenetsia

Microsoft-en modeloa forma luzeko hiztun anitzeko edukietarako, podcastak eta audioliburuak adibidez.

Garatzailea: Microsoft · Lizentzia: MIT

Saiatu.

CosyVoice3CosyVoice3 Lehenetsia

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Garatzailea: Alibaba (FunAudioLLM) · Lizentzia: Apache 2.0

Saiatu.

ChatterboxChatterbox Premium

Zero-shot ahots klonazio modernoa, Resemble AI-ren emozioen kontrolarekin.

Kalitatea:

Saiatu.

Tortoise TTSTortoise TTS Premium

Multi-ahots testu-hizketa arkitektura autoregresiboarekin kalitatean zentratzen da.

Kalitatea:

Saiatu.

StyleTTS 2StyleTTS 2 Premium

Hizkuntzalaritza historikoa hizkuntzen sorrera eta garapena aztertzen du, hizkuntzalaritza historikoaren ikuspegitik.

Kalitatea:

Saiatu.

OpenVoiceOpenVoice Premium

Berehalako ahots klonaketa, estilo, emozio eta akzentuen kontrol zorrotzarekin.

Kalitatea:

Saiatu.

Sesame CSMSesame CSM Premium

Hizkuntza naturala hizkera naturala da, hizkera naturala hizkera naturala da eta hizkera naturala hizkera naturala da.

Kalitatea:

Saiatu.

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Kalitatea:

Saiatu.

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Kalitatea:

Saiatu.

CosyVoice 2CosyVoice 2

Alibabaren streaming TTS eskalagarria, giza paritatearen naturaltasunarekin eta ia zero latentziarekin.

Hizkuntzak: en, zh, ja, ko, fr, de, it, es

Klonatu ahotsa

GLM-TTSGLM-TTS

Iturburu irekiko TTS ereduen artean karaktere-errore-tasa txikiena lortzen du.

Hizkuntzak: en, zh

Klonatu ahotsa

IndexTTS-2IndexTTS-2

Zero-shot TTS, emozioen kontrol finarekin eta adierazkortasun handiarekin.

Hizkuntzak: en, zh

Klonatu ahotsa

Spark TTSSpark TTS

TTS ahots klonaketa, emozio kontrolagarriekin eta hizketa-estiloarekin, aholkuen bidez.

Hizkuntzak: en, zh

Klonatu ahotsa

GPT-SoVITSGPT-SoVITS

Ahotsa klonatzeko TTS, edozein ahots erreplikatzen duena 5 segundoko audio batetik.

Hizkuntzak: en, zh, ja, ko

Klonatu ahotsa

ChatterboxChatterbox

Zero-shot ahots klonazio modernoa, Resemble AI-ren emozioen kontrolarekin.

Hizkuntzak: en

Klonatu ahotsa

Tortoise TTSTortoise TTS

Multi-ahots testu-hizketa arkitektura autoregresiboarekin kalitatean zentratzen da.

Hizkuntzak: en

Klonatu ahotsa

OpenVoiceOpenVoice

Berehalako ahots klonaketa, estilo, emozio eta akzentuen kontrol zorrotzarekin.

Hizkuntzak: en, zh, ja, ko, fr, de, es, it

Klonatu ahotsa

Qwen3 TTSQwen3 TTS

Alibabaren hizkuntza anitzeko TTS ahots klonazioarekin, aurrezarritako ahotsak eta ahots diseinua testutik.

Hizkuntzak: en, zh, ja, ko, de, fr, ru, pt, es, it

Klonatu ahotsa

Chatterbox TurboChatterbox Turbo

Chatterbox azkarragoa, 200 ms-tik beherako latentzia eta etiketa paralinguistikoekin barreak, eztula eta abar adierazteko.

Hizkuntzak: en

Klonatu ahotsa

VoxCPMVoxCPM

Tokenizerrik gabeko TTS-ak 44.1kHz-ko audioa ekoizten du testuinguru-kontzienteko paragrafo-koherentziarekin.

Hizkuntzak: en, zh

Klonatu ahotsa

OuteTTSOuteTTS

LLMn oinarritutako TTS bat, PUZ, GPU edo nabigatzaile batean exekutatzen dena llama.cpp eta Transformers.js bidez.

Hizkuntzak: en

Klonatu ahotsa

Pocket TTSPocket TTS

Kyutai-ren 100M parametrodun modelo arina, ahots klonaketa lagin bakar batetik.

Hizkuntzak: en, fr

Klonatu ahotsa

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Hizkuntzak: en, zh, ja, ko, de, es, fr, it, ru

Klonatu ahotsa

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Hizkuntzak: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Klonatu ahotsa

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Hizkuntzak: en, zh

Klonatu ahotsa

Garatzaileentzako lehen APIa

OpenAI-rekin bateragarria den REST APIa. Amaierako puntu bat, 22 modelo baino gehiago. Denbora errealeko aplikazioentzako streaming euskarria.

  • OpenAI-rekin bateragarria den formatua
  • TTS streaming-a denbora errealeko aplikazioetarako
  • Batch prozesamendua lan handietarako
  • Webhook jakinarazpenak
Ikusi API dokumentazioa
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Prezio sinple eta gardenak

Hasi libre. Eskalatu hazten zarenean.

Libre

$0

15.000 karaktere

  • Kokoro, Piper, VITS, MeloTTS
  • 500 karaktereko muga
  • 3 gen/ordua (konturik ez)
Izena eman doan

Abiarazlea

$9/% 1 MB

500 kreditu/hilabete

  • 22+ modelo guztiak
  • 100.000 karaktere belaunaldiko
  • Ahots klonaketa
Hasi
Ospetsuenak

Pro

$29/% 1 MB

2.000 kreditu/hilabete

  • Hasierako dena
  • API atzipena
  • Lehentasunaren prozesamendua
Eskuratu Pro

Negozioak

$99/% 1 MB

10.000 kreditu/hilean

  • Dena Pro-n
  • Bulk APIa
  • Lehentasunaren ilara
Eskuratu negozioa

Ikusi plan guztiak, kreditu-paketeak barne →

Maiz egiten diren galderak

TTS.ai adimen artifizialeko ahots-plataformarik osoena da, 22+ testu-hizketa eredu, ahots-klonaketa, hizketa-testu eta audio-tresna eskaintzen dituena. Eredu guztiak kode irekikoak dira, hornitzaileen blokeorik gabe.

Bai! TTS.aik Kokoro, Piper, VITS eta MeloTTS ereduekin doako testu-hizketa eskaintzen du. Ez da konturik behar. Izena eman 15.000 karaktere doan lortzeko eta eredu guztiak erabiltzeko. Ordainpeko planak $9/hilean hasten dira.

Abiadura hobetzeko, erabili Kokoro edo Piper. Kalitatea hobetzeko, saiatu CosyVoice 2 edo StyleTTS 2. Ahotsa klonatzeko, erabili Chatterbox edo GPT-SoVITS. Elkarrizketarako, erabili Dia TTS. Saiatu testu berean hainbat eredu konparatzen.

Bai. OpenAI-rekin bateragarria den REST APIa TTS, STT, ahots klonaketa eta audio-tresnetarako. Pro (29 $/hilean) eta Enterprise (99 $/hilean) planetan eskuragarri. Ikusi dokumentazioa hemen: tts.ai/api/.

Ahots-kalitatea modeloaren arabera aldatzen da. CosyVoice 2, StyleTTS 2 eta Chatterbox bezalako premium-modeloek ia giza-kalitatea duten hitzak sortzen dituzte, intonazio eta emozio naturalekin. Kokoro bezalako modelo libreek kalitate bikaina eskaintzen dute kasu gehienetan.

TTS.ai-k 30 hizkuntza baino gehiago onartzen ditu bere modelo-liburutegian. Ingelesa da gehien onartzen den hizkuntza, baina CosyVoice 2 bezalako modeloek txinera, japoniera eta koreera onartzen dituzte; GPT-SoVITS-ek txinera, japoniera, koreera eta ingelesa kudeatzen ditu; eta MeloTTS-ek ingelesa, gaztelania, frantsesa, txinera, japoniera eta koreera onartzen ditu.

Bai. Prozesamendu guztiak gure GPU zerbitzari dedikatuetan gertatzen dira. Ez dugu zure testu-sarrera edo sortutako audioa gordetzen entregatu ondoren. Klonatzeko igotako ahots-laginak uneko saiorako bakarrik erabiltzen dira eta ez dira gordetzen. Inoiz ez ditugu zure datuak hirugarrenekin partekatzen edo ereduak entrenatzeko erabiltzen.

Bai. TTS.ai-n sortutako audio guztiak zureak dira erabilera komertzialerako, YouTubeko bideoak, podcastak, audioliburuak, aplikazioak, iragarkiak eta produktuak barne. Gure ereduak kode irekikoak dira, baimendutako lizentziapean (MIT, Apache 2.0). Ez da errentagarritasunik edo aitorpenik behar.

TTS.ai-k WAV formatuan sortzen du audioa lehenespenez, kalitate maximoa lortzeko. MP3, FLAC, OGG edo M4A formatura bihur dezakezu Audio Converter tresna dohainik erabiliz. APIak onartzen du irteera-formatu nahiagoa zuzenean eskaeran zehaztea.

Kargatu klonatu nahi duzun ahotsaren audio-lagin labur bat (5 segundo gutxienez), eta idatzi edozein testu ahots horretan hizketa sortzeko. Chatterbox, GPT-SoVITS eta CosyVoice 2 ereduek ahots-klonazioa onartzen dute. Ahots klonatuak tonua, azentu eta hizketa-estiloa hartzen ditu.

Libreko modeloek (Kokoro, Piper, VITS, MeloTTS) ez dute konturik behar eta zero kreditu balio dute. Modelo estandarrek (2 kreditu/1.000 karaktere) Bark, CosyVoice 2, F5-TTS eta Dia dituzte. Premium modeloek (4 kreditu/1.000 karaktere) OpenVoice, Chatterbox, StyleTTS 2 eta Tortoise dituzte. Ordaindutako modeloek, oro har, kalitate handiagoa, ahots gehiago eta ezaugarri gehigarriak eskaintzen dituzte, hala nola ahotsaren klonaketa.

Bai. APIak batch prozesamendua onartzen du testu-hizketa bolumen handiak bihurtzeko. Bidali eskaera anitz eta eskuratu emaitzak asinkronikoki lan-UUIDak erabiliz. Enpresa-planek (99 $/hilean) lehentasunezko ilara-atzipena dute batch prozesamendu azkarragoa egiteko. Oso egokia audioliburu ekoizpenerako, ikastaro-edukietarako eta eskala handiko ahots-proiektuetarako.
4.1/5 (21)

Zer hobetu dezakegu? Zure iritziak arazoak konpontzen laguntzen digu.

Hasi AI ahotsa erabiltzen gaur

Bat egin TTS.ai erabiltzen duten sortzaile, garatzaile eta enpresekin