Free AI Testutik hizketara

20+ kode irekiko ereduak, 107+ ahotsak, 32+ Hizkuntzak. Ez da konturik behar.

1K+
sortzaileak
2K+
belaunaldi
20+
AI modeloak
107+
ahotsak
0/500 karaktereak Libre
TTS.ai gustatzen zaizu? Esaiozu zure lagunei!

Ahots-AIrako behar duzun guztia

Iturburu irekiko AI ereduetan oinarritutako 30+ tresna

20+ AI ahots modeloak

Iturburu irekiko TTS ereduen bildumarik osoena plataforma bakar batean

KokoroKokoro Free

Kokoro 82 milioi parametro dituen testu-hizketa modelo bat da, bere pisu-klasearen gainetik dagoena. Bere tamaina txikia izan arren, hizketa oso naturala eta adierazgarria ekoizten du. Kokorok hainbat hizkuntza onartzen ditu, besteak beste, ingelesa, japoniera, txinera eta koreera, hainbat ahots adierazgarrirekin. Oso azkar exekutatzen da — GPU batean denbora errealean baino ia 100 aldiz azkarrago sortzen du audioa.

Honako hauentzako onena: Kalitate handiko TTS, atzerapen minimoa, streaming aplikazioak

Saiatu doan

PiperPiper Free

Piper Rhasspy-k garatutako testu-hizketa motor arina da, VITS eta larynx arkitekturak erabiltzen dituena. Erabat PUZ-n exekutatzen da, eta, beraz, ezin hobea da ertz-gailuetarako, etxeko automatizaziorako eta lineaz kanpoko TTS behar duten aplikazioetarako. 30 hizkuntza baino gehiagoko 100 ahots baino gehiagorekin, Piper-ek hizketa naturala ematen du denbora errealean, Raspberry Pi 4-n ere bai.

Honako hauentzako onena: Aurrebista azkarrak, erabilerraztasuna eta aplikazio kapsulatuak

Saiatu doan

VITSVITS Free

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) amaieratik amaierara TTS metodo paralelo bat da, gaur egungo bi faseko ereduek baino soinu naturalagoa sortzen duena. Inferentzia bariazionala hartzen du, fluxu normalizatzaileekin eta entrenamendu-prozesu aurkariarekin handitua, naturaltasunean hobekuntza nabarmena lortzeko.

Honako hauentzako onena: Helburu orokorreko testu-hizketa prosodia naturalekin

Saiatu doan

MeloTTSMeloTTS Free

MyShell.ai-ren MeloTTS hizkuntz anitzeko TTS liburutegi bat da, ingelesa (amerikarra, britainiarra, indiarra, australiarra), gaztelania, frantsesa, txinera, japoniera eta koreera onartzen dituena. Oso azkarra da, testua ia denbora errealean prozesatzen du PUZ soilarekin. MeloTTS ekoizpenerako diseinatuta dago, eta PUZ eta GPU inferentzia onartzen ditu.

Honako hauentzako onena: TTS azkarra eta hizkuntza anitzekoa behar duten ekoizpen-aplikazioak

Saiatu doan

BarkBark Standard

Transformadorean oinarritutako testu-audio eredua, hizketa, musika eta soinu-efektu errealistak sortzen dituena.

Garatzailea: Suno · Lizentzia: MIT

Saiatu.

Bark SmallBark Small Standard

Bark-en bertsio arinagoa, inferentzia azkarragoa eta memoria-erabilera txikiagoa.

Garatzailea: Suno · Lizentzia: MIT

Saiatu.

CosyVoice 2CosyVoice 2 Standard

Alibabaren streaming TTS eskalagarria, giza paritatearen naturaltasunarekin eta ia zero latentziarekin.

Garatzailea: Alibaba (Tongyi Lab) · Lizentzia: Apache 2.0

Saiatu.

Dia TTSDia TTS Standard

Multi-hiztun elkarrizketa sortzeko eredua, hiztun arteko elkarrizketak sortzen dituena.

Garatzailea: Nari Labs · Lizentzia: Apache 2.0

Saiatu.

Parler TTSParler TTS Standard

Deskribatu nahi duzun ahotsa hizkuntza naturalean eta Parler-ek bat datorren hizketa sortuko du.

Garatzailea: Hugging Face · Lizentzia: Apache 2.0

Saiatu.

GLM-TTSGLM-TTS Standard

Iturburu irekiko TTS ereduen artean karaktere-errore-tasa txikiena lortzen du.

Garatzailea: Zhipu AI · Lizentzia: GLM-4 License

Saiatu.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS, emozioen kontrol finarekin eta adierazkortasun handiarekin.

Garatzailea: Index Team · Lizentzia: Bilibili Model License

Saiatu.

Spark TTSSpark TTS Standard

TTS ahots klonaketa, emozio kontrolagarriekin eta hizketa-estiloarekin, aholkuen bidez.

Garatzailea: SparkAudio · Lizentzia: CC BY-NC-SA 4.0

Saiatu.

GPT-SoVITSGPT-SoVITS Standard

Ahotsa klonatzeko TTS, edozein ahots erreplikatzen duena 5 segundoko audio batetik.

Garatzailea: RVC-Boss · Lizentzia: MIT

Saiatu.

OrpheusOrpheus Standard

100.000 orduko hizketa-datuetan trebatutako giza mailako TTS emozionalaren eredua.

Garatzailea: Canopy Labs · Lizentzia: Llama 3.2 Community

Saiatu.

Qwen3 TTSQwen3 TTS Standard

Alibabaren hizkuntza anitzeko TTS ahots klonazioarekin, aurrezarritako ahotsak eta ahots diseinua testutik.

Garatzailea: Alibaba (Qwen) · Lizentzia: Apache 2.0

Saiatu.

ChatterboxChatterbox Premium

Zero-shot ahots klonazio modernoa, Resemble AI-ren emozioen kontrolarekin.

Kalitatea:

Saiatu.

Tortoise TTSTortoise TTS Premium

Multi-ahots testu-hizketa arkitektura autoregresiboarekin kalitatean zentratzen da.

Kalitatea:

Saiatu.

StyleTTS 2StyleTTS 2 Premium

Hizkuntzalaritza historikoa hizkuntzen sorrera eta garapena aztertzen du, hizkuntzalaritza historikoaren ikuspegitik.

Kalitatea:

Saiatu.

OpenVoiceOpenVoice Premium

Berehalako ahots klonaketa, estilo, emozio eta akzentuen kontrol zorrotzarekin.

Kalitatea:

Saiatu.

Sesame CSMSesame CSM Premium

Hizkuntza naturala hizkera naturala da, hizkera naturala hizkera naturala da eta hizkera naturala hizkera naturala da.

Kalitatea:

Saiatu.

CosyVoice 2CosyVoice 2

Alibabaren streaming TTS eskalagarria, giza paritatearen naturaltasunarekin eta ia zero latentziarekin.

Hizkuntzak: en, zh, ja, ko, fr, de, it, es

Klonatu ahotsa

GLM-TTSGLM-TTS

Iturburu irekiko TTS ereduen artean karaktere-errore-tasa txikiena lortzen du.

Hizkuntzak: en, zh

Klonatu ahotsa

IndexTTS-2IndexTTS-2

Zero-shot TTS, emozioen kontrol finarekin eta adierazkortasun handiarekin.

Hizkuntzak: en, zh

Klonatu ahotsa

Spark TTSSpark TTS

TTS ahots klonaketa, emozio kontrolagarriekin eta hizketa-estiloarekin, aholkuen bidez.

Hizkuntzak: en, zh

Klonatu ahotsa

GPT-SoVITSGPT-SoVITS

Ahotsa klonatzeko TTS, edozein ahots erreplikatzen duena 5 segundoko audio batetik.

Hizkuntzak: en, zh, ja, ko

Klonatu ahotsa

ChatterboxChatterbox

Zero-shot ahots klonazio modernoa, Resemble AI-ren emozioen kontrolarekin.

Hizkuntzak: en

Klonatu ahotsa

Tortoise TTSTortoise TTS

Multi-ahots testu-hizketa arkitektura autoregresiboarekin kalitatean zentratzen da.

Hizkuntzak: en

Klonatu ahotsa

OpenVoiceOpenVoice

Berehalako ahots klonaketa, estilo, emozio eta akzentuen kontrol zorrotzarekin.

Hizkuntzak: en, zh, ja, ko, fr, de, es, it

Klonatu ahotsa

Qwen3 TTSQwen3 TTS

Alibabaren hizkuntza anitzeko TTS ahots klonazioarekin, aurrezarritako ahotsak eta ahots diseinua testutik.

Hizkuntzak: en, zh, ja, ko, de, fr, ru, pt, es, it

Klonatu ahotsa

Garatzaileentzako lehen APIa

OpenAI-rekin bateragarria den REST APIa. Amaierako puntu bat, 22 modelo baino gehiago. Denbora errealeko aplikazioentzako streaming euskarria.

  • OpenAI-rekin bateragarria den formatua
  • TTS streaming-a denbora errealeko aplikazioetarako
  • Batch prozesamendua lan handietarako
  • Webhook jakinarazpenak
Ikusi API dokumentazioa
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Prezio sinple eta gardenak

Hasi libre. Eskalatu hazten zarenean.

Libre

$0

15.000 karaktere

  • Kokoro, Piper, VITS, MeloTTS
  • 500 karaktereko muga
  • 3 gen/ordua (konturik ez)
Izena eman doan

Abiarazlea

$9/% 1 MB

500 kreditu/hilabete

  • 22+ modelo guztiak
  • 100.000 karaktere belaunaldiko
  • Ahots klonaketa
Hasi
Ospetsuenak

Pro

$29/% 1 MB

2.000 kreditu/hilabete

  • Hasierako dena
  • API atzipena
  • Lehentasunaren prozesamendua
Eskuratu Pro

Negozioak

$99/% 1 MB

10.000 kreditu/hilean

  • Dena Pro-n
  • Bulk APIa
  • Lehentasunaren ilara
Eskuratu negozioa

Ikusi plan guztiak, kreditu-paketeak barne →

Maiz egiten diren galderak

TTS.ai adimen artifizialeko ahots-plataformarik osoena da, 22+ testu-hizketa eredu, ahots-klonaketa, hizketa-testu eta audio-tresna eskaintzen dituena. Eredu guztiak kode irekikoak dira, hornitzaileen blokeorik gabe.

Bai! TTS.aik Kokoro, Piper, VITS eta MeloTTS ereduekin doako testu-hizketa eskaintzen du. Ez da konturik behar. Izena eman 15.000 karaktere doan lortzeko eta eredu guztiak erabiltzeko. Ordainpeko planak $9/hilean hasten dira.

Abiadura hobetzeko, erabili Kokoro edo Piper. Kalitatea hobetzeko, saiatu CosyVoice 2 edo StyleTTS 2. Ahotsa klonatzeko, erabili Chatterbox edo GPT-SoVITS. Elkarrizketarako, erabili Dia TTS. Saiatu testu berean hainbat eredu konparatzen.

Bai. OpenAI-rekin bateragarria den REST APIa TTS, STT, ahots klonaketa eta audio-tresnetarako. Pro (29 $/hilean) eta Enterprise (99 $/hilean) planetan eskuragarri. Ikusi dokumentazioa hemen: tts.ai/api/.

Ahots-kalitatea modeloaren arabera aldatzen da. CosyVoice 2, StyleTTS 2 eta Chatterbox bezalako premium-modeloek ia giza-kalitatea duten hitzak sortzen dituzte, intonazio eta emozio naturalekin. Kokoro bezalako modelo libreek kalitate bikaina eskaintzen dute kasu gehienetan.

TTS.ai-k 30 hizkuntza baino gehiago onartzen ditu bere modelo-liburutegian. Ingelesa da gehien onartzen den hizkuntza, baina CosyVoice 2 bezalako modeloek txinera, japoniera eta koreera onartzen dituzte; GPT-SoVITS-ek txinera, japoniera, koreera eta ingelesa kudeatzen ditu; eta MeloTTS-ek ingelesa, gaztelania, frantsesa, txinera, japoniera eta koreera onartzen ditu.

Bai. Prozesamendu guztiak gure GPU zerbitzari dedikatuetan gertatzen dira. Ez dugu zure testu-sarrera edo sortutako audioa gordetzen entregatu ondoren. Klonatzeko igotako ahots-laginak uneko saiorako bakarrik erabiltzen dira eta ez dira gordetzen. Inoiz ez ditugu zure datuak hirugarrenekin partekatzen edo ereduak entrenatzeko erabiltzen.

Bai. TTS.ai-n sortutako audio guztiak zureak dira erabilera komertzialerako, YouTubeko bideoak, podcastak, audioliburuak, aplikazioak, iragarkiak eta produktuak barne. Gure ereduak kode irekikoak dira, baimendutako lizentziapean (MIT, Apache 2.0). Ez da errentagarritasunik edo aitorpenik behar.

TTS.ai-k WAV formatuan sortzen du audioa lehenespenez, kalitate maximoa lortzeko. MP3, FLAC, OGG edo M4A formatura bihur dezakezu Audio Converter tresna dohainik erabiliz. APIak onartzen du irteera-formatu nahiagoa zuzenean eskaeran zehaztea.

Kargatu klonatu nahi duzun ahotsaren audio-lagin labur bat (5 segundo gutxienez), eta idatzi edozein testu ahots horretan hizketa sortzeko. Chatterbox, GPT-SoVITS eta CosyVoice 2 ereduek ahots-klonazioa onartzen dute. Ahots klonatuak tonua, azentu eta hizketa-estiloa hartzen ditu.

Libreko modeloek (Kokoro, Piper, VITS, MeloTTS) ez dute konturik behar eta zero kreditu balio dute. Modelo estandarrek (2 kreditu/1.000 karaktere) Bark, CosyVoice 2, F5-TTS eta Dia dituzte. Premium modeloek (4 kreditu/1.000 karaktere) OpenVoice, Chatterbox, StyleTTS 2 eta Tortoise dituzte. Ordaindutako modeloek, oro har, kalitate handiagoa, ahots gehiago eta ezaugarri gehigarriak eskaintzen dituzte, hala nola ahotsaren klonaketa.

Bai. APIak batch prozesamendua onartzen du testu-hizketa bolumen handiak bihurtzeko. Bidali eskaera anitz eta eskuratu emaitzak asinkronikoki lan-UUIDak erabiliz. Enpresa-planek (99 $/hilean) lehentasunezko ilara-atzipena dute batch prozesamendu azkarragoa egiteko. Oso egokia audioliburu ekoizpenerako, ikastaro-edukietarako eta eskala handiko ahots-proiektuetarako.
4.0/5 (8)

Hasi AI ahotsa erabiltzen gaur

Bat egin TTS.ai erabiltzen duten sortzaile, garatzaile eta enpresekin