Free AI Testutik hizketara

22+ kode irekiko ereduak, 100+ ahotsak, 32+ Hizkuntzak. Ez da konturik behar.

0/500 karaktereak Libre
Kreditu-txartelik ez 50 doako kreditu 32+ hizkuntzak Erabilera komertziala Ados
0:00 / 0:00
Deskargatu audioa Esteka 24 ordutan iraungiko da
TTS.ai gustatzen zaizu? Esaiozu zure lagunei!

Ahots-AIrako behar duzun guztia

26 tresna, 24+ kode irekiko AI ereduetan oinarrituta

22+ AI ahots modelo

Iturburu irekiko TTS ereduen bildumarik osoena plataforma bakar batean

Kokoro Free

Kokoro 82 milioi parametro dituen testu-hizketa modelo bat da, bere pisu-klasearen gainetik dagoena. Bere tamaina txikia izan arren, hizketa oso naturala eta adierazgarria ekoizten du. Kokorok hainbat hizkuntza onartzen ditu, besteak beste, ingelesa, japoniera, txinera eta koreera, hainbat ahots adierazgarrirekin. Oso azkar exekutatzen da — GPU batean denbora errealean baino ia 100 aldiz azkarrago sortzen du audioa.

Honako hauentzako onena: Kalitate handiko TTS, atzerapen minimoa, streaming aplikazioak

Saiatu doan

Piper Free

Piper Rhasspy-k garatutako testu-hizketa motor arina da, VITS eta larynx arkitekturak erabiltzen dituena. Erabat PUZ-n exekutatzen da, eta, beraz, ezin hobea da ertz-gailuetarako, etxeko automatizaziorako eta lineaz kanpoko TTS behar duten aplikazioetarako. 30 hizkuntza baino gehiagoko 100 ahots baino gehiagorekin, Piper-ek hizketa naturala ematen du denbora errealean, Raspberry Pi 4-n ere bai.

Honako hauentzako onena: Aurrebista azkarrak, erabilerraztasuna eta aplikazio kapsulatuak

Saiatu doan

VITS Free

VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) amaieratik amaierara TTS metodo paralelo bat da, gaur egungo bi faseko ereduek baino soinu naturalagoa sortzen duena. Inferentzia bariazionala hartzen du, fluxu normalizatzaileekin eta entrenamendu-prozesu aurkariarekin handitua, naturaltasunean hobekuntza nabarmena lortzeko.

Honako hauentzako onena: Helburu orokorreko testu-hizketa prosodia naturalekin

Saiatu doan

MeloTTS Free

MyShell.ai-ren MeloTTS hizkuntz anitzeko TTS liburutegi bat da, ingelesa (amerikarra, britainiarra, indiarra, australiarra), gaztelania, frantsesa, txinera, japoniera eta koreera onartzen dituena. Oso azkarra da, testua ia denbora errealean prozesatzen du PUZ soilarekin. MeloTTS ekoizpenerako diseinatuta dago, eta PUZ eta GPU inferentzia onartzen ditu.

Honako hauentzako onena: TTS azkarra eta hizkuntza anitzekoa behar duten ekoizpen-aplikazioak

Saiatu doan

Bark Standard

Transformadorean oinarritutako testu-audio eredua, hizketa, musika eta soinu-efektu errealistak sortzen dituena.

Garatzailea: Suno · Lizentzia: MIT

Saiatu.

Bark Small Standard

Bark-en bertsio arinagoa, inferentzia azkarragoa eta memoria-erabilera txikiagoa.

Garatzailea: Suno · Lizentzia: MIT

Saiatu.

CosyVoice 2 Standard

Alibabaren streaming TTS eskalagarria, giza paritatearen naturaltasunarekin eta ia zero latentziarekin.

Garatzailea: Alibaba (Tongyi Lab) · Lizentzia: Apache 2.0

Saiatu.

Dia TTS Standard

Multi-hiztun elkarrizketa sortzeko eredua, hiztun arteko elkarrizketak sortzen dituena.

Garatzailea: Nari Labs · Lizentzia: Apache 2.0

Saiatu.

Parler TTS Standard

Deskribatu nahi duzun ahotsa hizkuntza naturalean eta Parler-ek bat datorren hizketa sortuko du.

Garatzailea: Hugging Face · Lizentzia: Apache 2.0

Saiatu.

IndexTTS-2 Standard

Zero-shot TTS, emozioen kontrol finarekin eta adierazkortasun handiarekin.

Garatzailea: Index Team · Lizentzia: Apache 2.0

Saiatu.

Spark TTS Standard

TTS ahots klonaketa, emozio kontrolagarriekin eta hizketa-estiloarekin, aholkuen bidez.

Garatzailea: SparkAudio · Lizentzia: Apache 2.0

Saiatu.

GPT-SoVITS Standard

Ahotsa klonatzeko TTS, edozein ahots erreplikatzen duena 5 segundoko audio batetik.

Garatzailea: RVC-Boss · Lizentzia: MIT

Saiatu.

Orpheus Standard

100.000 orduko hizketa-datuetan trebatutako giza mailako TTS emozionalaren eredua.

Garatzailea: Canopy Labs · Lizentzia: Llama 3.2 Community

Saiatu.

Qwen3 TTS Standard

Alibabaren hizkuntza anitzeko TTS ahots klonazioarekin, aurrezarritako ahotsak eta ahots diseinua testutik.

Garatzailea: Alibaba (Qwen) · Lizentzia: Apache 2.0

Saiatu.

Chatterbox Premium

Zero-shot ahots klonazio modernoa, Resemble AI-ren emozioen kontrolarekin.

Kalitatea:

Saiatu.

Tortoise TTS Premium

Multi-ahots testu-hizketa arkitektura autoregresiboarekin kalitatean zentratzen da.

Kalitatea:

Saiatu.

StyleTTS 2 Premium

Hizkuntzalaritza historikoa hizkuntzen sorrera eta garapena aztertzen du, hizkuntzalaritza historikoaren ikuspegitik.

Kalitatea:

Saiatu.

OpenVoice Premium

Berehalako ahots klonaketa, estilo, emozio eta akzentuen kontrol zorrotzarekin.

Kalitatea:

Saiatu.

CosyVoice 2

Alibabaren streaming TTS eskalagarria, giza paritatearen naturaltasunarekin eta ia zero latentziarekin.

Hizkuntzak: en, zh, ja, ko, fr, de, it, es

Klonatu ahotsa

IndexTTS-2

Zero-shot TTS, emozioen kontrol finarekin eta adierazkortasun handiarekin.

Hizkuntzak: en, zh

Klonatu ahotsa

Spark TTS

TTS ahots klonaketa, emozio kontrolagarriekin eta hizketa-estiloarekin, aholkuen bidez.

Hizkuntzak: en, zh

Klonatu ahotsa

GPT-SoVITS

Ahotsa klonatzeko TTS, edozein ahots erreplikatzen duena 5 segundoko audio batetik.

Hizkuntzak: en, zh, ja, ko

Klonatu ahotsa

Chatterbox

Zero-shot ahots klonazio modernoa, Resemble AI-ren emozioen kontrolarekin.

Hizkuntzak: en

Klonatu ahotsa

Tortoise TTS

Multi-ahots testu-hizketa arkitektura autoregresiboarekin kalitatean zentratzen da.

Hizkuntzak: en

Klonatu ahotsa

OpenVoice

Berehalako ahots klonaketa, estilo, emozio eta akzentuen kontrol zorrotzarekin.

Hizkuntzak: en, zh, ja, ko, fr, de, es, it

Klonatu ahotsa

Qwen3 TTS

Alibabaren hizkuntza anitzeko TTS ahots klonazioarekin, aurrezarritako ahotsak eta ahots diseinua testutik.

Hizkuntzak: en, zh, ja, ko, de, fr, ru, pt, es, it

Klonatu ahotsa

Garatzaileentzako lehen APIa

OpenAI-rekin bateragarria den REST APIa. Amaierako puntu bat, 22 modelo baino gehiago. Denbora errealeko aplikazioentzako streaming euskarria.

  • OpenAI-rekin bateragarria den formatua
  • TTS streaming-a denbora errealeko aplikazioetarako
  • Batch prozesamendua lan handietarako
  • Webhook jakinarazpenak
Ikusi API dokumentazioa
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Prezio sinple eta gardenak

Hasi libre. Eskalatu hazten zarenean.

Libre

$0

50 kreditu

  • Kokoro, Piper, VITS, MeloTTS
  • 500 karaktereko muga
  • 3 gen/ordua (konturik ez)
Izena eman doan

Abiarazlea

$9/% 1 MB

500 kreditu/hilabete

  • 22+ modelo guztiak
  • 5.000 karaktereko muga
  • Ahots klonaketa
Hasi
Ospetsuenak

Pro

$29/% 1 MB

2.000 kreditu/hilabete

  • Hasierako dena
  • API atzipena
  • Lehentasunaren prozesamendua
Eskuratu Pro

Enterprise

$99/% 1 MB

10.000 kreditu/hilean

  • Dena Pro-n
  • Bulk APIa
  • Lehentasunaren ilara
Harremanetarako salmentak

Ikusi plan guztiak, kreditu-paketeak barne →

Maiz egiten diren galderak

TTS.ai adimen artifizialeko ahots-plataformarik osoena da, 22+ testu-hizketa eredu, ahots-klonaketa, hizketa-testu eta audio-tresna eskaintzen dituena. Eredu guztiak kode irekikoak dira, hornitzaileen blokeorik gabe.

Bai! TTS.ai-k Kokoro, Piper, VITS eta MeloTTS ereduekin doako testu-hizketa eskaintzen du. Ez da konturik behar. Izena eman 50 doako kreditu lortzeko eta eredu guztiak atzitzeko. Ordaindutako planak $9/hilean hasten dira.

Abiadura hobetzeko, erabili Kokoro edo Piper. Kalitatea hobetzeko, saiatu CosyVoice 2 edo StyleTTS 2. Ahotsa klonatzeko, erabili Chatterbox edo GPT-SoVITS. Elkarrizketarako, erabili Dia TTS. Saiatu testu berean hainbat eredu konparatzen.

Bai. OpenAI-rekin bateragarria den REST APIa TTS, STT, ahots klonaketa eta audio-tresnetarako. Pro (29 $/hilean) eta Enterprise (99 $/hilean) planetan eskuragarri. Ikusi dokumentazioa hemen: tts.ai/api/.

Ahots-kalitatea modeloaren arabera aldatzen da. CosyVoice 2, StyleTTS 2 eta Chatterbox bezalako premium-modeloek ia giza-kalitatea duten hitzak sortzen dituzte, intonazio eta emozio naturalekin. Kokoro bezalako modelo libreek kalitate bikaina eskaintzen dute kasu gehienetan.

TTS.ai-k 30 hizkuntza baino gehiago onartzen ditu bere modelo-liburutegian. Ingelesa da gehien onartzen den hizkuntza, baina CosyVoice 2 bezalako modeloek txinera, japoniera eta koreera onartzen dituzte; GPT-SoVITS-ek txinera, japoniera, koreera eta ingelesa kudeatzen ditu; eta MeloTTS-ek ingelesa, gaztelania, frantsesa, txinera, japoniera eta koreera onartzen ditu.

Bai. Prozesamendu guztiak gure GPU zerbitzari dedikatuetan gertatzen dira. Ez dugu zure testu-sarrera edo sortutako audioa gordetzen entregatu ondoren. Klonatzeko igotako ahots-laginak uneko saiorako bakarrik erabiltzen dira eta ez dira gordetzen. Inoiz ez ditugu zure datuak hirugarrenekin partekatzen edo ereduak entrenatzeko erabiltzen.

Bai. TTS.ai-n sortutako audio guztiak zureak dira erabilera komertzialerako, YouTubeko bideoak, podcastak, audioliburuak, aplikazioak, iragarkiak eta produktuak barne. Gure ereduak kode irekikoak dira, baimendutako lizentziapean (MIT, Apache 2.0). Ez da errentagarritasunik edo aitorpenik behar.

TTS.ai-k WAV formatuan sortzen du audioa lehenespenez, kalitate maximoa lortzeko. MP3, FLAC, OGG edo M4A formatura bihur dezakezu Audio Converter tresna dohainik erabiliz. APIak onartzen du irteera-formatu nahiagoa zuzenean eskaeran zehaztea.

Kargatu klonatu nahi duzun ahotsaren audio-lagin labur bat (5 segundo gutxienez), eta idatzi edozein testu ahots horretan hizketa sortzeko. Chatterbox, GPT-SoVITS eta CosyVoice 2 ereduek ahots-klonazioa onartzen dute. Ahots klonatuak tonua, azentu eta hizketa-estiloa hartzen ditu.

Libreko modeloek (Kokoro, Piper, VITS, MeloTTS) ez dute konturik behar eta zero kreditu balio dute. Modelo estandarrek (2 kreditu/1.000 karaktere) Bark, CosyVoice 2, F5-TTS eta Dia dituzte. Premium modeloek (4 kreditu/1.000 karaktere) OpenVoice, Chatterbox, StyleTTS 2 eta Tortoise dituzte. Ordaindutako modeloek, oro har, kalitate handiagoa, ahots gehiago eta ezaugarri gehigarriak eskaintzen dituzte, hala nola ahotsaren klonaketa.

Bai. APIak batch prozesamendua onartzen du testu-hizketa bolumen handiak bihurtzeko. Bidali eskaera anitz eta eskuratu emaitzak asinkronikoki lan-UUIDak erabiliz. Enpresa-planek (99 $/hilean) lehentasunezko ilara-atzipena dute batch prozesamendu azkarragoa egiteko. Oso egokia audioliburu ekoizpenerako, ikastaro-edukietarako eta eskala handiko ahots-proiektuetarako.
5.0/5 (1)

Hasi AI ahotsa erabiltzen gaur

Bat egin TTS.ai erabiltzen duten sortzaile, garatzaile eta enpresekin