Slobodna AL Tekst za govor

31+ modeli otvorenog izvora, 231+ glasove, 34+ jezici. Nije potreban račun.

8K+
kreatori
32K+
generacije
31+
AI modeli
231+
glasovi
0/500 znakovi · Sign up for 5,000 per generation → Slobodno
Reci svojim prijateljima!

Sve što trebaš za glasovnu inteligenciju

30+ alata napajanih modelima AI-a otvorenog izvora

31+ AI Glasovni modeli

Najopsežnija kolekcija modela TTS otvorenog izvora u jednoj platformi

KokoroKokoro Free

Kokoro je 82 milijuna parametara text-to-speech model koji udara mnogo iznad svoje težine klase. Unatoč svojoj malenoj veličini, ona proizvodi izuzetno prirodan i ekspresivan govor. Kokoro podržava više jezika, uključujući engleski, japanski, kineski i korejski, s različitim izrazitivnim glasovima. To radi nevjerojatno brzo – stvaranje audio gotovo 100x brže od real-time na GPU.

Najbolje za: visokokvalitetni TTS s minimalnom latencijom, streaming aplikacije

Pokušaj slobodno

PiperPiper Free

Piper je lagani tekst-na-špeech motor razvijen od strane Rhaspy koji koristi VITS i grkljan arhitekture. To radi u cijelosti na CPU, što je idealan za rubne uređaje, kućna automatizacija, i aplikacije zahtijeva offline TTS. Sa preko 100 glasova preko 30+ jezika, Piper donosi prirodno-zvučni govor na realnom vremenu brzine čak i na Raspberry Pi 4.

Najbolje za: Brzi pregledi, pristupačnost i ugrađene aplikacije

Pokušaj slobodno

VITSVITS Free

VITS (Varicionalni zaključak s protivrečnim učenjem za kraj-na-kraj Tekst-na- govor) je paralelna metoda kraj-na-kraj TTS koja stvara više prirodnog zvučnog zvuka nego trenutni dvostupenjski modeli. Prihvaća varijacionalni zaključak pojačan s normalizacijskim tokovi i procesom protivrečnog treninga, što postiže značajno poboljšanje prirodnosti.

Najbolje za: Općenamenski tekst-na-speech s prirodnom prozodijom

Pokušaj slobodno

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai je višejezična TTS biblioteka koja podupire engleski (američki, britanski, indijanski, australijski), španjolski, francuski, kineski, japanski i korejski. To je izuzetno brzo, obrada teksta pri skoro realnom vremenu samo na CPU. MeloTTS je dizajniran za proizvodnju korištenja i podržava i CPU i GPU zaključak.

Najbolje za: Proizvodnja zahtjeva za brzim, višejezičnim TTS-om

Pokušaj slobodno

OuteTTSOuteTTS Free

OutetTS proširuje velike jezičke modele s tekst-u-peech mogućnosti pri očuvanju originalne arhitekture. Ona podržava više pozadina uključujući llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, pa čak i zaključak preglednika preko Transformers.js. Mogućnosti nulto-shoot kloniranja glasa kroz zvučnike profile spremljene kao JSON.

Najbolje za: Raspoređivanje ruba, TTS na bazi preglednika, okruženja s niskim izvorima

Pokušaj slobodno

Pocket TTSPocket TTS Free

Pocket TTS by Kyutai (kreatori Moshi) je kompaktan model 100M parametara tekst-to-speech koji udara mnogo iznad svoje težine. Ona radi učinkovito na CPU, podržava kloniranje glasa nula-shot iz jednog zvučnog uzorka, i proizvodi prirodno-zvučni govor. Mala veličina modela čini ga idealnim za raspoređivanje ruba i niske izvorne sredine.

Najbolje za: Lagano raspoređivanje, CPU-samo okruženja, brzo kloniranje glasa

Pokušaj slobodno

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

Najbolje za: Fast lightweight TTS, edge deployment, low-latency applications

Pokušaj slobodno

BarkBark Standard

Transformer-based text-to-audio model koji generira realan govor, glazbu, i zvučne efekte.

Razvojnik: Suno · Dozvola: MIT

Probaj.

Bark SmallBark Small Standard

Lakša verzija Barka s bržim zaključkom i manjim korištenjem memorije.

Razvojnik: Suno · Dozvola: MIT

Probaj.

CosyVoice 2CosyVoice 2 Standard

Alibaba je skalabilni TTS s ljudskim paritetom prirode i gotovo nula latencije.

Razvojnik: Alibaba (Tongyi Lab) · Dozvola: Apache 2.0

Probaj.

Dia TTSDia TTS Standard

Višezvučnički dijaloški model koji stvara prirodne razgovore između zvučnika.

Razvojnik: Nari Labs · Dozvola: Apache 2.0

Probaj.

Parler TTSParler TTS Standard

Opišite glas koji želite na prirodnom jeziku i Parler generira odgovarajući govor.

Razvojnik: Hugging Face · Dozvola: Apache 2.0

Probaj.

GLM-TTSGLM-TTS Standard

Postiže najnižu stopu karaktera greške među modelima otvorenog izvora TTS.

Razvojnik: Zhipu AI · Dozvola: GLM-4 License

Probaj.

IndexTTS-2IndexTTS-2 Standard

Nula-shot TTS s fino-zrele kontrole emocija i visokom ekspresivnosti.

Razvojnik: Index Team · Dozvola: Bilibili Model License

Probaj.

Spark TTSSpark TTS Standard

Glasovno kloniranje TTS s kontroliranim emocijama i stilom govora putem upita.

Razvojnik: SparkAudio · Dozvola: CC BY-NC-SA 4.0

Probaj.

GPT-SoVITSGPT-SoVITS Standard

Nekoliko udaraca kloniranja glasa TTS koji replicira bilo koji glas iz samo 5 sekundi zvuka.

Razvojnik: RVC-Boss · Dozvola: MIT

Probaj.

OrpheusOrpheus Standard

Emocionalni TTS model na ljudskoj razini obučen na 100K sati govora podataka.

Razvojnik: Canopy Labs · Dozvola: Llama 3.2 Community

Probaj.

Qwen3 TTSQwen3 TTS Standard

Alibabov višejezični TTS s kloniranjem glasa, predefiniranim glasovima i dizajnom glasa iz teksta.

Razvojnik: Alibaba (Qwen) · Dozvola: Apache 2.0

Probaj.

Chatterbox TurboChatterbox Turbo Standard

Brže Chatterbox s pod-200ms latency i paralinguističke oznake za smijeh, kašalj, i više.

Razvojnik: Resemble AI · Dozvola: MIT

Probaj.

Dia 2Dia 2 Standard

Streaming-prva razgovora TTS s višegovornika dijalogom i paralinguističkim znakovima.

Razvojnik: Nari Labs · Dozvola: Apache 2.0

Probaj.

VoxCPMVoxCPM Standard

TTS bez tokenizera proizvodi zvuk 44.1kHz s konzistentnošću kontekst-svjesnog paragrafa.

Razvojnik: OpenBMB · Dozvola: Apache 2.0

Probaj.

TADATADA Standard

Zero-halucinacija TTS s tekstualno-akustičnim dvostrukim poravnanjem, 5x brže od usporedive LLM TTS.

Razvojnik: Hume AI · Dozvola: MIT

Probaj.

VibeVoiceVibeVoice Standard

Microsoft model za dugoformni višezvučni sadržaj poput podcasta i audio knjiga.

Razvojnik: Microsoft · Dozvola: MIT

Probaj.

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Razvojnik: Alibaba (FunAudioLLM) · Dozvola: Apache 2.0

Probaj.

ChatterboxChatterbox Premium

Najmoderniji kloniranje glasa s kontrolom emocija iz Resemble AI-a.

Kvaliteta:

Probaj.

Tortoise TTSTortoise TTS Premium

Višeglasni tekst-na-speech fokusiran na kvalitetu s autoregresivnom arhitekturom.

Kvaliteta:

Probaj.

StyleTTS 2StyleTTS 2 Premium

Ljudska razina tekst-na-speech kroz difuziju stila i suparnički trening.

Kvaliteta:

Probaj.

OpenVoiceOpenVoice Premium

Trenutno kloniranje glasa s granuliranom kontrolom nad stilom, emocijama i naglaskom.

Kvaliteta:

Probaj.

Sesame CSMSesame CSM Premium

Konverzacijski model govora stvara prirodni dijalog uz odgovarajući tajming i emocije.

Kvaliteta:

Probaj.

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Kvaliteta:

Probaj.

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Kvaliteta:

Probaj.

CosyVoice 2CosyVoice 2

Alibaba je skalabilni TTS s ljudskim paritetom prirode i gotovo nula latencije.

Jezici: en, zh, ja, ko, fr, de, it, es

Kloniranje glasa

GLM-TTSGLM-TTS

Postiže najnižu stopu karaktera greške među modelima otvorenog izvora TTS.

Jezici: en, zh

Kloniranje glasa

IndexTTS-2IndexTTS-2

Nula-shot TTS s fino-zrele kontrole emocija i visokom ekspresivnosti.

Jezici: en, zh

Kloniranje glasa

Spark TTSSpark TTS

Glasovno kloniranje TTS s kontroliranim emocijama i stilom govora putem upita.

Jezici: en, zh

Kloniranje glasa

GPT-SoVITSGPT-SoVITS

Nekoliko udaraca kloniranja glasa TTS koji replicira bilo koji glas iz samo 5 sekundi zvuka.

Jezici: en, zh, ja, ko

Kloniranje glasa

ChatterboxChatterbox

Najmoderniji kloniranje glasa s kontrolom emocija iz Resemble AI-a.

Jezici: en

Kloniranje glasa

Tortoise TTSTortoise TTS

Višeglasni tekst-na-speech fokusiran na kvalitetu s autoregresivnom arhitekturom.

Jezici: en

Kloniranje glasa

OpenVoiceOpenVoice

Trenutno kloniranje glasa s granuliranom kontrolom nad stilom, emocijama i naglaskom.

Jezici: en, zh, ja, ko, fr, de, es, it

Kloniranje glasa

Qwen3 TTSQwen3 TTS

Alibabov višejezični TTS s kloniranjem glasa, predefiniranim glasovima i dizajnom glasa iz teksta.

Jezici: en, zh, ja, ko, de, fr, ru, pt, es, it

Kloniranje glasa

Chatterbox TurboChatterbox Turbo

Brže Chatterbox s pod-200ms latency i paralinguističke oznake za smijeh, kašalj, i više.

Jezici: en

Kloniranje glasa

VoxCPMVoxCPM

TTS bez tokenizera proizvodi zvuk 44.1kHz s konzistentnošću kontekst-svjesnog paragrafa.

Jezici: en, zh

Kloniranje glasa

OuteTTSOuteTTS

LLM-based TTS koji radi na CPU, GPU, ili preglednik preko lama.cpp i Transformers.js.

Jezici: en

Kloniranje glasa

Pocket TTSPocket TTS

Lagani model parametra 100M od strane Kyutai s kloniranjem glasa iz jednog uzorka.

Jezici: en, fr

Kloniranje glasa

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Jezici: en, zh, ja, ko, de, es, fr, it, ru

Kloniranje glasa

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Jezici: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Kloniranje glasa

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Jezici: en, zh

Kloniranje glasa

Programer- prvi API

OpenAI kompatibilan REST API. Jedan ishod, 22+ modeli. Streaming support for real-time applications.

  • OpenAI kompatibilan format
  • Streaming TTS za aplikacije u realnom vremenu
  • Paketska obrada za velike poslove
  • Webhook obavijesti
Pogledaj API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Jednostavna, prozirna cijena

Počnite slobodno.

Slobodno

$0

15 kredita

  • Kokoro, Piper, VITS, MeloTTS
  • Ograničenje znaka
  • 3 gen/sat (bez računa)
Slobodno se prijavite

Pokretanje

$9/Mo

500 kredita/mjesečno

  • Svi 22+ modeli
  • 100.000 znakova po generaciji
  • Kloniranje glasa
Započni
Najpopularnije

Profesionalno

$29/Mo

2.000 kredita/mjesečno

  • Sve u Starteru
  • API pristup
  • Prioritetna obrada
Dobiti pro

Poslovno

$99/Mo

10.000 kredita/mjesečno

  • Sve u profiju
  • Masovni API
  • Prioritetni red
Dobiti posao

Pogledaj sve planove uključujući znakovne pakete →

Česta pitanja

TTS.ai je najsveobuhvatnija AI glasovna platforma, koja nudi 22+ tekst-na-špik modele, kloniranje glasa, govor-na-tekst, i audio alati. Svi modeli su otvoreni izvor bez priključka prodavača.

Da! TTS.ai nudi besplatni tekst-to-speech s Kokoro, Piper, VITS, i MeloTTS modeli. Nije potreban račun. Prijavite se za dobivanje 15.000 besplatnih znakova i pristup svim modelima. Plaćeni planovi počinju od 9 dolara/mjesec.

Za brzinu, koristite Kokoro ili Piper. Za kvalitetu pokušajte CosyVoice 2 ili StyleTTS 2. Za kloniranje glasa, koristite Chatterbox ili GPT-SoviTS. Za dijalog koristite Dia TTS. Pokušajte više modela na istom tekstu za usporedbu.

Da. OpenAI kompatibilan REST API za TTS, STT, glasovno kloniranje i audio alati. Dostupan na Pro (29/mo) i Enterprise ($99/mo) planova. Pogledajte dokumentaciju na tts.ai/api /.

Kvaliteta glasa varira prema modelu.Premium modeli poput CosyVoice 2, StyleTTS 2, i Chatterbox proizvodi bliski-ljudski kvalitetni govor s prirodnom intonacijom i emocijama. Besplatni modeli poput Kokoro nudi odličnu kvalitetu za većinu slučajeva korištenja.

TTS.ai podržava 30+ jezika u svojoj model knjižnici. Engleski ima najveći model podrške, ali modeli poput CosyVoice 2 naslovnica kineske, japanske i korejske; GPT-SoviTS upravlja kineskim, japanskim, korejskim i engleskim; i MelotTS podržava engleski, španjolski, francuski, kineski, japanski i korejski.

Da. Sva obrada se događa na našim posvećenim GPU poslužiteljima. Mi ne pohranjujemo vaš tekst unos ili generiran zvuk nakon isporuke. Uzorci glasa se koriste samo za trenutnu sesiju i nisu zadržani. Nikada ne dijelimo vaše podatke s trećim osobama ili ih koristimo za vježbanje modela.

Da. Svi zvučni proizvodi generirani na TTS.ai je vaš koristiti komercijalno, uključujući za YouTube video, podcasts, audiobooks, aplikacije, oglase i proizvode. Naši modeli su otvoreni izvor pod popustnim licencama (MIT, Apache 2.0). Nema honorara ni pripisivanja.

TTS.ai generira zvuk u WAV formatu uobičajeno za maksimalnu kvalitetu. Možete pretvoriti u MP3, FLAC, OGG, ili M4A pomoću našeg besplatnog Audio Converter alat. API podržava navođenje vašeg poželjnog izlaznog formata izravno u zahtjevu.

Pošaljite kratak audio uzorak (do 5 sekundi) glasa koji želite klonirati, zatim upišite bilo koji tekst za generiranje govora u tom glasu. Modeli kao što su Chatterbox, GPT-Sovits, i CosyVoice 2 podrška kloniranja glasa. Klonirani glas hvata ton, naglasak i stil govora.

Besplatni modeli (Kokoro, Piper, VITS, MeloTTS) ne zahtijevaju nikakve račune i troškove nula znakova. Standardni modeli (2.000 znakova/1K unosa) uključuju Bark, CosyVoice 2, F5-TTS i Dia. Premium modeli (4.000 znakova/1K unosa) uključuju OpenVoice, Chatterbox, StyleTTS 2 i Tortoise. Plaćeni modeli općenito nude veću kvalitetu, više glasova i dodatne značajke poput kloniranja glasa.

Da. API podržava serijsku obradu za pretvaranje velikih objekata teksta u govor. Pošaljite više zahtjeva i dohvatite rezultate asinhronno koristeći posao UUIDs. Enterprise planovi ($99/mo) uključuju prioritetni redak pristup za brže obrade serije. Idealan za produkciju audiobooka, sadržaj tečaja, te velikih glasovnih projekata.
4.0/5 (22)

Što možemo poboljšati? Vaša povratna informacija nam pomaže riješiti probleme.

Počnite koristiti AI glas danas

Pridružite se kreatorima, programerima i poduzećima koji koriste TTS.ai