Slobodna AL Tekst za govor

20+ modeli otvorenog izvora, 107+ glasove, 32+ jezici. Nije potreban račun.

1K+
kreatori
2K+
generacije
20+
AI modeli
107+
glasovi
0/500 znakovi Slobodno
Like TTS.ai? Tell your friends!

20+ AI Glasovni modeli

Najopsežnija kolekcija modela TTS otvorenog izvora u jednoj platformi

KokoroKokoro Free

Kokoro je 82 milijuna parametara text-to-speech model koji udara mnogo iznad svoje težine klase. Unatoč svojoj malenoj veličini, ona proizvodi izuzetno prirodan i ekspresivan govor. Kokoro podržava više jezika, uključujući engleski, japanski, kineski i korejski, s različitim izrazitivnim glasovima. To radi nevjerojatno brzo – stvaranje audio gotovo 100x brže od real-time na GPU.

Najbolje za: visokokvalitetni TTS s minimalnom latencijom, streaming aplikacije

Pokušaj slobodno

PiperPiper Free

Piper je lagani tekst-na-špeech motor razvijen od strane Rhaspy koji koristi VITS i grkljan arhitekture. To radi u cijelosti na CPU, što je idealan za rubne uređaje, kućna automatizacija, i aplikacije zahtijeva offline TTS. Sa preko 100 glasova preko 30+ jezika, Piper donosi prirodno-zvučni govor na realnom vremenu brzine čak i na Raspberry Pi 4.

Najbolje za: Brzi pregledi, pristupačnost i ugrađene aplikacije

Pokušaj slobodno

VITSVITS Free

VITS (Varicionalni zaključak s protivrečnim učenjem za kraj-na-kraj Tekst-na- govor) je paralelna metoda kraj-na-kraj TTS koja stvara više prirodnog zvučnog zvuka nego trenutni dvostupenjski modeli. Prihvaća varijacionalni zaključak pojačan s normalizacijskim tokovi i procesom protivrečnog treninga, što postiže značajno poboljšanje prirodnosti.

Najbolje za: Općenamenski tekst-na-speech s prirodnom prozodijom

Pokušaj slobodno

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai je višejezična TTS biblioteka koja podupire engleski (američki, britanski, indijanski, australijski), španjolski, francuski, kineski, japanski i korejski. To je izuzetno brzo, obrada teksta pri skoro realnom vremenu samo na CPU. MeloTTS je dizajniran za proizvodnju korištenja i podržava i CPU i GPU zaključak.

Najbolje za: Proizvodnja zahtjeva za brzim, višejezičnim TTS-om

Pokušaj slobodno

BarkBark Standard

Transformer-based text-to-audio model koji generira realan govor, glazbu, i zvučne efekte.

Razvojnik: Suno · Dozvola: MIT

Probaj.

Bark SmallBark Small Standard

Lakša verzija Barka s bržim zaključkom i manjim korištenjem memorije.

Razvojnik: Suno · Dozvola: MIT

Probaj.

CosyVoice 2CosyVoice 2 Standard

Alibaba je skalabilni TTS s ljudskim paritetom prirode i gotovo nula latencije.

Razvojnik: Alibaba (Tongyi Lab) · Dozvola: Apache 2.0

Probaj.

Dia TTSDia TTS Standard

Višezvučnički dijaloški model koji stvara prirodne razgovore između zvučnika.

Razvojnik: Nari Labs · Dozvola: Apache 2.0

Probaj.

Parler TTSParler TTS Standard

Opišite glas koji želite na prirodnom jeziku i Parler generira odgovarajući govor.

Razvojnik: Hugging Face · Dozvola: Apache 2.0

Probaj.

GLM-TTSGLM-TTS Standard

Postiže najnižu stopu karaktera greške među modelima otvorenog izvora TTS.

Razvojnik: Zhipu AI · Dozvola: GLM-4 License

Probaj.

IndexTTS-2IndexTTS-2 Standard

Nula-shot TTS s fino-zrele kontrole emocija i visokom ekspresivnosti.

Razvojnik: Index Team · Dozvola: Bilibili Model License

Probaj.

Spark TTSSpark TTS Standard

Glasovno kloniranje TTS s kontroliranim emocijama i stilom govora putem upita.

Razvojnik: SparkAudio · Dozvola: CC BY-NC-SA 4.0

Probaj.

GPT-SoVITSGPT-SoVITS Standard

Nekoliko udaraca kloniranja glasa TTS koji replicira bilo koji glas iz samo 5 sekundi zvuka.

Razvojnik: RVC-Boss · Dozvola: MIT

Probaj.

OrpheusOrpheus Standard

Emocionalni TTS model na ljudskoj razini obučen na 100K sati govora podataka.

Razvojnik: Canopy Labs · Dozvola: Llama 3.2 Community

Probaj.

Qwen3 TTSQwen3 TTS Standard

Alibabov višejezični TTS s kloniranjem glasa, predefiniranim glasovima i dizajnom glasa iz teksta.

Razvojnik: Alibaba (Qwen) · Dozvola: Apache 2.0

Probaj.

ChatterboxChatterbox Premium

Najmoderniji kloniranje glasa s kontrolom emocija iz Resemble AI-a.

Kvaliteta:

Probaj.

Tortoise TTSTortoise TTS Premium

Višeglasni tekst-na-speech fokusiran na kvalitetu s autoregresivnom arhitekturom.

Kvaliteta:

Probaj.

StyleTTS 2StyleTTS 2 Premium

Ljudska razina tekst-na-speech kroz difuziju stila i suparnički trening.

Kvaliteta:

Probaj.

OpenVoiceOpenVoice Premium

Trenutno kloniranje glasa s granuliranom kontrolom nad stilom, emocijama i naglaskom.

Kvaliteta:

Probaj.

Sesame CSMSesame CSM Premium

Konverzacijski model govora stvara prirodni dijalog uz odgovarajući tajming i emocije.

Kvaliteta:

Probaj.

CosyVoice 2CosyVoice 2

Alibaba je skalabilni TTS s ljudskim paritetom prirode i gotovo nula latencije.

Jezici: en, zh, ja, ko, fr, de, it, es

Kloniranje glasa

GLM-TTSGLM-TTS

Postiže najnižu stopu karaktera greške među modelima otvorenog izvora TTS.

Jezici: en, zh

Kloniranje glasa

IndexTTS-2IndexTTS-2

Nula-shot TTS s fino-zrele kontrole emocija i visokom ekspresivnosti.

Jezici: en, zh

Kloniranje glasa

Spark TTSSpark TTS

Glasovno kloniranje TTS s kontroliranim emocijama i stilom govora putem upita.

Jezici: en, zh

Kloniranje glasa

GPT-SoVITSGPT-SoVITS

Nekoliko udaraca kloniranja glasa TTS koji replicira bilo koji glas iz samo 5 sekundi zvuka.

Jezici: en, zh, ja, ko

Kloniranje glasa

ChatterboxChatterbox

Najmoderniji kloniranje glasa s kontrolom emocija iz Resemble AI-a.

Jezici: en

Kloniranje glasa

Tortoise TTSTortoise TTS

Višeglasni tekst-na-speech fokusiran na kvalitetu s autoregresivnom arhitekturom.

Jezici: en

Kloniranje glasa

OpenVoiceOpenVoice

Trenutno kloniranje glasa s granuliranom kontrolom nad stilom, emocijama i naglaskom.

Jezici: en, zh, ja, ko, fr, de, es, it

Kloniranje glasa

Qwen3 TTSQwen3 TTS

Alibabov višejezični TTS s kloniranjem glasa, predefiniranim glasovima i dizajnom glasa iz teksta.

Jezici: en, zh, ja, ko, de, fr, ru, pt, es, it

Kloniranje glasa

Programer- prvi API

OpenAI kompatibilan REST API. Jedan ishod, 22+ modeli. Streaming support for real-time applications.

  • OpenAI kompatibilan format
  • Streaming TTS za aplikacije u realnom vremenu
  • Paketska obrada za velike poslove
  • Webhook obavijesti
Pogledaj API Docs
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Jednostavna, prozirna cijena

Počnite slobodno.

Slobodno

$0

15 kredita

  • Kokoro, Piper, VITS, MeloTTS
  • Ograničenje znaka
  • 3 gen/sat (bez računa)
Slobodno se prijavite

Pokretanje

$9/Mo

500 kredita/mjesečno

  • Svi 22+ modeli
  • 100.000 znakova po generaciji
  • Kloniranje glasa
Započni
Najpopularnije

Profesionalno

$29/Mo

2.000 kredita/mjesečno

  • Sve u Starteru
  • API pristup
  • Prioritetna obrada
Dobiti pro

Poslovno

$99/Mo

10.000 kredita/mjesečno

  • Sve u profiju
  • Masovni API
  • Prioritetni red
Dobiti posao

Pogledaj sve planove uključujući znakovne pakete →

Česta pitanja

TTS.ai je najsveobuhvatnija AI glasovna platforma, koja nudi 22+ tekst-to-peech modele, kloniranje glasa, govor-to-tekst, i audio alati. Svi modeli su otvoreni izvor bez priključka prodavača.

Da! TTS.ai nudi besplatni tekst-to-speech s Kokoro, Piper, VITS, i MeloTTS modeli. Nije potreban račun. Prijavite se za dobivanje 15.000 besplatnih znakova i pristup svim modelima. Plaćeni planovi počinju od 9 dolara/mjesec.

Za brzinu, koristite Kokoro ili Piper. Za kvalitetu pokušajte CosyVoice 2 ili StyleTTS 2. Za kloniranje glasa, koristite Chatterbox ili GPT-SoviTS. Za dijalog koristite Dia TTS. Pokušajte više modela na istom tekstu za usporedbu.

Da. OpenAI kompatibilan REST API za TTS, STT, glasovno kloniranje i audio alati. Dostupan na Pro (29/mo) i Enterprise ($99/mo) planova. Pogledajte dokumentaciju na tts.ai/api /.

Kvaliteta glasa varira prema modelu.Premium modeli poput CosyVoice 2, StyleTTS 2, i Chatterbox proizvodi bliski-ljudski kvalitetni govor s prirodnom intonacijom i emocijama. Besplatni modeli poput Kokoro nudi odličnu kvalitetu za većinu slučajeva korištenja.

TTS.ai podržava 30+ jezika u svojoj model knjižnici. Engleski ima najveći model podrške, ali modeli poput CosyVoice 2 naslovnica kineske, japanske i korejske; GPT-SoviTS upravlja kineskim, japanskim, korejskim i engleskim; i MelotTS podržava engleski, španjolski, francuski, kineski, japanski i korejski.

Da. Sva obrada se događa na našim posvećenim GPU poslužiteljima. Mi ne pohranjujemo vaš tekst unos ili generiran zvuk nakon isporuke. Uzorci glasa se koriste samo za trenutnu sesiju i nisu zadržani. Nikada ne dijelimo vaše podatke s trećim osobama ili ih koristimo za vježbanje modela.

Da. Svi zvučni proizvodi generirani na TTS.ai je vaš koristiti komercijalno, uključujući za YouTube video, podcasts, audiobooks, aplikacije, oglase i proizvode. Naši modeli su otvoreni izvor pod popustnim licencama (MIT, Apache 2.0). Nema honorara ni pripisivanja.

TTS.ai generira zvuk u WAV formatu uobičajeno za maksimalnu kvalitetu. Možete pretvoriti u MP3, FLAC, OGG, ili M4A pomoću našeg besplatnog Audio Converter alat. API podržava navođenje vašeg poželjnog izlaznog formata izravno u zahtjevu.

Pošaljite kratak audio uzorak (do 5 sekundi) glasa koji želite klonirati, zatim upišite bilo koji tekst za generiranje govora u tom glasu. Modeli kao što su Chatterbox, GPT-Sovits, i CosyVoice 2 podrška kloniranja glasa. Klonirani glas hvata ton, naglasak i stil govora.

Besplatni modeli (Kokoro, Piper, VITS, MeloTTS) ne zahtijevaju nikakve račune i troškove nula znakova. Standardni modeli (2.000 znakova/1K unosa) uključuju Bark, CosyVoice 2, F5-TTS i Dia. Premium modeli (4.000 znakova/1K unosa) uključuju OpenVoice, Chatterbox, StyleTTS 2 i Tortoise. Plaćeni modeli općenito nude veću kvalitetu, više glasova i dodatne značajke poput kloniranja glasa.

Da. API podržava serijsku obradu za pretvaranje velikih objekata teksta u govor. Pošaljite više zahtjeva i dohvatite rezultate asinhronno koristeći posao UUIDs. Enterprise planovi ($99/mo) uključuju prioritetni redak pristup za brže obrade serije. Idealan za produkciju audiobooka, sadržaj tečaja, te velikih glasovnih projekata.
4.0/5 (8)

Počnite koristiti AI glas danas

Pridružite se kreatorima, programerima i poduzećima koji koriste TTS.ai