Free AI Tekst-u-govor

20+ modeli otvorenog koda, 107+ glasovi, 32+ Nije potreban račun.

1K+
kreatori
2K+
generacije
20+
AI modeli
107+
glasovi
0/500 znakovi Slobodan
Kao TTS.ai? Recite svojim prijateljima!

20+ AI Voice Models

Najopsežnija kolekcija modela TTS otvorenog koda na jednoj platformi

KokoroKokoro Free

Kokoro je model tekst-u-govor sa 82 miliona parametara koji je daleko iznad svoje klase težine. Uprkos svojoj maloj veličini, on proizvodi nevjerojatno prirodan i ekspresivan govor. Kokoro podržava više jezika uključujući engleski, japanski, kineski i korejski sa različitim ekspresivnim glasovima. Radi nevjerojatno brzo — generirajući zvuk gotovo 100 puta brže nego u stvarnom vremenu na GPU.

Najbolje za: TTS visokog kvaliteta sa minimalnom latencijom, aplikacije za streaming

Probaj besplatno

PiperPiper Free

Piper je lagan motor za pretvorbu teksta u govor razvijen od strane Rhasspy koji koristi VITS i larynx arhitekture. Radi u potpunosti na CPU, što ga čini idealnim za edge uređaje, automatizaciju doma, i aplikacije koje zahtijevaju offline TTS. Sa preko 100 glasova na preko 30 jezika, Piper isporučuje prirodno zvučan govor u realnom vremenu čak i na Raspberry Pi 4.

Najbolje za: Brzi pregledi, pristupačnost i ugrađene aplikacije

Probaj besplatno

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) je paralelni end-to-end TTS metod koji generira više prirodnog zvuka od trenutnih dvofaznih modela.On prihvaća varijacionalnu inferenciju pojačanu normalizirajućim tokovima i adversarialnim procesom treniranja, postižući značajno poboljšanje prirodnosti.

Najbolje za: Tekst-u-govor opće namjene s prirodnom prozodijom

Probaj besplatno

MeloTTSMeloTTS Free

MeloTTS od MyShell.ai je višejezična TTS biblioteka koja podržava engleski (američki, britanski, indijski, australijski), španski, francuski, kineski, japanski i korejski. Iznimno je brza, obrađuje tekst skoro u realnom vremenu samo na CPU-u. MeloTTS je dizajniran za produkcijsku upotrebu i podržava i CPU i GPU zaključivanje.

Najbolje za: Produkcijske aplikacije trebaju brz, višejezični TTS

Probaj besplatno

BarkBark Standard

Tekst-u-zvuk model zasnovan na transformatorima koji generira realističan govor, muziku i zvučne efekte.

Programer: Suno · Licenca: MIT

Probaj.

Bark SmallBark Small Standard

Laganiji oblik Bark-a sa bržim zaključavanjem i manjom upotrebom memorije.

Programer: Suno · Licenca: MIT

Probaj.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near zero latency.

Programer: Alibaba (Tongyi Lab) · Licenca: Apache 2.0

Probaj.

Dia TTSDia TTS Standard

Multi-speaker dialogue generation model that creates natural conversations between speakers.

Programer: Nari Labs · Licenca: Apache 2.0

Probaj.

Parler TTSParler TTS Standard

Opisujte glas koji želite u prirodnom jeziku i Parler će generirati odgovarajući govor.

Programer: Hugging Face · Licenca: Apache 2.0

Probaj.

GLM-TTSGLM-TTS Standard

Najveći broj slučajeva je u odnosu na početne vrijednosti T-limfocita.

Programer: Zhipu AI · Licenca: GLM-4 License

Probaj.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS sa fino zrnatom kontrolom emocija i visokom ekspresivnošću.

Programer: Index Team · Licenca: Bilibili Model License

Probaj.

Spark TTSSpark TTS Standard

Kloniranje glasa TTS sa kontroliranim emocijama i stilom govora putem naredbi.

Programer: SparkAudio · Licenca: CC BY-NC-SA 4.0

Probaj.

GPT-SoVITSGPT-SoVITS Standard

Nekoliko snimki kloniranja glasa TTS koji replicira bilo koji glas od samo 5 sekundi zvuka.

Programer: RVC-Boss · Licenca: MIT

Probaj.

OrpheusOrpheus Standard

Emocionalni TTS model na ljudskom nivou obučen na 100K sati govornih podataka.

Programer: Canopy Labs · Licenca: Llama 3.2 Community

Probaj.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Programer: Alibaba (Qwen) · Licenca: Apache 2.0

Probaj.

ChatterboxChatterbox Premium

Najmodernije kloniranje glasa sa kontrolom emocija od Resemble AI.

Kvaliteta:

Probaj.

Tortoise TTSTortoise TTS Premium

Višeglasni tekst-u-govor fokusiran je na kvalitetu sa autoregresivnom arhitekturom.

Kvaliteta:

Probaj.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversary training.

Kvaliteta:

Probaj.

OpenVoiceOpenVoice Premium

Instant kloniranje glasa sa granularnom kontrolom nad stilom, emocijama i naglaskom.

Kvaliteta:

Probaj.

Sesame CSMSesame CSM Premium

Konverzacijski govorni model koji generira prirodni dijalog sa odgovarajućim vremenom i emocijama.

Kvaliteta:

Probaj.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near zero latency.

Jezici: en, zh, ja, ko, fr, de, it, es

Glas

GLM-TTSGLM-TTS

Najveći broj slučajeva je u odnosu na početne vrijednosti T-limfocita.

Jezici: en, zh

Glas

IndexTTS-2IndexTTS-2

Zero-shot TTS sa fino zrnatom kontrolom emocija i visokom ekspresivnošću.

Jezici: en, zh

Glas

Spark TTSSpark TTS

Kloniranje glasa TTS sa kontroliranim emocijama i stilom govora putem naredbi.

Jezici: en, zh

Glas

GPT-SoVITSGPT-SoVITS

Nekoliko snimki kloniranja glasa TTS koji replicira bilo koji glas od samo 5 sekundi zvuka.

Jezici: en, zh, ja, ko

Glas

ChatterboxChatterbox

Najmodernije kloniranje glasa sa kontrolom emocija od Resemble AI.

Jezici: en

Glas

Tortoise TTSTortoise TTS

Višeglasni tekst-u-govor fokusiran je na kvalitetu sa autoregresivnom arhitekturom.

Jezici: en

Glas

OpenVoiceOpenVoice

Instant kloniranje glasa sa granularnom kontrolom nad stilom, emocijama i naglaskom.

Jezici: en, zh, ja, ko, fr, de, es, it

Glas

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Jezici: en, zh, ja, ko, de, fr, ru, pt, es, it

Glas

Developer-First API

OpenAI-kompatibilni REST API. Jedna krajnja tačka, 22+ modela. Podrška za streaming aplikacija u realnom vremenu.

  • OpenAI-kompatibilni format
  • Streaming TTS za aplikacije u stvarnom vremenu
  • Serijska obrada za velike zadatke
  • Webhook obavijesti
Prikaži API dokumentaciju
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Jednostavno, transparentno određivanje cijena

Počnite besplatno, povećavajte kako rastete.

Slobodan

$0

15 kredita

  • Kokoro, Piper, VITS, MeloTTS
  • 500 znakova
  • 3 gen/sat (bez računa)
Prijavite se besplatno

Starter

$9/mj

500 kredita/mjesečno

  • Sve 22+ modela
  • 100.000 znakova po generaciji
  • Kloniranje glasa
Počni
Najpopularnije

Pro

$29/mj

2,000 kredita/mjesečno

  • Sve u Starteru
  • API pristup
  • Prioritetna obrada
Get Pro

Posao

$99/mj

10.000 kredita/mjesečno

  • Sve u Pro
  • Bulk API
  • Prioritetni red
Get Business

Prikaži sve planove uključujući kreditne pakete →

Često postavljana pitanja

TTS.ai je najopsežnija AI glasovna platforma, nudeći 22+ modela tekst-u-govor, kloniranje glasa, govor-u-tekst, i audio alate.Svi modeli su otvorenog koda bez vendor lock-in.

Da! TTS.ai nudi besplatno pretvaranje teksta u govor sa Kokoro, Piper, VITS, i MeloTTS modelima. Nema potrebe za računom. Prijavite se da biste dobili 15 besplatnih kredita i pristup svim modelima. Plaćeni planovi počinju od $9/mjesečno.

Za brzinu, koristite Kokoro ili Piper. Za kvalitet, pokušajte CosyVoice 2 ili StyleTTS 2. Za kloniranje glasa, koristite Chatterbox ili GPT-SoVITS. Za dijalog, koristite Dia TTS. Pokušajte više modela na istom tekstu da biste ih usporedili.

Da. OpenAI-kompatibilni REST API za TTS, STT, kloniranje glasa, i audio alate. Dostupno na Pro ($29/mo) i Enterprise ($99/mo) planovima. Pogledajte dokumentaciju na tts.ai/api/.

Kvaliteta glasa varira od modela do modela. Premium modeli kao što su CosyVoice 2, StyleTTS 2, i Chatterbox proizvode govor gotovo ljudskog kvaliteta s prirodnom intonacijom i emocijama. Besplatni modeli kao što je Kokoro nude izvrsnu kvalitetu za većinu slučajeva upotrebe.

TTS.ai podržava 30+ jezika u svojoj biblioteci modela. engleski ima najširu podršku modela, ali modeli poput CosyVoice 2 pokrivaju kineski, japanski i korejski; GPT-SoVITS obrađuje kineski, japanski, korejski i engleski; i MeloTTS podržava engleski, španski, francuski, kineski, japanski i korejski.

Da. Sva obrada se dešava na našim namjenskim GPU serverima. Ne pohranjujemo vaš unos teksta ili generirani audio nakon isporuke. Uploadani uzorci glasa za kloniranje koriste se samo za tekuću sesiju i ne zadržavaju se. Mi nikada ne dijelimo vaše podatke sa trećim stranama niti ih koristimo za treniranje modela.

Da. Svi zvukovi generirani na TTS.ai su vaši za komercijalnu upotrebu, uključujući i YouTube videozapise, podcaste, audioknjige, aplikacije, reklame i proizvode. Naši modeli su otvoreni kod pod permisivnim licencama (MIT, Apache 2.0). Nema potrebnih prava ili priznanja.

TTS.ai generira audio u WAV formatu po zadanim postavkama za maksimalnu kvalitetu. Možete konvertirati u MP3, FLAC, OGG, ili M4A koristeći naš besplatan Audio Converter alat. API podržava određivanje vašeg željenog izlaznog formata direktno u zahtjevu.

Učitaj kratki audio uzorak (manje od 5 sekundi) glasa koji želiš klonirati, zatim upiši bilo koji tekst za generiranje govora u tom glasu. Modeli kao što su Chatterbox, GPT-SoVITS, i CosyVoice 2 podržavaju kloniranje glasa. Klonirani glas snima ton, naglasak, i stil govora.

Besplatni modeli (Kokoro, Piper, VITS, MeloTTS) ne zahtijevaju račun i koštaju nula kredita. Standardni modeli (2 kredita/1K znakova) uključuju Bark, CosyVoice 2, F5-TTS, i Dia. Premium modeli (4 kredita/1K znakova) uključuju OpenVoice, Chatterbox, StyleTTS 2, i Tortoise. Plaćeni modeli općenito nude viši kvalitet, više glasova, i dodatne mogućnosti kao što je kloniranje glasa.

Da. API podržava serijsku obradu za pretvaranje velikih količina teksta u govor. Pošaljite više zahtjeva i dohvaćajte rezultate asinkrono koristeći UUID-ove zadataka. Enterprise planovi ($99/mjesečno) uključuju prioritetni pristup redu za bržu serijsku obradu. Idealno za produkciju audioknjiga, sadržaj tečajeva, i velike voiceover projekte.
4.0/5 (8)

Počnite koristiti AI Voice danas

Pridružite se kreatorima, programerima i kompanijama koje koriste TTS.ai