Free AI Teksti në Fjalë
20+ modele me burim të hapur, 107+ Zërat, 32+ Nuk kërkohet llogari.
Gjithçka që ju duhet për AI-në e zërit
Më shumë se 30 instrumentë të mbështetur nga modele të inteligjencës artificiale me burim të hapur
20+ Modelet e zërit AI
Koleksioni më i plotë i modeleve të TTS me burim të hapur në një platformë
Kokoro Free
Kokoro është një model tekst-në-folje me 82 milion parametra që punon shumë më mirë se klasa e tij e peshes. Pavarësisht nga madhësia e vogël, prodhon një folje të jashtëzakonshme natyrale dhe shprehëse. Kokoro suporton gjuhë të shumta duke përfshirë anglishten, japonishten, kinezishten dhe koreanishten me një varietet zërash shprehës. Ekzekutohet jashtëzakonisht shpejt — duke gjeneruar tinguj pothuajse 100 herë më shpejt se në kohë reale në një GPU.
Më i miri për: TTS me cilësi të lartë me kohëzgjatje minimale, aplikime streaming
Provoje falas
Piper Free
Piper është një motor i lehtë tekst-në-folje i zhvilluar nga Rhasspy që përdor arkitekturat VITS dhe larynx. Ekzekutohet krejtësisht në CPU, duke e bërë atë ideal për pajisjet e periferisë, automatikën shtëpiake dhe aplikacionet që kërkojnë TTS jashtë linje. Me mbi 100 zëra në më shumë se 30 gjuhë, Piper jep një zë natyror në shpejtësi të kohës reale edhe në një Raspberry Pi 4.
Më i miri për: Pamje të shpejta, açesibilitet dhe aplikativë të ndërlidhur
Provoje falas
VITS Free
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) është një metodë paralele TTS që gjeneron tinguj më natyrorë se sa modelet aktuale me dy faza. Ajo adopton variacionin e inferimit të rritur me rrjedhat normalizuese dhe një proces trainimi kundërshtar, duke arritur një përmirësim të ndjeshëm në natyrshmëri.
Më i miri për: Tekst-në-Fjalë me qëllim të përgjithshëm me prozodi natyrore
Provoje falas
MeloTTS Free
MeloTTS nga MyShell.ai është një bibliotekë shumëgjuhëshe TTS që suporton anglishten (amerikane, britanike, indiane, australiane), spanjishten, frëngjishten, kineze, japoneze dhe koreane. Është shumë e shpejtë, duke përpunuar tekstin me shpejtësi pothuajse në kohë reale vetëm në CPU. MeloTTS është projektuar për përdorim në prodhim dhe suporton si CPU ashtu edhe GPU.
Më i miri për: Aplikacionet e prodhimit kanë nevojë për TTS të shpejtë dhe shumëgjuhësh
Provoje falas
Bark Standard
Modeli i tekstit në audio i bazuar në transformator që gjeneron fjalë, muzikë dhe efekte të tingullit realiste.
Programuesi: Suno · Liçenca: MIT
Provoje.
Bark Small Standard
Version më i lehtë i Bark me përfundim më të shpejtë dhe përdorim më të ulët të kujtesës.
Programuesi: Suno · Liçenca: MIT
Provoje.
CosyVoice 2 Standard
Alibaba's scaleable streaming TTS me natyrshmërinë e paritetit njerëzor dhe afërsisht zero vonesë.
Programuesi: Alibaba (Tongyi Lab) · Liçenca: Apache 2.0
Provoje.
Dia TTS Standard
Modeli i krijimit të dialogut me shumë folës që krijon biseda natyrore midis folësve.
Programuesi: Nari Labs · Liçenca: Apache 2.0
Provoje.
Parler TTS Standard
Përshkruaj zërin që dëshiron në gjuhën natyrore dhe Parler gjeneron një zë të përshtatshëm.
Programuesi: Hugging Face · Liçenca: Apache 2.0
Provoje.
GLM-TTS Standard
Arrit normat më të ulta të gabimit të karaktereve midis modeleve të TTS me burim të hapur.
Programuesi: Zhipu AI · Liçenca: GLM-4 License
Provoje.
IndexTTS-2 Standard
Zero-shot TTS me kontroll të mirë të emocioneve dhe shprehje të lartë.
Programuesi: Index Team · Liçenca: Bilibili Model License
Provoje.
Spark TTS Standard
Klonimi i zërit TTS me emocione të kontrollueshme dhe stil të foljes nëpërmjet kërkesave.
Programuesi: SparkAudio · Liçenca: CC BY-NC-SA 4.0
Provoje.
GPT-SoVITS Standard
Klonimi i zërit me pak gjuajtje TTS që kopjon çdo zë nga vetëm 5 sekonda audio.
Programuesi: RVC-Boss · Liçenca: MIT
Provoje.
Orpheus Standard
Modeli TTS emocional në nivelin njerëzor i trajnuar në 100K orë të dhëna të foljes.
Programuesi: Canopy Labs · Liçenca: Llama 3.2 Community
Provoje.
Qwen3 TTS Standard
TTS shumëgjuhësh i Alibaba me klonim zëri, zëra të paracaktuar dhe dizajn zëri nga teksti.
Programuesi: Alibaba (Qwen) · Liçenca: Apache 2.0
Provoje.
CosyVoice 2
Alibaba's scaleable streaming TTS me natyrshmërinë e paritetit njerëzor dhe afërsisht zero vonesë.
Gjuhë: en, zh, ja, ko, fr, de, it, es
Klono zërin
GLM-TTS
Arrit normat më të ulta të gabimit të karaktereve midis modeleve të TTS me burim të hapur.
Gjuhë: en, zh
Klono zërin
IndexTTS-2
Zero-shot TTS me kontroll të mirë të emocioneve dhe shprehje të lartë.
Gjuhë: en, zh
Klono zërin
Spark TTS
Klonimi i zërit TTS me emocione të kontrollueshme dhe stil të foljes nëpërmjet kërkesave.
Gjuhë: en, zh
Klono zërin
GPT-SoVITS
Klonimi i zërit me pak gjuajtje TTS që kopjon çdo zë nga vetëm 5 sekonda audio.
Gjuhë: en, zh, ja, ko
Klono zërin
Tortoise TTS
Teksti-në-folje me shumë zëra i përqëndruar në cilësinë me arkitekturë autoregresive.
Gjuhë: en
Klono zërin
OpenVoice
Klonimi i menjëhershëm i zërit me kontroll të hollësishëm mbi stilin, emocionet dhe theksin.
Gjuhë: en, zh, ja, ko, fr, de, es, it
Klono zërin
Qwen3 TTS
TTS shumëgjuhësh i Alibaba me klonim zëri, zëra të paracaktuar dhe dizajn zëri nga teksti.
Gjuhë: en, zh, ja, ko, de, fr, ru, pt, es, it
Klono zërinDeveloper-First API
REST API e përshtatshme me OpenAI. Një pikë përfundimtare, më shumë se 22 modele. Mbështetje streaming për aplikacionet në kohë reale.
- Format i përshtatshëm OpenAI
- Streaming TTS për aplikacionet në kohë reale
- Përpunimi i grupeve për punë të mëdha
- Njoftime webhook
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Çmime të thjeshta, transparente
Fillo i lirë.Shkallezohu ndërsa rritesh.
I lirë
15 kreditë
- Kokoro, Piper, VITS, MeloTTS
- Kufiri i 500 karakterëve
- 3 gjen/orë (pa llogari)
Fillues
500,000 characters/month
- Të gjitha 22+ modelet
- 100,000 chars per generation
- Klonimi i zërit
Pro
2,000,000 characters/month
- Gjithçka në Starter
- Hyrja në API
- Përpunimi i përparësisë
Biznes
10,000,000 characters/month
- Gjithçka në Pro
- Bulk API
- Rreshta e përparësisë
Shiko të gjitha planet duke përfshirë paketat e karaktereve →
Pyetje të shpeshta
Fillo të përdorësh zërin AI sot
Bashkohu me krijues, zhvillues dhe biznese që përdorin TTS.ai