Free AI Teksti në Fjalë
22+ modele me burim të hapur, 100+ zëra, 32+ Nuk kërkohet llogari.
Gjithçka që ju duhet për AI-në e zërit
26 instrumentë të mbështetur nga 24+ modele të inteligjencës artificiale të hapura
22+ modele zërash AI
Koleksioni më i plotë i modeleve të TTS me burim të hapur në një platformë
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Më e mira për: High-quality TTS with minimal latency, streaming applications
Provoje falas
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Më e mira për: Quick previews, accessibility, and embedded applications
Provoje falas
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Më e mira për: General-purpose text-to-speech with natural prosody
Provoje falas
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Më e mira për: Aplikacionet e prodhimit kanë nevojë për TTS të shpejtë dhe shumëgjuhësh
Provoje falas
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Programuesi: Suno · Liçenca: MIT
Provoje.
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Programuesi: Suno · Liçenca: MIT
Provoje.
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Programuesi: Alibaba (Tongyi Lab) · Liçenca: Apache 2.0
Provoje.
Dia TTS Standard
Modeli i krijimit të dialogut me shumë folës që krijon biseda natyrore midis folësve.
Programuesi: Nari Labs · Liçenca: Apache 2.0
Provoje.
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Programuesi: Hugging Face · Liçenca: Apache 2.0
Provoje.
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Programuesi: Index Team · Liçenca: Apache 2.0
Provoje.
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Programuesi: SparkAudio · Liçenca: Apache 2.0
Provoje.
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Programuesi: RVC-Boss · Liçenca: MIT
Provoje.
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Programuesi: Canopy Labs · Liçenca: Llama 3.2 Community
Provoje.
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Programuesi: Alibaba (Qwen) · Liçenca: Apache 2.0
Provoje.
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Gjuhë: en, zh, ja, ko, fr, de, it, es
Klono zërin
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Gjuhë: en, zh
Klono zërin
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Gjuhë: en, zh
Klono zërin
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Gjuhë: en, zh, ja, ko
Klono zërin
Tortoise TTS
Tekst-në-folje me shumë zëra të përqëndruar në cilësinë me arkitekturë autoregresive.
Gjuhë: en
Klono zërin
OpenVoice
Klonimi i menjëhershëm i zërit me kontroll të hollësishëm mbi stilin, emocionet dhe theksin.
Gjuhë: en, zh, ja, ko, fr, de, es, it
Klono zërin
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Gjuhë: en, zh, ja, ko, de, fr, ru, pt, es, it
Klono zërinDeveloper-First API
REST API e përshtatshme me OpenAI. Një pikë përfundimtare, më shumë se 22 modele. Mbështetje streaming për aplikacionet në kohë reale.
- Format i përshtatshëm OpenAI
- Streaming TTS për aplikacionet në kohë reale
- Përpunimi i grupeve për punë të mëdha
- Njoftime webhook
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Çmime të thjeshta, transparente
Fillo i lirë.Shkallezohu ndërsa rritesh.
I lirë
50 kreditë
- Kokoro, Piper, VITS, MeloTTS
- Kufiri i 500 karakterëve
- 3 gjen/orë (pa llogari)
Fillues
500 credits/month
- Të gjitha 22+ modelet
- Kufiri i 5,000 karakterëve
- Klonimi i zërit
Pro
2,000 credits/month
- Gjithçka në Starter
- Hyrja në API
- Përpunimi i përparësisë
Enterprise.
10,000 credits/month
- Gjithçka në Pro
- Bulk API
- Rreshta e përparësisë
Pyetje të shpeshta
Fillo përdorimin e zërit AI sot
Bashkohu me krijues, zhvillues dhe biznese duke përdorur TTS.ai