AI liberă Text la discurs
22+ de modele de sursă deschisă, 100+ de voci, 32+ limbi. Nu este necesar cont.
Tot ce ai nevoie pentru voce AI
26 de instrumente powered by 24+ open-source models AI
22+ modele vocale ale AI
Colecția cea mai cuprinzătoare a modelelor TTS de sursă deschisă într-o platformă
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Cel mai bun pentru: High-quality TTS with minimal latency, streaming applications
Încearcă liber
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Cel mai bun pentru: Quick previews, accessibility, and embedded applications
Încearcă liber
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Cel mai bun pentru: General-purpose text-to-speech with natural prosody
Încearcă liber
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Cel mai bun pentru: Aplicații de producție care au nevoie de TTS rapid și multilingv
Încearcă liber
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Dezvoltator: Suno · Licență: MIT
Încearcă.
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Dezvoltator: Suno · Licență: MIT
Încearcă.
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Dezvoltator: Alibaba (Tongyi Lab) · Licență: Apache 2.0
Încearcă.
Dia TTS Standard
Model de generare de dialog multi-speaker care creează conversații naturale între vorbitori.
Dezvoltator: Nari Labs · Licență: Apache 2.0
Încearcă.
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Dezvoltator: Hugging Face · Licență: Apache 2.0
Încearcă.
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Dezvoltator: Index Team · Licență: Apache 2.0
Încearcă.
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Dezvoltator: SparkAudio · Licență: Apache 2.0
Încearcă.
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Dezvoltator: RVC-Boss · Licență: MIT
Încearcă.
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Dezvoltator: Canopy Labs · Licență: Llama 3.2 Community
Încearcă.
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Dezvoltator: Alibaba (Qwen) · Licență: Apache 2.0
Încearcă.
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Limbi: en, zh, ja, ko, fr, de, it, es
Clonează vocea
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Limbi: en, zh
Clonează vocea
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Limbi: en, zh
Clonează vocea
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Limbi: en, zh, ja, ko
Clonează vocea
Chatterbox
Vocea de ultimă generaţie, cu un control de emoţie de la Resemble AI.
Limbi: en
Clonează vocea
Tortoise TTS
Multi-voce text-to-speech se concentrează pe calitate cu arhitectura autorregressivă.
Limbi: en
Clonează vocea
OpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
Limbi: en, zh, ja, ko, fr, de, es, it
Clonează vocea
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Limbi: en, zh, ja, ko, de, fr, ru, pt, es, it
Clonează voceaDezvoltator-Primă API
API REST compatibilă cu OpenAI. O endpoint, 22+ modele. Suport de transparență pentru aplicații în timp real.
- Format compatibil cu OpenAI
- Streaming TTS pentru aplicații în timp real
- Prelucrarea lotului pentru locuri de muncă mari
- Notificații webhook
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Preţuri simple, transparente
Începe gratis. Scalează-te pe măsură ce creşti.
Gratuit
50 de credite
- Kokoro, Piper, VITS, MeloTTS
- Limite de 500 de caractere
- 3 gen/oră (fără cont)
Pornitor
500 de credite/luna
- Toate cele 22+ modele
- limită de 5.000 de caractere
- Clonarea vocală
Pro
2 000 de credite/luna
- Totul în Starter
- Acces API
- Prelucrarea prioritară
Întreprindere
10 000 de credite/luna
- Totul în Pro
- API Bulk
- Coada prioritară
Întrebări frecvente
Începeți să utilizați vocea AI astăzi
Alăturați-vă creatorilor, dezvoltatorilor și întreprinderilor folosind TTS.ai