AI gratuit Texte au discours
22+ modèles open-source, 100+ voix, 32+ Aucun compte n'est requis.
Tout ce dont vous avez besoin pour la voix AI
26 outils alimentés par 24+ modèles d'IA open-source
22+ Modèles de voix d'IA
La collection la plus complète de modèles TTS open-source en une seule plateforme
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Meilleur pour: High-quality TTS with minimal latency, streaming applications
Essayer gratuitement
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Meilleur pour: Quick previews, accessibility, and embedded applications
Essayer gratuitement
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Meilleur pour: General-purpose text-to-speech with natural prosody
Essayer gratuitement
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Meilleur pour: Applications de production nécessitant des TTS rapides et multilingues
Essayer gratuitement
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Développeur & #160;: Suno · Licence & #160;: MIT
Essaie.
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Développeur & #160;: Suno · Licence & #160;: MIT
Essaie.
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Développeur & #160;: Alibaba (Tongyi Lab) · Licence & #160;: Apache 2.0
Essaie.
Dia TTS Standard
Modèle de génération de dialogue multi haut-parleurs qui crée des conversations naturelles entre les haut-parleurs.
Développeur & #160;: Nari Labs · Licence & #160;: Apache 2.0
Essaie.
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Développeur & #160;: Hugging Face · Licence & #160;: Apache 2.0
Essaie.
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Développeur & #160;: Index Team · Licence & #160;: Apache 2.0
Essaie.
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Développeur & #160;: SparkAudio · Licence & #160;: Apache 2.0
Essaie.
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Développeur & #160;: RVC-Boss · Licence & #160;: MIT
Essaie.
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Développeur & #160;: Canopy Labs · Licence & #160;: Llama 3.2 Community
Essaie.
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Développeur & #160;: Alibaba (Qwen) · Licence & #160;: Apache 2.0
Essaie.
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Langues: en, zh, ja, ko, fr, de, it, es
Voix clonée
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Langues: en, zh
Voix clonée
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Langues: en, zh
Voix clonée
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Langues: en, zh, ja, ko
Voix clonée
Chatterbox
Closonnage de voix ultramoderne avec contrôle de l'émotion de la part de Resemblez à l'IA.
Langues: en
Voix clonée
Tortoise TTS
Multi-voix texte-à-parler axé sur la qualité avec l'architecture autorégressive.
Langues: en
Voix clonée
OpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
Langues: en, zh, ja, ko, fr, de, es, it
Voix clonée
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Langues: en, zh, ja, ko, de, fr, ru, pt, es, it
Voix clonéeDéveloppeur-Première API
API REST compatible OpenAI. Un endpoint, 22+ modèles. Support de streaming pour les applications en temps réel.
- Format compatible OpenAI
- Streaming TTS pour les applications en temps réel
- Traitement par lots pour des emplois importants
- Notifications Webhook
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Tarifs simples et transparents
Commencez gratuitement. Échellez à mesure que vous grandissez.
Gratuit
50 crédits
- Kokoro, Piper, VITS, MeloTTS
- Limite de 500 caractères
- 3 g/heure (pas de compte)
Démarreur
500 crédits/mois
- Tous les modèles 22+
- Limite de 5 000 caractères
- Clonage de la voix
Pour
2 000 crédits/mois
- Tout dans Starter
- Accès à l'API
- Traitement prioritaire
Entreprise
10 000 crédits/mois
- Tout en Pro
- API en vrac
- file d'attente prioritaire
Foire aux questions
Commencez à utiliser AI Voice aujourd'hui
Rejoignez les créateurs, les développeurs et les entreprises utilisant TTS.ai