AI gratuit Texte au discours

22+ modèles open-source, 100+ voix, 32+ Aucun compte n'est requis.

0/500 caractères Gratuit
Pas de carte de crédit 50 crédits gratuits 32+ langues Utilisation commerciale OK
0:00 / 0:00
Télécharger l'audio Lien expire en 24h
Comme TTS.ai? Dites à vos amis!

Tout ce dont vous avez besoin pour la voix AI

26 outils alimentés par 24+ modèles d'IA open-source

22+ Modèles de voix d'IA

La collection la plus complète de modèles TTS open-source en une seule plateforme

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Meilleur pour: High-quality TTS with minimal latency, streaming applications

Essayer gratuitement

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Meilleur pour: Quick previews, accessibility, and embedded applications

Essayer gratuitement

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Meilleur pour: General-purpose text-to-speech with natural prosody

Essayer gratuitement

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Meilleur pour: Applications de production nécessitant des TTS rapides et multilingues

Essayer gratuitement

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Développeur & #160;: Suno · Licence & #160;: MIT

Essaie.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Développeur & #160;: Suno · Licence & #160;: MIT

Essaie.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Développeur & #160;: Alibaba (Tongyi Lab) · Licence & #160;: Apache 2.0

Essaie.

Dia TTSDia TTS Standard

Modèle de génération de dialogue multi haut-parleurs qui crée des conversations naturelles entre les haut-parleurs.

Développeur & #160;: Nari Labs · Licence & #160;: Apache 2.0

Essaie.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Développeur & #160;: Hugging Face · Licence & #160;: Apache 2.0

Essaie.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Développeur & #160;: Index Team · Licence & #160;: Apache 2.0

Essaie.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Développeur & #160;: SparkAudio · Licence & #160;: Apache 2.0

Essaie.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Développeur & #160;: RVC-Boss · Licence & #160;: MIT

Essaie.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Développeur & #160;: Canopy Labs · Licence & #160;: Llama 3.2 Community

Essaie.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Développeur & #160;: Alibaba (Qwen) · Licence & #160;: Apache 2.0

Essaie.

ChatterboxChatterbox Premium

Closonnage de voix ultramoderne avec contrôle de l'émotion de la part de Resemblez à l'IA.

Qualité:

Essaie.

Tortoise TTSTortoise TTS Premium

Multi-voix texte-à-parler axé sur la qualité avec l'architecture autorégressive.

Qualité:

Essaie.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Qualité:

Essaie.

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Qualité:

Essaie.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Langues: en, zh, ja, ko, fr, de, it, es

Voix clonée

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Langues: en, zh

Voix clonée

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Langues: en, zh

Voix clonée

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Langues: en, zh, ja, ko

Voix clonée

ChatterboxChatterbox

Closonnage de voix ultramoderne avec contrôle de l'émotion de la part de Resemblez à l'IA.

Langues: en

Voix clonée

Tortoise TTSTortoise TTS

Multi-voix texte-à-parler axé sur la qualité avec l'architecture autorégressive.

Langues: en

Voix clonée

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Langues: en, zh, ja, ko, fr, de, es, it

Voix clonée

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Langues: en, zh, ja, ko, de, fr, ru, pt, es, it

Voix clonée

Développeur-Première API

API REST compatible OpenAI. Un endpoint, 22+ modèles. Support de streaming pour les applications en temps réel.

  • Format compatible OpenAI
  • Streaming TTS pour les applications en temps réel
  • Traitement par lots pour des emplois importants
  • Notifications Webhook
Afficher les docs de l'API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Tarifs simples et transparents

Commencez gratuitement. Échellez à mesure que vous grandissez.

Gratuit

$0

50 crédits

  • Kokoro, Piper, VITS, MeloTTS
  • Limite de 500 caractères
  • 3 g/heure (pas de compte)
Inscription gratuite

Démarreur

$9/L'objectif est d'améliorer la qualité de l'eau et la qualité de l'eau.

500 crédits/mois

  • Tous les modèles 22+
  • Limite de 5 000 caractères
  • Clonage de la voix
Commencer
Les plus populaires

Pour

$29/L'objectif est d'améliorer la qualité de l'eau et la qualité de l'eau.

2 000 crédits/mois

  • Tout dans Starter
  • Accès à l'API
  • Traitement prioritaire
Obtenez Pro

Entreprise

$99/L'objectif est d'améliorer la qualité de l'eau et la qualité de l'eau.

10 000 crédits/mois

  • Tout en Pro
  • API en vrac
  • file d'attente prioritaire
Contacter les ventes

View all plans including credit packs →

Foire aux questions

TTS.ai est la plate-forme vocale AI la plus complète, offrant des modèles texte à parole 22+, le clonage vocal, la parole à texte et les outils audio. Tous les modèles sont open source sans verrouillage de fournisseur.

Oui! TTS.ai offre un sms-to-speech gratuit avec les modèles Kokoro, Piper, VITS et MeloTTS. Aucun compte requis. Inscrivez-vous pour obtenir 50 crédits gratuits et accéder à tous les modèles.

Pour la vitesse, utilisez Kokoro ou Piper. Pour la qualité, essayez CosyVoice 2 ou StyleTTS 2. Pour le clonage vocal, utilisez Chatterbox ou GPT-SOVITS. Pour la boîte de dialogue, utilisez Dia TTS. Essayez plusieurs modèles sur le même texte à comparer.

Oui. API REST compatible OpenAI pour TTS, STT, clonage vocal et outils audio. Disponible sur les plans Pro (29/mo) et Enterprise (99$/mo). Voir la documentation à tts.ai/api/.

La qualité de la voix varie selon le modèle. Les modèles Premium comme CosyVoice 2, StyleTTS 2, et Chatterbox produisent un langage de qualité presque humaine avec une intonation et une émotion naturelles.

TTS.ai prend en charge plus de 30 langues dans sa bibliothèque modèle. L'anglais a le support modèle le plus large, mais les modèles comme CosyVoice 2 couvrent le chinois, le japonais et le coréen; GPT-SoVITS gère le chinois, le japonais, le coréen et l'anglais; et MeloTTS prend en charge l'anglais, l'espagnol, le français, le chinois, le japonais et le coréen.

Oui. Tout le traitement se fait sur nos serveurs GPU dédiés. Nous ne stockons pas votre entrée de texte ou généré audio après la livraison. Les échantillons de voix téléchargés pour le clonage ne sont utilisés que pour la session en cours et ne sont pas conservés. Nous ne partageons jamais vos données avec des tiers ou ne les utilisons pas pour former des modèles.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai génère de l'audio au format WAV par défaut pour une qualité maximale. Vous pouvez convertir en MP3, FLAC, OGG ou M4A à l'aide de notre outil de conversion audio gratuit. L'API prend en charge la spécification de votre format de sortie préféré directement dans la demande.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Les modèles gratuits (Kokoro, Piper, VITS, MeloTTS) ne nécessitent aucun compte et coûtent zéro crédit. Les modèles standard (2 crédits/1K caractères) incluent Bark, CosyVoice 2, F5-TTS et Dia. Les modèles Premium (4 crédits/1K caractères) incluent OpenVoice, Chatterbox, StyleTTS 2 et Tortoise. Les modèles payants offrent généralement une qualité supérieure, plus de voix et des fonctionnalités supplémentaires comme le clonage vocal.

Oui. L'API prend en charge le traitement par lots pour convertir de grands volumes de texte en langage. Soumettre plusieurs demandes et récupérer les résultats asynchronement en utilisant les UUIDs de travail. Les plans d'entreprise (99 $/mois) incluent l'accès en file d'attente prioritaire pour un traitement par lots plus rapide.
5.0/5 (1)

Commencez à utiliser AI Voice aujourd'hui

Rejoignez les créateurs, les développeurs et les entreprises utilisant TTS.ai