AI gratuit Texte au discours

20+ modèles open-source, 107+ des voix, 32+ Aucun compte n'est requis.

1K+
créateurs
2K+
générations
20+
Modèles d'IA
107+
voix
0/500 caractères Gratuit
Comme TTS.ai? Dites à vos amis!

Tout ce dont vous avez besoin pour la voix AI

30+ outils alimentés par des modèles d'IA open-source

20+ Modèles de voix d'IA

La collection la plus complète de modèles TTS open-source en une seule plateforme

KokoroKokoro Free

Kokoro est un modèle text-to-speech de 82 millions de paramètres qui frappe bien au-dessus de sa classe de poids. Malgré sa petite taille, il produit un langage remarquablement naturel et expressif. Kokoro prend en charge plusieurs langues dont l'anglais, le japonais, le chinois et le coréen avec une variété de voix expressives.

Meilleur pour: TTS de haute qualité avec latence minimale, applications de streaming

Essayer gratuitement

PiperPiper Free

Piper est un moteur text-to-speech léger développé par Rhasspy qui utilise les architectures VITS et larynx. Il fonctionne entièrement sur CPU, ce qui le rend idéal pour les périphériques de bord, la domotique et les applications nécessitant TTS hors ligne. Avec plus de 100 voix dans plus de 30 langues, Piper offre un langage sonore naturel à des vitesses en temps réel même sur un Raspberry Pi 4.

Meilleur pour: Aperçus rapides, accessibilité et applications intégrées

Essayer gratuitement

VITSVITS Free

VITS (Variational Inférence with adversarial learning for de bout en bout Text-to-Speech) est une méthode TTS parallèle de bout en bout qui génère plus de sonorisation naturelle que les modèles en deux étapes actuels. Il adopte l'inférence variationnelle augmentée avec des flux de normalisation et un processus de formation contradictoire, permettant une amélioration significative de la naturalité.

Meilleur pour: Texte à usage général avec prosodie naturelle

Essayer gratuitement

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai est une bibliothèque multilingue TTS qui soutient l'anglais (américain, britannique, indien, australien), l'espagnol, le français, le chinois, le japonais et le coréen. Il est extrêmement rapide, le traitement du texte à une vitesse presque en temps réel sur CPU seul. MeloTTS est conçu pour l'utilisation de la production et supporte à la fois l'inférence CPU et GPU.

Meilleur pour: Applications de production nécessitant des TTS rapides et multilingues

Essayer gratuitement

BarkBark Standard

Modèle transformateur texte-audio qui génère des effets réalistes de la parole, de la musique et du son.

Développeur & #160;: Suno · Licence & #160;: MIT

Essaie.

Bark SmallBark Small Standard

Version plus légère de Bark avec inférence plus rapide et utilisation de la mémoire inférieure.

Développeur & #160;: Suno · Licence & #160;: MIT

Essaie.

CosyVoice 2CosyVoice 2 Standard

Le TTS en streaming évolutif d'Alibaba avec la naturelité humaine-parité et la latence quasi nulle.

Développeur & #160;: Alibaba (Tongyi Lab) · Licence & #160;: Apache 2.0

Essaie.

Dia TTSDia TTS Standard

Modèle de génération de dialogue multi haut-parleurs qui crée des conversations naturelles entre les haut-parleurs.

Développeur & #160;: Nari Labs · Licence & #160;: Apache 2.0

Essaie.

Parler TTSParler TTS Standard

Décrivez la voix que vous voulez dans le langage naturel et Parler génère la parole correspondante.

Développeur & #160;: Hugging Face · Licence & #160;: Apache 2.0

Essaie.

GLM-TTSGLM-TTS Standard

Atteint le taux d'erreur de caractère le plus bas parmi les modèles TTS open-source.

Développeur & #160;: Zhipu AI · Licence & #160;: GLM-4 License

Essaie.

IndexTTS-2IndexTTS-2 Standard

TTS zéro-shot avec un contrôle d'émotion à grain fin et une haute expressivité.

Développeur & #160;: Index Team · Licence & #160;: Bilibili Model License

Essaie.

Spark TTSSpark TTS Standard

Le clonage de la voix TTS avec une émotion contrôlable et un style de parole via des invites.

Développeur & #160;: SparkAudio · Licence & #160;: CC BY-NC-SA 4.0

Essaie.

GPT-SoVITSGPT-SoVITS Standard

Closonnage de voix à faible capture TTS qui reproduit n'importe quelle voix à partir de seulement 5 secondes d'audio.

Développeur & #160;: RVC-Boss · Licence & #160;: MIT

Essaie.

OrpheusOrpheus Standard

Modèle TTS émotionnel au niveau humain formé sur 100 K heures de données de la parole.

Développeur & #160;: Canopy Labs · Licence & #160;: Llama 3.2 Community

Essaie.

Qwen3 TTSQwen3 TTS Standard

Le TTS multilingue d'Alibaba avec clonage vocal, voix prédéfinies et design vocal à partir du texte.

Développeur & #160;: Alibaba (Qwen) · Licence & #160;: Apache 2.0

Essaie.

ChatterboxChatterbox Premium

Closonnage de voix ultramoderne avec contrôle de l'émotion de la part de Resemblez à l'IA.

Qualité:

Essaie.

Tortoise TTSTortoise TTS Premium

Multi-voix texte-à-parler axé sur la qualité avec l'architecture autorégressive.

Qualité:

Essaie.

StyleTTS 2StyleTTS 2 Premium

Le texte à la parole au niveau humain grâce à la diffusion de style et à la formation contradictoire.

Qualité:

Essaie.

OpenVoiceOpenVoice Premium

Le clonage de la voix instantanée avec contrôle granulaire sur le style, l'émotion et l'accent.

Qualité:

Essaie.

Sesame CSMSesame CSM Premium

Modèle conversationnel de la parole générant le dialogue naturel avec le timing approprié et l'émotion.

Qualité:

Essaie.

CosyVoice 2CosyVoice 2

Le TTS en streaming évolutif d'Alibaba avec la naturelité humaine-parité et la latence quasi nulle.

Langues: en, zh, ja, ko, fr, de, it, es

Voix clonée

GLM-TTSGLM-TTS

Atteint le taux d'erreur de caractère le plus bas parmi les modèles TTS open-source.

Langues: en, zh

Voix clonée

IndexTTS-2IndexTTS-2

TTS zéro-shot avec un contrôle d'émotion à grain fin et une haute expressivité.

Langues: en, zh

Voix clonée

Spark TTSSpark TTS

Le clonage de la voix TTS avec une émotion contrôlable et un style de parole via des invites.

Langues: en, zh

Voix clonée

GPT-SoVITSGPT-SoVITS

Closonnage de voix à faible capture TTS qui reproduit n'importe quelle voix à partir de seulement 5 secondes d'audio.

Langues: en, zh, ja, ko

Voix clonée

ChatterboxChatterbox

Closonnage de voix ultramoderne avec contrôle de l'émotion de la part de Resemblez à l'IA.

Langues: en

Voix clonée

Tortoise TTSTortoise TTS

Multi-voix texte-à-parler axé sur la qualité avec l'architecture autorégressive.

Langues: en

Voix clonée

OpenVoiceOpenVoice

Le clonage de la voix instantanée avec contrôle granulaire sur le style, l'émotion et l'accent.

Langues: en, zh, ja, ko, fr, de, es, it

Voix clonée

Qwen3 TTSQwen3 TTS

Le TTS multilingue d'Alibaba avec clonage vocal, voix prédéfinies et design vocal à partir du texte.

Langues: en, zh, ja, ko, de, fr, ru, pt, es, it

Voix clonée

Développeur-Première API

API REST compatible OpenAI. Un endpoint, 22+ modèles. Support de streaming pour les applications en temps réel.

  • Format compatible OpenAI
  • Streaming TTS pour les applications en temps réel
  • Traitement par lots pour des emplois importants
  • Notifications Webhook
Afficher les docs de l'API
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Tarifs simples et transparents

Commencez gratuitement. Échellez à mesure que vous grandissez.

Gratuit

$0

15 crédits

  • Kokoro, Piper, VITS, MeloTTS
  • Limite de 500 caractères
  • 3 g/heure (pas de compte)
Inscription gratuite

Démarreur

$9/L'objectif est d'améliorer la qualité de l'eau et la qualité de l'eau.

500 crédits/mois

  • Tous les modèles 22+
  • 100 000 chars par génération
  • Clonage de la voix
Commencer
Les plus populaires

Pour

$29/L'objectif est d'améliorer la qualité de l'eau et la qualité de l'eau.

2 000 crédits/mois

  • Tout dans Starter
  • Accès à l'API
  • Traitement prioritaire
Obtenez Pro

Entreprises

$99/L'objectif est d'améliorer la qualité de l'eau et la qualité de l'eau.

10 000 crédits/mois

  • Tout en Pro
  • API en vrac
  • file d'attente prioritaire
Obtenir des affaires

Afficher tous les plans, y compris les paquets de caractères →

Foire aux questions

TTS.ai est la plate-forme vocale AI la plus complète, offrant des modèles texte à parole 22+, le clonage vocal, la parole à texte et les outils audio. Tous les modèles sont open source sans verrouillage de fournisseur.

Oui! TTS.ai offre un sms-to-speech gratuit avec les modèles Kokoro, Piper, VITS et MeloTTS. Aucun compte requis. Inscrivez-vous pour obtenir 15 000 caractères gratuits et accéder à tous les modèles.

Pour la vitesse, utilisez Kokoro ou Piper. Pour la qualité, essayez CosyVoice 2 ou StyleTTS 2. Pour le clonage vocal, utilisez Chatterbox ou GPT-SOVITS. Pour la boîte de dialogue, utilisez Dia TTS. Essayez plusieurs modèles sur le même texte à comparer.

Oui. API REST compatible OpenAI pour TTS, STT, clonage vocal et outils audio. Disponible sur les plans Pro (29/mo) et Enterprise (99$/mo). Voir la documentation à tts.ai/api/.

La qualité de la voix varie selon le modèle. Les modèles Premium comme CosyVoice 2, StyleTTS 2, et Chatterbox produisent un langage de qualité presque humaine avec une intonation et une émotion naturelles.

TTS.ai prend en charge plus de 30 langues dans sa bibliothèque modèle. L'anglais a le support modèle le plus large, mais les modèles comme CosyVoice 2 couvrent le chinois, le japonais et le coréen; GPT-SoVITS gère le chinois, le japonais, le coréen et l'anglais; et MeloTTS prend en charge l'anglais, l'espagnol, le français, le chinois, le japonais et le coréen.

Oui. Tout le traitement se fait sur nos serveurs GPU dédiés. Nous ne stockons pas votre entrée de texte ou généré audio après la livraison. Les échantillons de voix téléchargés pour le clonage ne sont utilisés que pour la session en cours et ne sont pas conservés. Nous ne partageons jamais vos données avec des tiers ou ne les utilisons pas pour former des modèles.

Oui. Tout l'audio généré sur TTS.ai est à vous d'utiliser commercialement, y compris pour les vidéos YouTube, podcasts, audiobooks, applications, publicités et produits. Nos modèles sont open source sous licence permissive (MIT, Apache 2.0). Pas de redevances ou d'attribution requise.

TTS.ai génère de l'audio au format WAV par défaut pour une qualité maximale. Vous pouvez convertir en MP3, FLAC, OGG ou M4A à l'aide de notre outil de conversion audio gratuit. L'API prend en charge la spécification de votre format de sortie préféré directement dans la demande.

Téléchargez un court échantillon audio (aussi peu que 5 secondes) de la voix que vous voulez cloner, puis tapez n'importe quel texte pour générer la parole dans cette voix. Des modèles comme Chatterbox, GPT-SoVITS et CosyVoice 2 supportent le clonage de la voix. La voix clonée capture le ton, l'accent et le style de parole.

Les modèles gratuits (Kokoro, Piper, VITS, MeloTTS) ne nécessitent aucun compte et coûtent zéro caractère. Les modèles standard (2 000 caractères/1K d'entrée) incluent Bark, CosyVoice 2, F5-TTS et Dia. Les modèles Premium (4 000 caractères/1K d'entrée) incluent OpenVoice, Chatterbox, StyleTTS 2 et Tortoise. Les modèles payants offrent généralement une qualité supérieure, plus de voix et des fonctionnalités supplémentaires comme le clonage vocal.

Oui. L'API prend en charge le traitement par lots pour convertir de grands volumes de texte en langage. Soumettre plusieurs demandes et récupérer les résultats asynchronement en utilisant les UUIDs de travail. Les plans d'entreprise (99 $/mois) incluent l'accès en file d'attente prioritaire pour un traitement par lots plus rapide.
4.0/5 (8)

Commencez à utiliser AI Voice aujourd'hui

Rejoignez les créateurs, les développeurs et les entreprises utilisant TTS.ai