API texte à discours pour les développeurs
Construisez des applications vocales avec notre API REST. Ajoutez du texte naturel à la parole, du clonage vocal, de la parole au texte et du traitement audio à vos applications, chatbots, assistants vocaux et produits SaaS. Format compatible OpenAI, modèles 20+, intégration simple.
Essayez-le maintenant.
Caractéristiques de l'API pour les développeurs
Tout ce dont vous avez besoin pour construire des applications vocales
API REST simple
Une requête POST pour générer la parole. Requête JSON, réponse audio. Fonctionne avec n'importe quel langage de programmation qui supporte HTTP.
Compatible OpenAI
Remplacement de l'API OpenAI TTS. Changez votre clé base_url et API — le code existant fonctionne immédiatement.
24+ Modèles disponibles
Accédez à chaque modèle à l'aide d'une seule API. Changez les modèles en changeant un paramètre. Comparez la qualité, la vitesse et le coût.
Sous-deuxième latence
Kokoro génère de l'audio en moins de 1 seconde. Parfait pour les chatbots en temps réel, les assistants vocaux et les applications interactives.
API de Clonage de la voix
Clone n'importe quelle voix d'un court échantillon audio via l'API. Utilisez des voix clonées pour toutes les générations suivantes.
Formats multiples
Sortie comme WAV, MP3, OGG ou FLAC. Choisissez le taux d'échantillonnage et la profondeur du bit.
Meilleurs modèles pour l'intégration des développeurs
Choisissez le bon modèle pour les exigences de vitesse, de qualité et de coût de votre application
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Meilleur pour: Modèle le plus rapide — sous-seconde latence, idéal pour les applications en temps réel et les chatbots
Essaie. Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Meilleur pour: Streaming TTS avec clonage vocal pour les applications d'assistant vocal
Essaie. CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Meilleur pour: AI conversationnelle avec chronométrage naturel pour chatbot et voix assistante
Essaie. Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Meilleur pour: Modèle CPU gratuit uniquement pour les applications à haut volume à coût zéro
Essaie. Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Meilleur pour: Production audio avec effets sonores pour les applications créatives et de divertissement
Essaie. BarkComment intégrer l'API TTS
De l'inscription au premier appel API en moins de 5 minutes
Obtenez votre clé API
Inscrivez-vous gratuitement et générer une clé API à partir de votre tableau de bord de compte. 15 000 caractères inclus.
Faites votre premier appel
POST to /v1/tts with text, model, and voice. Retirez les octets audio. Moins de 5 lignes de code.
Choisissez votre modèle
Testez différents modèles pour votre cas d'utilisation. Comparez la vitesse, la qualité et le coût par génération.
Navire jusqu'à la production
Échelle avec des caractères pay-as-You-go. Pas de limites de taux sur les régimes payés. Surveillez l'utilisation dans votre tableau de bord.
Exemples de code de démarrage rapide
Intégrez TTS.ai dans n'importe quelle langue avec notre API REST
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Ce que les développeurs construisent avec TTS.ai
Modèles et applications communs d'intégration
AI Chatbots & Assistants
Ajoutez la sortie vocale à votre chatbot ou assistant AI. Pipe LLM répond par TTS pour les interfaces vocaux. Kokoro offre une latence sous-seconde pour les conversations en temps réel. Sesame CSM génère un discours conversationnel avec un timing naturel.
- Réponse de la LLM au pipeline de parole
- Sous-deuxième latence avec Kokoro
- Discours conversationnel avec Sésame CSM
- Sortie audio en streaming
Applications mobiles et vocales
Construisez des applications mobiles, des outils d'accessibilité, des applications de lecture et des plateformes d'apprentissage de la langue compatibles avec la voix. Notre API REST fonctionne avec n'importe quel cadre mobile.
- Réagir native, flutter, swift, Kotlin
- Accessibilité et lecture d'applications
- Plates-formes d'apprentissage des langues
- Production de contenu audio
Produits SaaS
Capacités vocales en marque blanche dans votre produit SaaS. Ajoutez TTS, STT, clonage vocal et traitement audio comme fonctionnalités dans votre plateforme. Utilisez notre API comme moteur vocal sans gérer l'infrastructure GPU.
- Caractéristiques vocales en marque blanche
- Pas d'infrastructure GPU nécessaire
- Prix à la carte
- 20+ modèles pour offrir à vos utilisateurs
Automatisation des pipelines
Intégrer la génération vocale dans les pipelines CI/CD, l'automatisation du contenu et le traitement par lots. Générer des milliers de fichiers audio à partir de données de tableur, automatiser la production de podcast ou construire des pipelines de localisation du contenu.
- Traitement par lots via API
- Pipelines de localisation du contenu
- Intégration CI/CD
- Feuille de calcul pour l'automatisation audio
Spécifications de l'API
Construit pour des applications de production
20+
Modèles TTS
100+
Voix
30+
Langues
<1s
Latence (Kokoro)
Foire aux questions
Questions courantes sur l'API de développeur TTS.ai
Que pourrions-nous améliorer? Vos commentaires nous aident à résoudre les problèmes.
Prêt à construire avec Voice AI?
Obtenez votre clé API gratuite et commencez à construire. 50 crédits sur inscription, modèles gratuits disponibles, documentation complète.