Text zu Sprache API für Entwickler
Erstellen Sie sprachfähige Anwendungen mit unserer REST API. Fügen Sie natürliche Text-zu-Sprechen, Sprachklonen, Sprach-zu-Text und Audioverarbeitung zu Ihren Apps, Chatbots, Sprachassistenten und SaaS-Produkten hinzu. OpenAI-kompatibles Format, 20+ Modelle, einfache Integration.
Versuchen Sie es jetzt
API-Features für Entwickler
Alles, was Sie zum Erstellen sprachfähiger Anwendungen benötigen
Einfache REST API
Eine POST-Anforderung, Sprache zu generieren. JSON-Anforderung, Audio-Antwort. Funktioniert mit jeder Programmiersprache, die HTTP unterstützt.
OpenAI-kompatibel
Drop-In-Ersatz für OpenAI TTS API. Schalten Sie Ihren base_url und API-Schlüssel – vorhandener Code funktioniert sofort.
24+ Modelle verfügbar
Zugriff auf jedes Modell über eine einzige API. Schalten Sie Modelle durch Ändern eines Parameters. Vergleichen Sie Qualität, Geschwindigkeit und Kosten.
Untere zweite Latenz
Kokoro erzeugt Audio in unter 1 Sekunde. Perfekt für Echtzeit-Chatbots, Sprachassistenten und interaktive Anwendungen.
Sprach-Cloning-API
Klonen Sie jede Stimme aus einem kurzen Audio-Beispiel über die API. Verwenden Sie geklonte Stimmen für alle nachfolgenden Generationen.
Mehrere Formate
Ausgabe als WAV, MP3, OGG oder FLAC. Wählen Sie Samplerate und Bittiefe. Streaming Audiounterstützung für Echtzeit-Apps.
Beste Modelle für die Entwicklerintegration
Wählen Sie das richtige Modell für die Geschwindigkeit, Qualität und Kostenanforderungen Ihrer Anwendung
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Am besten für: Schnellstes Modell — Sub-Sekunden-Latenz, ideal für Echtzeit-Apps und Chatbots
Versuch es. Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Am besten für: Streaming von TTS mit Sprachklonen für Sprachassistenten-Anwendungen
Versuch es. CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Am besten für: Konversationale KI mit natürlichem Timing für Chatbot und Assistentenstimme
Versuch es. Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Am besten für: Freies, nur CPU-Modell für hochvolumige Anwendungen zu null Kosten
Versuch es. Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Am besten für: Audio-Generierung mit Soundeffekten für kreative und Entertainment-Apps
Versuch es. BarkWie Sie die TTS API integrieren
Von der Anmeldung zum ersten API-Aufruf in weniger als 5 Minuten
Holen Sie sich Ihren API-Schlüssel
Registrieren Sie sich kostenlos und generieren Sie einen API-Schlüssel aus Ihrem Konto Dashboard. 15.000 Zeichen enthalten.
Machen Sie Ihren ersten Anruf
POST auf /v1/tts mit Text, Modell und Stimme. Erhalten Sie Audiobytes zurück. Unter 5 Zeilen Code.
Wählen Sie Ihr Modell
Testen Sie verschiedene Modelle für Ihren Anwendungsfall. Vergleichen Sie Geschwindigkeit, Qualität und Kosten pro Generation.
Schiff zur Produktion
Skala mit Pay-as-you-go Zeichen. Keine Preislimits für bezahlte Pläne. Überwachen Sie die Nutzung in Ihrem Dashboard.
Beispiele für Schnellstart-Code
Integrieren Sie TTS.ai in jede Sprache mit unserer REST API
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Was Entwickler bauen mit TTS.ai
Gemeinsame Integrationsmuster und -anwendungen
KI Chatbots & Assistenten
Fügen Sie Sprachausgabe zu Ihrem Chatbot oder KI-Assistenten hinzu. Pipe LLM-Antworten über TTS für sprachfähige Schnittstellen. Kokoro liefert Subsekundenlatenz für Echtzeitgespräche. Sesam CSM erzeugt Konversationssprache mit natürlichem Timing.
- LLM-Antwort auf Sprachpipeline
- Sub-Sekunden-Latenz mit Kokoro
- Gesprächsrede mit Sesam CSM
- Audioausgabe streamen
Mobile & Sprach-Apps
Erstellen Sie sprachfähige mobile Apps, Zugänglichkeitstools, Lesen von Apps und Sprachlernplattformen. Unsere REST API funktioniert mit jedem mobilen Framework. Laden Sie Audiodateien herunter oder streamen Sie direkt zum Client.
- Reagieren Sie Native, Flutter, Swift, Kotlin
- Barrierefreiheit und Lese-Apps
- Sprachlernplattformen
- Erzeugung von Audioinhalten
SaaS-Erzeugnisse
White-Label-Sprachfunktionen in Ihrem SaaS-Produkt. Fügen Sie TTS, STT, Sprachklonen und Audioverarbeitung als Funktionen in Ihrer Plattform hinzu. Nutzen Sie unsere API als Sprach-Backend, ohne die GPU-Infrastruktur zu verwalten.
- Merkmale der Stimme mit weißem Etikett
- Keine GPU-Infrastruktur erforderlich
- Entgelt-pro-Verwendung-Preise
- 20+ Modelle für Ihre Nutzer
Automatisierungspipelines
Integrieren Sie Sprachgenerierung in CI/CD-Pipelines, Content Automation und Batch Processing Workflows. Generieren Sie Tausende von Audiodateien aus Tabellendaten, automatisieren Sie die Podcast-Produktion oder erstellen Sie Content-Lokalisierung-Pipelines.
- Batch-Verarbeitung über API
- Content-Lokalisierungspipelines
- CI/CD-Integration
- Tabellenkalkulation zur Audioautomatisierung
API-Spezifikationen
Für Produktionsanwendungen gebaut
20+
TTS-Modelle
100+
Stimmen
30+
Sprachen
<1s
Latenzzeit (Kokoro)
Häufig gestellte Fragen
Häufige Fragen zur TTS.ai Entwickler-API
Was könnten wir verbessern? Ihr Feedback hilft uns, Probleme zu beheben.
Bereit, mit Voice AI zu bauen?
Holen Sie sich Ihren kostenlosen API-Schlüssel und starten Sie den Aufbau. 15.000 Zeichen auf Anmeldung, kostenlose Modelle verfügbar, umfassende Dokumentation.