Text to Speech API for Developers
Costruisci applicazioni attivate con la nostra API REST. Aggiungi testo naturale alla bocca, clonazione vocale, linguaggio-testo ed elaborazione audio alle tue app, chatbot, assistenti vocali e prodotti SaaS. Formato compatibile con OpenAI, 20+ modelli, integrazione semplice.
Provalo ora.
Funzionalità API per sviluppatori
Tutto ciò di cui hai bisogno per creare applicazioni abilitato alla voce
Semplice API REST
Una richiesta POST per generare discorso. Richiesta JSON, risposta audio. Funziona con qualsiasi linguaggio di programmazione che supporta HTTP.
OpenAI-Compatibile
Sostituzione di drop-in per API OpenAI TTS. Cambia il tuo codice esistente base_url e API.
24+ Modelli disponibili
Accedere a ogni modello tramite una singola API. Cambiare i modelli cambiando un parametro. Confrontare qualità, velocità e costi.
Sotto-Seconda Latenza
Kokoro genera audio in meno di 1 secondo. Perfetto per chatbot in tempo reale, assistenti vocali e applicazioni interattive.
API di clonazione vocale
Clonare qualsiasi voce da un breve campione audio tramite l'API. Utilizzare voci clonate per tutte le generazioni successive.
Formati multipli
Output come WAV, MP3, OGG, o FLAC. Scegliere velocità di campionamento e profondità di bit. Streaming supporto audio per applicazioni in tempo reale.
Migliori modelli per l'integrazione degli sviluppatori
Scegli il modello giusto per i requisiti di velocità, qualità e costi della tua applicazione
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Meglio per: La latenza sub-secondo del modello più veloce, ideale per applicazioni in tempo reale e chatbot
Prova Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Meglio per: Streaming TTS con cloning vocale per applicazioni Voice Assistant
Prova CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Meglio per: IA conversazionale con tempismo naturale per chatbot e voce assistente
Prova Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Meglio per: Modello gratuito, CPU-Solo per applicazioni ad alto volume a costo zero
Prova Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Meglio per: Generazione audio con effetti sonori per applicazioni creative e di intrattenimento
Prova BarkCome integrare le API TTS
Dalla registrazione alla prima chiamata API in meno di 5 minuti
Ottieni la tua chiave API
Iscriviti gratis e genera una chiave API dal tuo account dashboard. 15.000 caratteri inclusi.
Fai la tua prima chiamata
POST a /v1/tts con testo, modello e voce. Ricevi byte audio indietro. Sotto 5 linee di codice.
Scegli il tuo modello
Prova diversi modelli per il tuo caso d'uso. Confronta velocità, qualità e costi per generazione.
Nave per la produzione
Scala con i caratteri pay-as-you-go. Nessun limite di tasso sui piani a pagamento. Monitorare l'uso nel cruscotto.
Esempi di codice di avvio rapido
Integra TTS.ai in qualsiasi lingua con la nostra API REST
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Che cosa gli sviluppatori costruiscono con TTS.ai
Modelli e applicazioni comuni di integrazione
Assistenti e chatbot AI
Aggiunga l'uscita vocale al vostro chatbot o assistente AI. Le risposte LLM del tubo attraverso TTS per le interfacce vocali-enabled. Kokoro fornisce la latenza sub-secondo per le conversazioni in tempo reale. Sesame CSM genera il discorso di conversazione con i tempi naturali.
- Risposta LLM alla conduttura vocale
- Seconda latenza con Kokoro
- Discorso conversazionale con Sesame CSM
- Streaming output audio
App per dispositivi mobili e voce
Costruisci app per dispositivi mobili, strumenti di accessibilità, app per la lettura e piattaforme per l'apprendimento delle lingue. Le nostre API REST funzionano con qualsiasi framework mobile. Scarica file audio o stream direttamente al client.
- React Native, Flutter, Swift, Kotlin
- Accessibilità e lettura delle app
- Piattaforme di apprendimento delle lingue
- Generazione di contenuti audio
Prodotti SaaS
Capacità vocali in white label nel prodotto SaaS. Aggiungi TTS, STT, cloning vocale ed elaborazione audio come funzionalità nella tua piattaforma. Usa la nostra API come backend vocale senza gestire l'infrastruttura GPU.
- Caratteristiche della voce in bianco
- Nessuna infrastruttura GPU necessaria
- Tariffe pay-per-use
- 20+ modelli per offrire agli utenti
Tubi di automazione
Integra la generazione vocale in pipeline CI/CD, automazione dei contenuti e flussi di lavoro di elaborazione batch. Genera migliaia di file audio dai dati del foglio di calcolo, automatizza la produzione di podcast o costruisci pipeline di localizzazione dei contenuti.
- Elaborazione di lotti tramite API
- Contenuti di localizzazione pipeline
- Integrazione CI/CD
- Foglio di calcolo per l'automazione audio
Specifiche API
Costruito per applicazioni di produzione
20+
Modelli TTS
100+
Voci
30+
Lingue
<1s
Latenza (Kokoro)
Domande frequenti
Domande comuni sulla TTS.ai API sviluppatore
Cosa potremmo migliorare? Il tuo feedback ci aiuta a risolvere i problemi.
Pronto a costruire con la voce AI?
Ottieni la tua chiave API gratuita e inizia a costruire. 15.000 caratteri su iscrizione, modelli gratuiti disponibili, documentazione completa.