Tekst naar Speech API voor ontwikkelaars

Bouw spraakgestuurde toepassingen met onze REST API. Voeg natuurlijke tekst-naar-spraak, spraakklonen, spraak-naar-tekst en audioverwerking toe aan uw apps, chatbots, spraakassistenten en SaaS-producten. OpenAI-compatibel formaat, 20+ modellen, eenvoudige integratie.

REST API Chatbots Spraakapps SaaS-producten Automatisering

Probeer het nu.

Gratis met Kokoro, Piper, VITS, MeloTTS
Uw gegenereerde audio zal hier verschijnen
Gegenereerd
Downloaden
Hou van TTS.ai? Vertel het je vrienden!

API-functies voor ontwikkelaars

Alles wat je nodig hebt om spraakgestuurde toepassingen te bouwen

Eenvoudige REST API

Eén POST-verzoek om spraak te genereren. JSON-verzoek, audio-antwoord. Werkt met elke programmeertaal die HTTP ondersteunt.

OpenAI-compatibel

Drop-in vervanging voor OpenAI TTS API. Schakel uw base_url en API key.. bestaande code werkt onmiddellijk.

24+ Modellen beschikbaar

Toegang tot elk model door middel van een enkele API. Schakel modellen door het veranderen van een parameter. Vergelijk kwaliteit, snelheid en kosten.

Sub-Tweede Tijdigheid

Kokoro genereert audio in minder dan 1 seconde. Perfect voor real-time chatbots, spraakassistenten en interactieve toepassingen.

Voice Cloning API

Kloon elke stem van een korte audio sample via de API. Gebruik gekloonde stemmen voor alle volgende generaties.

Meerdere formaten

Uitvoer als WAV, MP3, OGG, of FLAC. Kies sample rate en bitdiepte. Streaming audio ondersteuning voor real-time apps.

Beste modellen voor integratie van ontwikkelaars

Kies het juiste model voor de snelheid, kwaliteit en kosten van uw applicatie

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Beste voor: Snelste model: sub-second latency, ideaal voor real-time apps en chatbots

Proberen Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Stemklonen

Beste voor: Streaming TTS met stemklonen voor spraakassistenttoepassingen

Proberen CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Beste voor: Conversational AI met natuurlijke timing voor chatbot en assistent stem

Proberen Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Beste voor: Gratis, CPU-only model voor toepassingen met een hoog volume tegen nul kosten

Proberen Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Beste voor: Audio generatie met geluidseffecten voor creatieve en entertainment apps

Proberen Bark

Hoe de TTS API te integreren

Van aanmelding tot eerste API-oproep in minder dan 5 minuten

1

Haal je API-sleutel

Meld je gratis aan en maak een API-sleutel van je account dashboard. 15.000 tekens inbegrepen.

2

Maak uw eerste oproep

POST naar /v1/tts met tekst, model en stem. Krijg audio bytes terug. Onder 5 regels code.

3

Kies uw model

Test verschillende modellen voor uw use case. Vergelijk snelheid, kwaliteit en kosten per generatie.

4

Schip naar productie

Schaal met pay-as-you-go tekens. Geen tarieflimieten op betaalde plannen. Monitor het gebruik in uw dashboard.

Voorbeelden van snelstartcode

Integreer TTS.ai in elke taal met onze REST API

Python Populair
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Universeel
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-compatibel formaat Drop-in
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Wat Ontwikkelaars Bouwen met TTS.ai

Gemeenschappelijke integratiepatronen en toepassingen

AI Chatbots & assistenten

Voeg spraakuitvoer toe aan je chatbot- of AI-assistent. Pijp LLM-responsen via TTS voor spraakgestuurde interfaces. Kokoro levert sub-seconde latentie voor real-time gesprekken. Sesam CSM genereert conversational speech met natuurlijke timing.

  • LLM-antwoord op spraakpijplijn
  • Subseconde latency met Kokoro
  • Gesprekstoespraak met Sesam CSM
  • Audio-uitvoer streamen

Mobiele & spraakapps

Bouw mobiele apps met spraakfunctie, toegankelijkheidstools, leesapps en taallearningplatforms. Onze REST API werkt met elk mobiel kader. Download audiobestanden of stream rechtstreeks naar de client.

  • React Native, Flutter, Swift, Kotlin
  • Toegankelijkheids- en leesapps
  • Platforms voor het leren van talen
  • Audio-inhoud genereren

SaaS-producten

Wit-label spraakmogelijkheden in uw SaaS-product. Voeg TTS, STT, voice klonen en audioverwerking toe als functies in uw platform. Gebruik onze API als uw voice backend zonder GPU-infrastructuur te beheren.

  • Wit-label spraakfuncties
  • Geen GPU-infrastructuur nodig
  • Pay-per-use prijzen
  • 20+ modellen om uw gebruikers aan te bieden

Automatiseringspijpleidingen

Integreer spraakgeneratie in CI/CD-pijpleidingen, contentautomatisering en batchverwerking workflows. Genereer duizenden audiobestanden uit spreadsheetgegevens, automatiseer podcastproductie, of bouw contentlokalisatie pijpleidingen.

  • Batchverwerking via API
  • Inhoud lokalisatie pijpleidingen
  • CI/CD integratie
  • Spreadsheet naar audioautomatisering

API Specificaties

Gebouwd voor productietoepassingen

20+

TTS-modellen

100+

Stemmen

30+

Talen

<1s

Latency (Kokoro)

Veelgestelde vragen

Veelgestelde vragen over de TTS.ai developer API

Ja. Onze API volgt het OpenAI audio spraakformaat. Als u de OpenAI Python- of JavaScript-clientbibliotheek gebruikt, kunt u overschakelen naar TTS.ai door de base_url- en api_key-parameters te wijzigen. Uw bestaande code werkt zonder wijzigingen.

Kokoro genereert audio in minder dan 1 seconde voor typische zinnen. CosyVoice 2 ondersteunt streaming output voor nog lagere waargenomen latentie. Voor chatbots en stemassistenten, totale ronde-trip tijd is typisch 1-3 seconden, afhankelijk van de tekst lengte en modelkeuze.

Gratis modellen (Kokoro, Piper, VITS, MeloTTS) zijn volledig gratis. Standaard modellen gebruiken 2x tekens per 1K tekst. Premium modellen gebruiken 4x tekens per 1K tekst. Schrijf je gratis in met 15.000 tekens. Plannen beginnen bij $9/maand voor 500.000 tekens.

Ja. Upload een referentie audiomonster (5-30 seconden) naar het stemklonen eindpunt, gebruik dan de gekloonde voice ID in volgende TTS-verzoeken. Modellen die klonen ondersteunen zijn onder andere CosyVoice 2, Chatterbox, Fish Speech en GPT-SoVITS.

Gratis niveau heeft basistarief te beperken (3 aanvragen per uur zonder account). Betaalde plannen hebben royale tarieflimieten geschikt voor productie toepassingen. Neem contact met ons op voor enterprise-level doorvoer eisen.

WAV (niet gecomprimeerd, hoogste kwaliteit), MP3 (gecomprimeerde, kleinere bestanden), OGG (open formaat) en FLAC (verliesloze compressie). Geef het formaat op in uw verzoek. Standaard is WAV op basis van de oorspronkelijke sample rate van het model.

Ja. Combineer onze TTS API met een speech-to-text model en een LLM om een complete voice assistant pipeline te bouwen. Kokoro biedt sub-second latency ideaal voor real-time conversatie. CosyVoice 2 ondersteunt streaming output voor nog lagere waargenomen responstijden.

CosyVoice 2 en Kokoro ondersteuning streaming audio output waar audio brokken worden geleverd als ze worden gegenereerd. Dit vermindert time-to-first-byte voor real-time toepassingen zoals stem assistenten en interactieve ervaringen.

De API geeft standaard HTTP-statuscodes terug. Implementeer exponentiële back-off voor 5xx fouten en snelheidslimietresponsen. Voor missiekritische toepassingen, voeg een wachtrij met retry logica toe. Onze API heeft een hoge uptime maar veerkrachtige foutafhandeling wordt altijd aanbevolen.

Ja. De /v1/voices en /v1/models endpoints geven JSON lijsten terug van alle beschikbare stemmen en modellen met hun metadata (taalondersteuning, kwaliteitsbeoordelingen, snelheidsgraden en pricing tier). Gebruik deze om dynamische modelselectoren op te bouwen in uw toepassing.

Gratis modellen (Kokoro, Piper, VITS, MeloTTS) dienen als een effectieve zandbak omdat ze volledig vrij zijn. Test uw integratie met vrije modellen en schakel vervolgens over op premium modellen in de productie door het veranderen van de modelparameter. Er is geen aparte testomgeving nodig.

De meeste van onze modellen zijn open-source en kunnen worden zelf-hosted. Echter, self-hosting vereist aanzienlijke GPU middelen (we gebruiken 4x NVIDIA Tesla P40 met 96GB VRAM totaal). De API biedt een kosteneffectieve alternatief zonder infrastructuurbeheer.
5.0/5 (1)

Wat kunnen we verbeteren? Uw feedback helpt ons problemen op te lossen.

Klaar om te bouwen met Voice Al?

Krijg je gratis API sleutel en begin met bouwen. 15.000 tekens bij aanmelding, gratis modellen beschikbaar, uitgebreide documentatie.