Rapporteer bug / feature request

Tekst naar Speech API voor ontwikkelaars

Bouw spraakgestuurde toepassingen met onze REST API. Voeg natuurlijke tekst-naar-spraak, spraakklonen, spraak-naar-tekst en audioverwerking toe aan uw apps, chatbots, spraakassistenten en SaaS-producten. OpenAI-compatibel formaat, 20+ modellen, eenvoudige integratie.

REST API Chatbots Spraakapps SaaS-producten Automatisering

Volledige TTS-editor API Docs

Probeer het nu.

0/500

Gratis met Kokoro, Piper, VITS, MeloTTS

Uw gegenereerde audio zal hier verschijnen

Volledige TTS-editor openen

API-functies voor ontwikkelaars

Alles wat je nodig hebt om spraakgestuurde toepassingen te bouwen

Eenvoudige REST API

Eén POST-verzoek om spraak te genereren. JSON-verzoek, audio-antwoord. Werkt met elke programmeertaal die HTTP ondersteunt.

OpenAI-compatibel

Drop-in vervanging voor OpenAI TTS API. Schakel uw base_url en API key.. bestaande code werkt onmiddellijk.

24+ Modellen beschikbaar

Toegang tot elk model door middel van een enkele API. Schakel modellen door het veranderen van een parameter. Vergelijk kwaliteit, snelheid en kosten.

Sub-Tweede Tijdigheid

Kokoro genereert audio in minder dan 1 seconde. Perfect voor real-time chatbots, spraakassistenten en interactieve toepassingen.

Voice Cloning API

Kloon elke stem van een korte audio sample via de API. Gebruik gekloonde stemmen voor alle volgende generaties.

Meerdere formaten

Uitvoer als WAV, MP3, OGG, of FLAC. Kies sample rate en bitdiepte. Streaming audio ondersteuning voor real-time apps.

Beste modellen voor integratie van ontwikkelaars

Kies het juiste model voor de snelheid, kwaliteit en kosten van uw applicatie

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Beste voor: Snelste model: sub-second latency, ideaal voor real-time apps en chatbots

Proberen Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Stemklonen

Beste voor: Streaming TTS met stemklonen voor spraakassistenttoepassingen

Proberen CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Beste voor: Conversational AI met natuurlijke timing voor chatbot en assistent stem

Proberen Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Beste voor: Gratis, CPU-only model voor toepassingen met een hoog volume tegen nul kosten

Proberen Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Beste voor: Audio generatie met geluidseffecten voor creatieve en entertainment apps

Proberen Bark

Hoe de TTS API te integreren

Van aanmelding tot eerste API-oproep in minder dan 5 minuten

Haal je API-sleutel

Meld je gratis aan en maak een API-sleutel van je account dashboard. 15.000 tekens inbegrepen.

Maak uw eerste oproep

POST naar /v1/tts met tekst, model en stem. Krijg audio bytes terug. Onder 5 regels code.

Kies uw model

Test verschillende modellen voor uw use case. Vergelijk snelheid, kwaliteit en kosten per generatie.

Schip naar productie

Schaal met pay-as-you-go tekens. Geen tarieflimieten op betaalde plannen. Monitor het gebruik in uw dashboard.

Voorbeelden van snelstartcode

Integreer TTS.ai in elke taal met onze REST API

Python Populair

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Universeel

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI-compatibel formaat Drop-in

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Krijg je gratis API sleutel

Wat Ontwikkelaars Bouwen met TTS.ai

Gemeenschappelijke integratiepatronen en toepassingen

AI Chatbots & assistenten

Voeg spraakuitvoer toe aan je chatbot- of AI-assistent. Pijp LLM-responsen via TTS voor spraakgestuurde interfaces. Kokoro levert sub-seconde latentie voor real-time gesprekken. Sesam CSM genereert conversational speech met natuurlijke timing.

LLM-antwoord op spraakpijplijn
Subseconde latency met Kokoro
Gesprekstoespraak met Sesam CSM
Audio-uitvoer streamen

Mobiele & spraakapps

Bouw mobiele apps met spraakfunctie, toegankelijkheidstools, leesapps en taallearningplatforms. Onze REST API werkt met elk mobiel kader. Download audiobestanden of stream rechtstreeks naar de client.

React Native, Flutter, Swift, Kotlin
Toegankelijkheids- en leesapps
Platforms voor het leren van talen
Audio-inhoud genereren

SaaS-producten

Wit-label spraakmogelijkheden in uw SaaS-product. Voeg TTS, STT, voice klonen en audioverwerking toe als functies in uw platform. Gebruik onze API als uw voice backend zonder GPU-infrastructuur te beheren.

Wit-label spraakfuncties
Geen GPU-infrastructuur nodig
Pay-per-use prijzen
20+ modellen om uw gebruikers aan te bieden

Automatiseringspijpleidingen

Integreer spraakgeneratie in CI/CD-pijpleidingen, contentautomatisering en batchverwerking workflows. Genereer duizenden audiobestanden uit spreadsheetgegevens, automatiseer podcastproductie, of bouw contentlokalisatie pijpleidingen.

Batchverwerking via API
Inhoud lokalisatie pijpleidingen
CI/CD integratie
Spreadsheet naar audioautomatisering

Volledige API-documentatie tonen

API Specificaties

Gebouwd voor productietoepassingen

20+

TTS-modellen

100+

Stemmen

30+

Talen

<1s

Latency (Kokoro)

Gratis inschrijven 15.000 tekens

Veelgestelde vragen

Veelgestelde vragen over de TTS.ai developer API

Ja. Onze API volgt het OpenAI audio spraakformaat. Als u de OpenAI Python- of JavaScript-clientbibliotheek gebruikt, kunt u overschakelen naar TTS.ai door de base_url- en api_key-parameters te wijzigen. Uw bestaande code werkt zonder wijzigingen.

Kokoro genereert audio in minder dan 1 seconde voor typische zinnen. CosyVoice 2 ondersteunt streaming output voor nog lagere waargenomen latentie. Voor chatbots en stemassistenten, totale ronde-trip tijd is typisch 1-3 seconden, afhankelijk van de tekst lengte en modelkeuze.

Gratis modellen (Kokoro, Piper, VITS, MeloTTS) zijn volledig gratis. Standaard modellen gebruiken 2x tekens per 1K tekst. Premium modellen gebruiken 4x tekens per 1K tekst. Schrijf je gratis in met 15.000 tekens. Plannen beginnen bij $9/maand voor 500.000 tekens.

Ja. Upload een referentie audiomonster (5-30 seconden) naar het stemklonen eindpunt, gebruik dan de gekloonde voice ID in volgende TTS-verzoeken. Modellen die klonen ondersteunen zijn onder andere CosyVoice 2, Chatterbox, Fish Speech en GPT-SoVITS.

Gratis niveau heeft basistarief te beperken (3 aanvragen per uur zonder account). Betaalde plannen hebben royale tarieflimieten geschikt voor productie toepassingen. Neem contact met ons op voor enterprise-level doorvoer eisen.

WAV (niet gecomprimeerd, hoogste kwaliteit), MP3 (gecomprimeerde, kleinere bestanden), OGG (open formaat) en FLAC (verliesloze compressie). Geef het formaat op in uw verzoek. Standaard is WAV op basis van de oorspronkelijke sample rate van het model.

Ja. Combineer onze TTS API met een speech-to-text model en een LLM om een complete voice assistant pipeline te bouwen. Kokoro biedt sub-second latency ideaal voor real-time conversatie. CosyVoice 2 ondersteunt streaming output voor nog lagere waargenomen responstijden.

CosyVoice 2 en Kokoro ondersteuning streaming audio output waar audio brokken worden geleverd als ze worden gegenereerd. Dit vermindert time-to-first-byte voor real-time toepassingen zoals stem assistenten en interactieve ervaringen.

De API geeft standaard HTTP-statuscodes terug. Implementeer exponentiële back-off voor 5xx fouten en snelheidslimietresponsen. Voor missiekritische toepassingen, voeg een wachtrij met retry logica toe. Onze API heeft een hoge uptime maar veerkrachtige foutafhandeling wordt altijd aanbevolen.

Ja. De /v1/voices en /v1/models endpoints geven JSON lijsten terug van alle beschikbare stemmen en modellen met hun metadata (taalondersteuning, kwaliteitsbeoordelingen, snelheidsgraden en pricing tier). Gebruik deze om dynamische modelselectoren op te bouwen in uw toepassing.

Gratis modellen (Kokoro, Piper, VITS, MeloTTS) dienen als een effectieve zandbak omdat ze volledig vrij zijn. Test uw integratie met vrije modellen en schakel vervolgens over op premium modellen in de productie door het veranderen van de modelparameter. Er is geen aparte testomgeving nodig.

De meeste van onze modellen zijn open-source en kunnen worden zelf-hosted. Echter, self-hosting vereist aanzienlijke GPU middelen (we gebruiken 4x NVIDIA Tesla P40 met 96GB VRAM totaal). De API biedt een kosteneffectieve alternatief zonder infrastructuurbeheer.

5.0/5 (1)

Klaar om te bouwen met Voice Al?

Krijg je gratis API sleutel en begin met bouwen. 15.000 tekens bij aanmelding, gratis modellen beschikbaar, uitgebreide documentatie.

Gratis aanmelden Prijzen bekijken

Tekst naar Speech API voor ontwikkelaars

Probeer het nu.

Hou van TTS.ai? Vertel het je vrienden!

API-functies voor ontwikkelaars

Eenvoudige REST API

OpenAI-compatibel

24+ Modellen beschikbaar

Sub-Tweede Tijdigheid

Voice Cloning API

Meerdere formaten

Beste modellen voor integratie van ontwikkelaars

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

Hoe de TTS API te integreren

Haal je API-sleutel

Maak uw eerste oproep

Kies uw model

Schip naar productie

Voorbeelden van snelstartcode

Wat Ontwikkelaars Bouwen met TTS.ai

AI Chatbots & assistenten

Mobiele & spraakapps

SaaS-producten

Automatiseringspijpleidingen

API Specificaties

Veelgestelde vragen

Is de API compatibel met het OpenAI TTS-formaat?

Wat is de latentie voor real-time toepassingen?

Hoe werkt prijzen voor API gebruik?

Kan ik stemklonen gebruiken via de API?

Is er een tarieflimiet?

Welke audioformaten retourneert de API?

Kan ik de API gebruiken om een stemassistent of chatbot te bouwen?

Is er een WebSocket of streaming API?

Hoe ga ik om met fouten en retrieves in de productie?

Kan ik beschikbare stemmen en modellen programmatisch opsommen?

Is er een zandbak of testomgeving?

Kan ik zelf-host de modellen in plaats van het gebruik van de API?

Klaar om te bouwen met Voice Al?