Tekst do wypowiedzi API dla deweloperów
Zbuduj aplikacje uprawnione do głosu z naszym REST API. Dodaj naturalny format tekst-to-speech, klonowanie głosu, mów-to-text, i przetwarzanie dźwięku do aplikacji, chatbotów, asystentów głosowych i produktów SaaS. OpenAI-kompatybilny format, 20+ modeli, prosta integracja.
Spróbuj teraz
Funkcje API dla programistów
Wszystko, czego potrzebujesz do budowy aplikacji uprawnionych do głosu
Prosty REST API
Jeden wniosek POST do generowania mowy. JSON żądanie, odpowiedź audio. Pracuje z językiem programowania, który obsługuje HTTP.
OpenAI-Kompatybilny
Drop-in wymiana dla OpenAi TTS API. Przełącz base_url i klucz API — istniejący kod działa natychmiast.
24+ Dostępne modele
Dostęp do każdego modelu poprzez jeden API. Przełącz modele poprzez zmianę jednego parametru. Porównaj jakość, prędkość i koszt.
Poddruga latencja
Kokoro generuje audio w mniej niż 1 sekundę. Idealnie dla czatbotów w czasie rzeczywistym, asystentów głosowych i aplikacji interaktywnych.
API klonowania głosu
Klonuj dowolny głos z krótkiej próbki audio za pośrednictwem API. Użyj klonowanych głosów przez wszystkie następne pokolenia.
Wiele formatów
Wyjście jako WAV, MP3, OGG lub FLAC. Wybierz szybkość próbki i głębokość bitu. Uciekanie obsługi audio dla aplikacji w czasie rzeczywistym.
Najlepsze modele integracji programistów
Wybierz odpowiedni model dla wymagań dotyczących prędkości, jakości i kosztów aplikacji
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Najlepsze dla: Najszybszy model – podsekundowy latencji, idealny dla aplikacji w czasie rzeczywistym i czatbotów
Spróbuj. Kokoro
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Najlepsze dla: Streaming TTS z klonowaniem głosu dla aplikacji asystenta głosu
Spróbuj. CosyVoice 2
Sesame CSM
Premium
Conversational speech model generating natural dialogue with appropriate timing and emotion.
Najlepsze dla: Konwersacyjne AI z naturalnym wyczuciem czasu dla chatbot i głosu asystenta
Spróbuj. Sesame CSM
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Najlepsze dla: Bezpłatny, tylko model CPU dla aplikacji o wysokiej ilości o zerowych kosztach kredytowych
Spróbuj. Piper
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Najlepsze dla: Wytwarzanie dźwięku o efektach dźwiękowych dla aplikacji kreatywnych i rozrywkowych
Spróbuj. BarkJak zintegrować API TTS
Od rejestracji do pierwszego rozmowy API w mniej niż 5 minut
Pobierz klucz API
Zarejestruj się za darmo i wygeneruj klucz API z panelu centralnego konta. W tym 15 000 znaków.
Pierwsze wezwanie
POST do /v1/tts z tekstem, modelem i głosem. Odzyskaj bajty audio. Pod 5 wierszami kodu.
Wybierz swój model
Sprawdź różne modele dla Twojego użytkowania. Porównaj prędkość, jakość i koszt na pokolenie.
Statki do produkcji
Skaluj z znakami pay-as-you-go. Brak ograniczeń stawek w planach płatnych. Monitoruj użycie w panelu deski.
Przykłady kodu szybkiego uruchomienia
Iнтегрuj TTS.ai w dowolnym języku z naszym REST API
import requests
response = requests.post(
"https://api.tts.ai/v1/tts",
json={
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
},
headers={
"Authorization": "Bearer sk-tts-xxx"
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
const response = await fetch(
"https://api.tts.ai/v1/tts",
{
method: "POST",
headers: {
"Content-Type": "application/json",
"Authorization": "Bearer sk-tts-xxx"
},
body: JSON.stringify({
text: "Hello from my app!",
model: "kokoro",
voice: "af_heart",
format: "mp3"
})
}
);
const audio = await response.blob();
curl -X POST https://api.tts.ai/v1/tts \
-H "Authorization: Bearer sk-tts-xxx" \
-H "Content-Type: application/json" \
-d '{
"text": "Hello from my app!",
"model": "kokoro",
"voice": "af_heart",
"format": "mp3"
}' \
--output output.mp3
# Works with OpenAI client library
from openai import OpenAI
client = OpenAI(
api_key="sk-tts-xxx",
base_url="https://api.tts.ai/v1"
)
response = client.audio.speech.create(
model="kokoro",
voice="af_heart",
input="Hello from my app!"
)
response.stream_to_file("output.mp3")
Co Developers Budować z TTS.ai
Wspólne wzory integracji i zastosowania
AI Chatbots & Assistants
Dodaj wyjście głosowe do czatbotu lub asystenta AI. Pipe LLM odpowiedzi przez TTS dla interfejsów podłączonych głosem. Kokoro dostarcza podsekundową latencję do rozmów w czasie rzeczywistym. Sesame CSM generuje mowy konwersacyjne z naturalnym czasem.
- Odpowiedź LLM na rurociąg mowy
- Podsekundowa latencja z Kokoro
- Przemówienie konwersacyjne z Sezamem CSM
- Streamowanie wyjścia audio
Aplikacje mobilne i głosowe
Budowa aplikacji mobilnych, narzędzi dostępności, aplikacji czytania i platformy nauczania języka. Nasz REST API pracuje z dowolnymi ramami mobilnymi. Pobierz pliki audio lub strumień bezpośrednio do klienta.
- Reakcja native, Flutter, Swift, Kotlin
- Dostępność i aplikacje do odczytu
- Platformy uczenia się języka
- Wytwarzanie zawartości dźwięku
Produkty SaaS
Możliwości głosu białego w produkcie SaaS. Dodaj TTS, STT, klonowanie głosu i przetwarzanie dźwięku jako funkcje w platformie. Użyj naszego API jako podręcznika głosowego bez zarządzania infrastrukturą GPU.
- Funkcje głosu białego
- Nie jest potrzebna infrastruktura GPU
- Ceny płatnicze na użytkowanie
- 20+ modeli, aby zaoferować użytkownikom
Rurociągi automatyzacji
Integruj generację głosu do rurociągów CI/CD, automatyzacji treści i przetwarzania partii. Generuj tysiące plików audio z danych arkuszowych, automatyzuj produkcję podcastów lub buduj rurociągi lokalizacji treści.
- Przetwarzanie serii za pośrednictwem API
- Rurociągi lokalizacyjne zawierające zawartość
- Integracja CI/CD
- Systemy elektroniczne do automatyzacji dźwięku
Specyfikacje API
Zbudowany do zastosowań produkcyjnych
20+
Modele TTS
100+
Głosy
30+
Języki
<1s
Latency (Kokoro)
Często zadawane pytania
Wspólne pytania dotyczące TTS.ai deweloperów API
Co moglibyśmy ulepszyć? Twoje zwroty zwrotne pomagają nam rozwiązać problemy.
Gotowy do budowy z Voice AI?
Dostać darmowy klucz API i rozpocząć budowę. 15 kredytów na rejestrację, bezpłatne modele dostępne, kompleksowa dokumentacja.