Yaradıcılar üçün Text-to-Speech API

Bizim REST API ilə səsli tətbiqetmələr qurun. Təbii mətn-söhbətə, səs klonlaşdırması, söz-söhbətə və səs prosesini tətbiqlərinizə, chatbotlara, səs köməkçilərinə və SaaS məhsullarına əlavə edin. OpenAI-ə uyğun format, 20+ model, sadə inteqrasiya.

REST API Söhbət Səs tətbiqetmələri SaaS məhsulları Avtomatik

İndi Yoxla

Kokoro, Piper, VITS, MeloTTS ilə pulsuz
Yaratdığınız səs buraya görünəcək
_Yarat
Endir
TTS.ai-ni sevirsiniz? Dostlarınıza deyin!

İnkişaf etdiricilər üçün API xüsusiyyətləri

Səsli tətbiqetmələr yaratmaq üçün lazım olan hər şey

Sadə REST API

Söhbət yaratmaq üçün bir POST istəyi. JSON istəyi, audio cavabı. HTTP-ni dəstəkləyən hər hansı bir proqram dili ilə işləyir.

OpenAI-Uyumlu

OpenAI TTS API üçün drop-in əvəzi. Base_url və API açarınızı dəyişdirin - mövcud kod dərhal işləyir.

Mövcud Modellər

Hər bir modelə tək bir API vasitəsilə daxil olun. Bir parametr dəyişdirməklə modelləri dəyişdirin. Keyfiyyət, sürət və qiyməti müqayisə edin.

Sub-Second Latency

Kokoro səsi 1 saniyədən az müddətdə yaradır. Real vaxt söhbət botları, səs köməkçiləri və interaktiv proqramlar üçün mükəmməldir.

Səs Klonlama API

API vasitəsilə qısa səs nümunəsindən hər hansı bir səsi klonla. Bütün sonrakı nəsillər üçün klon səsləri istifadə et.

Çoxlu formatlar

Çıxışı WAV, MP3, OGG və ya FLAC olaraq göstər. Nümunə sürətini və bit dərinliyini seçin. Rəsmi proqramlar üçün səs axını dəstəyi.

İnkişafçı Birləşməsi üçün Ən Yaxşı Modellər

Proqramın sürəti, keyfiyyəti və qiymət tələblərinə uyğun model seçin

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Ən Yaxşı: Ən sürətli model — sub-second latency, real-time tətbiqlər və chatbotlar üçün ideal

_Yoxla Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Səs Klonlama

Ən Yaxşı: Səs köməkçisi proqramları üçün səs klonlama ilə TTS axını

_Yoxla CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

Ən Yaxşı: chatbot və köməkçi səsi üçün təbii vaxtla danışan AI

_Yoxla Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Ən Yaxşı: Sıfır kredit xərclə yüksək həcmli tətbiqlər üçün pulsuz, yalnız CPU modeli

_Yoxla Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Ən Yaxşı: Yaradıcı və əyləncə tətbiqetmələri üçün səs effektləri ilə səs yarada

_Yoxla Bark

TTS API-ni necə birləşdirmək

Qeydiyyatdan ilk API çağırışına qədər 5 dəqiqədən az

1

API Açarınızı Al

Pulsuz qeyd olun və hesabınızdakı idarə panelindən API açarı yaradın. 15,000 simvol daxildir.

2

İlk Zəngi Et

/v1/tts-ə mətn, model və səslə POST göndər. Audio baytlarını geri al. 5 sətir kod altında.

3

Modelinizi seçin

İstifadə halınız üçün müxtəlif modelləri sınayın. Sür'ət, keyfiyyət və istehsal xərclərini müqayisə edin.

4

İstehsal

Pay-as-you-go xarakterləri ilə ölçün. Ödənişli planlarda limit yoxdur. Daş panelinizdə istifadəni izləyə bilərsiniz.

Tez Başlanğıc Kod nümunələri

REST API ilə istənilən dildə TTS.ai-i birləşdirin

Python Ən çox oxunan
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Ümumi
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-ya uyğun format Bağla
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Yaradıcılar TTS.ai ilə nə inşa edirlər

Əsas inteqrasiya nümunələri və tətbiqlər

AI Chatbots & Assistants

Sesli çıxışı chatbot və ya AI köməkçinizə əlavə edin. LLM cavablarını səsli interfeyslər üçün TTS vasitəsilə göndərin. Kokoro real vaxt söhbətləri üçün saniyənin altındakı gecikmə təmin edir. Sesame CSM təbii vaxtla söhbət səsini yaradır.

  • LLM səs borusuna cavab verir
  • Kokoro ilə sub-second gecikmə
  • Sesame CSM ilə söhbət
  • Audio çıxışı axını

Mobil və səs tətbiqetmələri

Sesi dəstəkləyən mobil tətbiqlər, əlçatanlıq alətləri, oxu tətbiqləri və dil öyrənmə platformaları inşa edin. Bizim REST API hər hansı mobil framework ilə işləyir. Audio faylları yükləyin və ya doğrudan-doğruya klientə axın edin.

  • React Native, Flutter, Swift, Kotlin
  • Yetişiləbilənlik və oxu tətbiqetmələri
  • Dil öyrənmə platformaları
  • Audio məzmun yaradılması

SaaS məhsulları

SaaS məhsulunuzda ağ etiketli səs qabiliyyətləri. TTS, STT, səs klonlaşdırması və səs işləmələrini platformanızda xüsusiyyətlər kimi əlavə edin. GPU infrastrukturunu idarə etmədən səs backend olaraq API-mizi istifadə edin.

  • White-label səs xüsusiyyətləri
  • GPU infrastrukturu lazım deyil
  • Pay-per-use qiymətləndirməsi
  • İstifadəçilərinizə təklif etmək üçün 20+ model

Avtomatlaşdırma boruları

CI/CD boru kəmərlərinə səs istehsalını, məzmun avtomatlaşdırmasını və paket iş axınlarını birləşdirin. Əks-səda fayllarını e-kitab məlumatlarından, podcast istehsalını avtomatlaşdırın və ya məzmun lokallaşdırma boru kəmərlərini qurun.

  • API vasitəsilə paket işləmə
  • Məzmun lokallaşdırma boruları
  • CI/CD inteqrasiyası
  • Audio avtomatlaşdırma e-kitab

API Təsvirləri

Proqramların istehsalı üçün yaradılmışdır

20+

TTS Modelləri

100+

Səslər

30+

Dillər

<1s

Kokoro

Tez-tez Sorulan Sual

TTS.ai developer API haqqında yayılmış suallar

Bəli. Bizim API OpenAI audio speech formatını izləyir. Əgər OpenAI Python ya da JavaScript müştəri kitabxanasını istifadə edirsinizsə, base_url və api_key parametrlərini dəyişərək TTS.ai-ə keçə bilərsiniz. Sizin mövcud kodunuz dəyişdirilmədən işləyir.

Kokoro səsi 1 saniyədən az müddətdə yaradır. CosyVoice 2 daha az vaxt tələb edən səs axını çıxışını dəstəkləyir. Chatbotlar və səs köməkçiləri üçün ümumi dönüş vaxtı mətn uzunluğuna və model seçiminə bağlı olaraq 1-3 saniyədir.

Pulsuz modellər (Kokoro, Piper, VITS, MeloTTS) tamamilə pulsuzdur. Standart modellər 1K mətn üçün 2x xarakter istifadə edir. Premium modellər 1K mətn üçün 4x xarakter istifadə edir. 15,000 xarakterlə pulsuz qeydiyyatdan keçin. Planlar 500,000 xarakter üçün ayda $9-dan başlayır.

Bəli. Referans səs nümunəsini (5-30 saniyə) səs klonlama son nöqtəsinə yüklə, sonra da sonrakı TTS istəklərində klon səs ID-sini istifadə et. Klonlamanı dəstəkləyən modellər arasında CosyVoice 2, Chatterbox, Fish Speech və GPT-SoVITS var.

Pulsuz səviyyədə əsas sürət məhdudiyyəti var (hesab olmadan saatda 3 tələb). Ödənişli planlarda istehsal proqramları üçün uyğun geniş sürət məhdudiyyətləri var. Korporativ səviyyəli sürət tələbləri üçün bizimlə əlaqə saxlayın.

WAV (sıxılmamış, ən yüksək keyfiyyətli), MP3 (sıxılmış, daha kiçik fayllar), OGG (açıq format) və FLAC (ziyansız sıxılma). İstəyişinizlə formatı göstərin. Ön qurğulu olaraq modelin yerli nümunə sürəti ilə WAV-dır.

Bəli. Bizim TTS API-mizi söz-mətn modeli və LLM ilə birləşdirərək tam səs köməkçisi boru kəməri qur. Kokoro real vaxt söhbəti üçün ideal olan sub-sekunda gecikmə təmin edir. CosyVoice 2 daha aşağı qəbul edilmiş cavab vaxtları üçün axın çıxışını dəstəkləyir.

CosyVoice 2 və Kokoro səs parçalarının yaradıldığı kimi çatdırıldığı səs axını çıxarışını dəstəkləyir. Bu səs köməkçiləri və interaktiv təcrübələr kimi real vaxt tətbiqləri üçün ilk bayta qədər olan vaxtı azaldır.

API standart HTTP vəziyyət kodlarını geri qaytarır. 5xx səhvləri və sürət limiti cavabları üçün eksponensial backoff tətbiq et. Misyon-kritik tətbiqlər üçün, yenidən cəhd məntiqi ilə növbə əlavə et. Bizim API yüksək iş vaxtına malikdir amma davamlı səhv idarəsi hər zaman tövsiyə olunur.

Bəli. /v1/voices və /v1/models son nöqtələri bütün mövcud səslərin və modellərin JSON siyahılarını onların metadataları ilə (dil dəstəyi, keyfiyyət qiymətləndirmələri, sürət qiymətləndirmələri və qiymətləndirmə səviyyəsi) geri qaytarır. Bunları tətbiqinizdə dinamik model seçiciləri yaratmaq üçün istifadə edin.

Pulsuz modellər (Kokoro, Piper, VITS, MeloTTS) heç bir kredit tələb etmədiyi üçün səmərəli sandbox kimi xidmət edir. Pulsuz modellərlə inteqrasiyanı sınayın, sonra model parametrini dəyişərək istehsalda premium modellərə keçin. Ayrı test mühiti lazım deyil.

Modellərimizin çoxu açıq mənbəlidir və öz-özünə host edilə bilər. Lakin öz-özünə host etmə GPU resurslarını tələb edir (biz 4x NVIDIA Tesla P40 və ümumi 96GB VRAM istifadə edirik). API infrastruktur idarəetmə olmadan səmərəli alternativ təmin edir.
5.0/5 (1)

Nəyi yaxşılaşdıra bilərik? Sizin rəyiniz problemləri düzəltməyə kömək edir.

Səsli AI ilə qurmağa hazırsınız?

Pulsuz API açarınızı əldə edin və qurmağa başlayın. Qeydiyyatda 15,000 karakter, pulsuz modellər, geniş sənədlər.