Geliştiriciler için metinden konuşmaya API

REST API'mizle sesli uygulamalar oluşturun. Uygulamalarınıza, chatbotlarınıza, sesli asistanlarınıza ve SaaS ürünlerinize doğal metin-söz, ses klonlama, konuşma-söz ve ses işleme ekleyebilirsiniz. OpenAI uyumlu format, 20+ model, basit entegrasyon.

REST API Chatbotlar Ses Uygulamaları SaaS Ürünleri Otomatik

Şimdi Dene

Kokoro, Piper, VITS, MeloTTS ile ücretsiz
Oluşturduğunuz ses burada görünecek
Oluşturuldu
İndir
TTS.ai'yi seviyor musunuz?

Geliştiriciler için API Özellikleri

Sesli uygulamalar oluşturmak için ihtiyacınız olan her şeyName

Basit REST API

Konuşmayı üretmek için bir POST isteği. JSON isteği, ses cevabı. HTTP'yi destekleyen herhangi bir programlama dili ile çalışır.

OpenAI uyumlu

OpenAI TTS API için drop-in yedekleme. base_url ve API anahtarınızı değiştirin — mevcut kod hemen çalışır.

Mevcut Modeller

Tek bir API üzerinden her modele erişilebilir. Bir parametreyi değiştirerek modelleri değiştirin. Kalite, hız ve maliyeti karşılaştırın.

İkinci Alt Gecikme

Kokoro sesleri 1 saniyeden kısa sürede üretir. Gerçek zamanlı sohbet botları, sesli asistanlar ve etkileşimli uygulamalar için mükemmeldir.

Ses Klonlama API

API aracılığıyla kısa bir ses örneğinden herhangi bir ses klonla. Tüm sonraki jenerasyonlar için klonlanmış sesleri kullan.

Çoklu Biçimleri

WAV, MP3, OGG veya FLAC olarak çıkışı. Örnekleme hızı ve bit derinliğini seçin. Gerçek zamanlı uygulamalar için ses akışı desteği.

Geliştirici Entegrasyonu için En İyi Modeller

Uygulamanızın hızı, kalitesi ve maliyet gereksinimlerine uygun doğru modeli seçin

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

En iyi: En hızlı model — saniyenin altında gecikme, gerçek zamanlı uygulamalar ve chatbotlar için ideal

Dene. Kokoro

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 Ses Klonlama

En iyi: Ses asistan uygulamaları için ses klonlama ile TTS akışı

Dene. CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

En iyi: Chatbot ve asistan sesi için doğal zamanlamayla konuşma AI

Dene. Sesame CSM

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

En iyi: Ücretsiz, yüksek hacimli uygulamalar için sadece CPU modeli, sıfır kredi maliyeti

Dene. Piper

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

En iyi: Yaratıcı ve eğlence uygulamaları için ses efektleriyle ses üretimi

Dene. Bark

TTS API'sini Nasıl Entegre Edilir

Kayıttan ilk API çağrısına 5 dakikanın altında

1

API Anahtarını Al

Ücretsiz olarak kayıt olun ve hesabınızdaki kontrol panelinden bir API anahtarı oluşturun. 15.000 karakter dahil.

2

İlk arama yap

/v1/tts'ye POST yaparak metin, model ve ses ile ses baytlarını geri al. 5 satır kod altında.

3

Modelinizi Seçiniz

Kullanım durumunuz için farklı modelleri test edin. Hız, kalite ve jenerasyon başına maliyeti karşılaştırın.

4

Üretime Gönder

Pay-as-you-go karakterleriyle ölçeklenebilir. Ödemeli planlarda oran limiti yoktur. Kullanımınızı kontrol panelinizde izleyebilirsiniz.

Kısa Başlangıç Kod Örnekleri

REST API'mizle TTS.ai'i herhangi bir dilde entegre edin

Python Popüler
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)
JavaScript (Node.js) Node.js
const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();
cURL Evrensel
curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3
OpenAI-Uyumlu Biçim - Gelin.
# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

TTS.ai ile geliştiricilerin neler yaptığı

Ortak entegrasyon paternleri ve uygulamaları

AI Chatbots & Assistants

Sesli konuşma botunuza veya AI asistanınıza ses çıkışı ekleyin. Sesli arayüzler için TTS üzerinden LLM cevaplarını yönetin. Kokoro gerçek zamanlı konuşmalar için saniyenin altında gecikme sağlar. Sesame CSM doğal zamanlamayla konuşmayı üretir.

  • LLM konuşma boru hattına yanıt verdi
  • Kokoro ile saniyenin altında gecikme
  • Sesame CSM ile konuk konuşma
  • Ses çıkışını akışa geçir

Cep ve Ses Uygulamaları

Sesli mobil uygulamalar, erişim araçları, okuma uygulamaları ve dil öğrenme platformları oluşturun. REST API'miz herhangi bir mobil çerçeve ile çalışır. Ses dosyalarını indirin veya doğrudan istemciye aktarın.

  • React Native, Flutter, Swift, Kotlin
  • Erişim ve okuma uygulamaları
  • Dil öğrenme platformları
  • Ses içeriği üretimi

SaaS Ürünleri

SaaS ürününüzde beyaz etiketli ses yetenekleri. Platformunuza TTS, STT, ses klonlama ve ses işleme özellikleri ekleyin. API'mizi GPU altyapısını yönetmeden ses arka planı olarak kullanın.

  • Beyaz etiketli ses özellikleri
  • GPU altyapısına ihtiyaç yok
  • Kullanım başına ödemeli fiyatlandırma
  • Kullanıcılarınıza sunacağınız 20+ model

Otomatikleştirme boru hatları

Ses üretimini CI/CD boru hatları, içerik otomasyonu ve grup işleme iş akışlarıyla entegre edin. E-tablo verilerinden binlerce ses dosyası oluşturun, podcast üretimini otomatikleştirin veya içerik yerelleştirme boru hatları oluşturun.

  • API üzerinden grup işlemi
  • İçerik yerelleştirme boru hatları
  • CI/CD entegrasyonu
  • E-Tablodan Ses Otomatikleştirmesine

API Özellikleri

Üretim uygulamaları için inşa edilmiştir

20+

TTS Modelleri

100+

Sesler

30+

Dilleri

<1s

Gecikme (Kokoro)

Sıkça Sorulan Sorular

TTS.ai geliştirici API ile ilgili yaygın sorular

Evet. API'miz OpenAI ses konuşma biçimini izler. Eğer OpenAI Python veya JavaScript istemci kütüphanesini kullanıyorsanız, base_url ve api_key parametrelerini değiştirerek TTS.ai'e geçiş yapabilirsiniz. Mevcut kodunuz değiştirilmeden çalışacaktır.

Kokoro tipik cümleler için 1 saniyenin altında ses üretir. CosyVoice 2 daha düşük algılanan gecikme için akış çıkışını destekler. Chatbotlar ve sesli asistanlar için, toplam döngü süresi metin uzunluğu ve model seçimine bağlı olarak tipik olarak 1-3 saniyedir.

Ücretsiz modelleri (Kokoro, Piper, VITS, MeloTTS) tamamen ücretsizdir. Standart modeller 1K metin başına 2x karakter kullanır. Ücretli modeller 1K metin başına 4x karakter kullanır. 15.000 karakterle ücretsiz kayıt olun. Planlar 500.000 karakter için ayda 9$'dan başlar.

Evet. Referans ses örneğini (5-30 saniye) ses klonlama son noktasına yükleyin, sonra sonraki TTS taleplerinde klonlanmış ses kimliğini kullanın. Klonlamayı destekleyen modellerin arasında CosyVoice 2, Chatterbox, Fish Speech ve GPT-SoVITS bulunmaktadır.

Ücretsiz seviye temel hız sınırlamasına sahiptir (hesap olmadan saatte 3 talep). Ücretli planlar üretim uygulamaları için uygun cömert hız sınırlarına sahiptir. Kurumsal seviye hız gereksinimleri için bizimle iletişime geçin.

WAV (sıkıştırılmamış, en yüksek kalite), MP3 (sıkıştırılmış, daha küçük dosyalar), OGG (açık biçim), ve FLAC (kayıpsız sıkıştırma). İstekinizde biçimi belirtin. Önbellek, modelin yerli örnekleme oranına göre WAV'dır.

Evet. TTS API'mizi bir konuşma-metinde model ve bir LLM ile birleştirerek tam bir ses asistanı boru hattını inşa edin. Kokoro gerçek zamanlı konuşma için ideal bir saniyenin altında gecikme sağlar. CosyVoice 2 daha düşük algılanan yanıt zamanları için akış çıkışını destekler.

CosyVoice 2 ve Kokoro, ses parçalarının üretildikleri gibi teslim edildiği akışlı ses çıkışını destekler. Bu, ses asistanları ve etkileşimli deneyimler gibi gerçek zamanlı uygulamalar için ilk bayta kadar olan zamanı azaltmaktadır.

API standart HTTP durum kodlarını geri verir. 5xx hataları ve hız sınırı cevapları için üstel geri çekilmeyi uygulayın. Görev-kritik uygulamalar için, tekrar deneme mantığıyla bir kuyruk ekleyin. API'miz yüksek çalışma süresine sahiptir ama esnek hata yönetimi her zaman tavsiye edilir.

Evet. /v1/voices ve /v1/models son noktaları, mevcut tüm ses ve modellerin JSON listelerini meta verileriyle birlikte (dil desteği, kalite puanları, hız puanları ve fiyatlandırma seviyesi) geri verir. Bu listeleri uygulamanızda dinamik model seçicileri oluşturmak için kullanın.

Ücretsiz modelleri (Kokoro, Piper, VITS, MeloTTS) etkili bir kum kutusu olarak hizmet ederler çünkü sıfır krediye mal olurlar. Ücretsiz modellerle entegrasyonunuzu test edin, sonra model parametresini değiştirerek üretimde premium modellere geçin. Farklı bir test ortamına ihtiyaç yoktur.

Modellerimizin çoğu açık kaynaklı ve kendine hizmet verebilir. Ancak, kendine hizmet vermek önemli GPU kaynakları gerektirir (toplam 96GB VRAM ile 4x NVIDIA Tesla P40 kullanıyoruz). API altyapı yönetimi olmadan maliyet etkin bir alternatif sağlar.
5.0/5 (1)

Neyi geliştirebiliriz?

Sesli Yapay Zekâ ile Yapmaya Hazır mısın?

Ücretsiz API anahtarınızı alın ve inşa etmeye başlayın. 15 kredi kayıt, ücretsiz modelleri mevcut, kapsamlı belgelendirme.