Hata / Özellik İstek Raporu

Geliştiriciler için metinden konuşmaya API

REST API'mizle sesli uygulamalar oluşturun. Uygulamalarınıza, chatbotlarınıza, sesli asistanlarınıza ve SaaS ürünlerinize doğal metin-söz, ses klonlama, konuşma-söz ve ses işleme ekleyebilirsiniz. OpenAI uyumlu format, 20+ model, basit entegrasyon.

REST API Chatbotlar Ses Uygulamaları SaaS Ürünleri Otomatik

Tam TTS Düzenleyicisi API belgeleri

Şimdi Dene

0/500

Kokoro, Piper, VITS, MeloTTS ile ücretsiz

Oluşturduğunuz ses burada görünecek

Tamamlayıcı TTS düzenleyicisini aç

Geliştiriciler için API Özellikleri

Sesli uygulamalar oluşturmak için ihtiyacınız olan her şeyName

Basit REST API

Konuşmayı üretmek için bir POST isteği. JSON isteği, ses cevabı. HTTP'yi destekleyen herhangi bir programlama dili ile çalışır.

OpenAI uyumlu

OpenAI TTS API için drop-in yedekleme. base_url ve API anahtarınızı değiştirin — mevcut kod hemen çalışır.

Mevcut Modeller

Tek bir API üzerinden her modele erişilebilir. Bir parametreyi değiştirerek modelleri değiştirin. Kalite, hız ve maliyeti karşılaştırın.

İkinci Alt Gecikme

Kokoro sesleri 1 saniyeden kısa sürede üretir. Gerçek zamanlı sohbet botları, sesli asistanlar ve etkileşimli uygulamalar için mükemmeldir.

Ses Klonlama API

API aracılığıyla kısa bir ses örneğinden herhangi bir ses klonla. Tüm sonraki jenerasyonlar için klonlanmış sesleri kullan.

Çoklu Biçimleri

WAV, MP3, OGG veya FLAC olarak çıkışı. Örnekleme hızı ve bit derinliğini seçin. Gerçek zamanlı uygulamalar için ses akışı desteği.

Geliştirici Entegrasyonu için En İyi Modeller

Uygulamanızın hızı, kalitesi ve maliyet gereksinimlerine uygun doğru modeli seçin

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Hızlı 5/5

En iyi: En hızlı model — saniyenin altında gecikme, gerçek zamanlı uygulamalar ve chatbotlar için ideal

Dene. Kokoro

CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Orta 5/5 Ses Klonlama

En iyi: Ses asistan uygulamaları için ses klonlama ile TTS akışı

Dene. CosyVoice 2

Sesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Yavaş 5/5

En iyi: Chatbot ve asistan sesi için doğal zamanlamayla konuşma AI

Dene. Sesame CSM

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Hızlı 3/5

En iyi: Ücretsiz, yüksek hacimli uygulamalar için sadece CPU modeli, sıfır kredi maliyeti

Dene. Piper

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Yavaş 4/5

En iyi: Yaratıcı ve eğlence uygulamaları için ses efektleriyle ses üretimi

Dene. Bark

TTS API'sini Nasıl Entegre Edilir

Kayıttan ilk API çağrısına 5 dakikanın altında

API Anahtarını Al

Ücretsiz olarak kayıt olun ve hesabınızdaki kontrol panelinden bir API anahtarı oluşturun. 15.000 karakter dahil.

İlk arama yap

/v1/tts'ye POST yaparak metin, model ve ses ile ses baytlarını geri al. 5 satır kod altında.

Modelinizi Seçiniz

Kullanım durumunuz için farklı modelleri test edin. Hız, kalite ve jenerasyon başına maliyeti karşılaştırın.

Üretime Gönder

Pay-as-you-go karakterleriyle ölçeklenebilir. Ödemeli planlarda oran limiti yoktur. Kullanımınızı kontrol panelinizde izleyebilirsiniz.

Kısa Başlangıç Kod Örnekleri

REST API'mizle TTS.ai'i herhangi bir dilde entegre edin

Python Popüler

import requests

response = requests.post(
    "https://api.tts.ai/v1/tts",
    json={
        "text": "Hello from my app!",
        "model": "kokoro",
        "voice": "af_heart",
        "format": "mp3"
    },
    headers={
        "Authorization": "Bearer sk-tts-xxx"
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

JavaScript (Node.js) Node.js

const response = await fetch(
    "https://api.tts.ai/v1/tts",
    {
        method: "POST",
        headers: {
            "Content-Type": "application/json",
            "Authorization": "Bearer sk-tts-xxx"
        },
        body: JSON.stringify({
            text: "Hello from my app!",
            model: "kokoro",
            voice: "af_heart",
            format: "mp3"
        })
    }
);

const audio = await response.blob();

cURL Evrensel

curl -X POST https://api.tts.ai/v1/tts \
  -H "Authorization: Bearer sk-tts-xxx" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "Hello from my app!",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "mp3"
  }' \
  --output output.mp3

OpenAI-Uyumlu Biçim - Gelin.

# Works with OpenAI client library
from openai import OpenAI

client = OpenAI(
    api_key="sk-tts-xxx",
    base_url="https://api.tts.ai/v1"
)

response = client.audio.speech.create(
    model="kokoro",
    voice="af_heart",
    input="Hello from my app!"
)

response.stream_to_file("output.mp3")

Ücretsiz API anahtarınızı alın

TTS.ai ile geliştiricilerin neler yaptığı

Ortak entegrasyon paternleri ve uygulamaları

AI Chatbots & Assistants

Sesli konuşma botunuza veya AI asistanınıza ses çıkışı ekleyin. Sesli arayüzler için TTS üzerinden LLM cevaplarını yönetin. Kokoro gerçek zamanlı konuşmalar için saniyenin altında gecikme sağlar. Sesame CSM doğal zamanlamayla konuşmayı üretir.

LLM konuşma boru hattına yanıt verdi
Kokoro ile saniyenin altında gecikme
Sesame CSM ile konuk konuşma
Ses çıkışını akışa geçir

Cep ve Ses Uygulamaları

Sesli mobil uygulamalar, erişim araçları, okuma uygulamaları ve dil öğrenme platformları oluşturun. REST API'miz herhangi bir mobil çerçeve ile çalışır. Ses dosyalarını indirin veya doğrudan istemciye aktarın.

React Native, Flutter, Swift, Kotlin
Erişim ve okuma uygulamaları
Dil öğrenme platformları
Ses içeriği üretimi

SaaS Ürünleri

SaaS ürününüzde beyaz etiketli ses yetenekleri. Platformunuza TTS, STT, ses klonlama ve ses işleme özellikleri ekleyin. API'mizi GPU altyapısını yönetmeden ses arka planı olarak kullanın.

Beyaz etiketli ses özellikleri
GPU altyapısına ihtiyaç yok
Kullanım başına ödemeli fiyatlandırma
Kullanıcılarınıza sunacağınız 20+ model

Otomatikleştirme boru hatları

Ses üretimini CI/CD boru hatları, içerik otomasyonu ve grup işleme iş akışlarıyla entegre edin. E-tablo verilerinden binlerce ses dosyası oluşturun, podcast üretimini otomatikleştirin veya içerik yerelleştirme boru hatları oluşturun.

API üzerinden grup işlemi
İçerik yerelleştirme boru hatları
CI/CD entegrasyonu
E-Tablodan Ses Otomatikleştirmesine

Tam API Belgesini Gör

API Özellikleri

Üretim uygulamaları için inşa edilmiştir

20+

TTS Modelleri

100+

Sesler

30+

Dilleri

<1s

Gecikme (Kokoro)

Ücretsiz Kayıt Ol — 15,000 Karakter

Sıkça Sorulan Sorular

TTS.ai geliştirici API ile ilgili yaygın sorular

Evet. API'miz OpenAI ses konuşma biçimini izler. Eğer OpenAI Python veya JavaScript istemci kütüphanesini kullanıyorsanız, base_url ve api_key parametrelerini değiştirerek TTS.ai'e geçiş yapabilirsiniz. Mevcut kodunuz değiştirilmeden çalışacaktır.

Kokoro tipik cümleler için 1 saniyenin altında ses üretir. CosyVoice 2 daha düşük algılanan gecikme için akış çıkışını destekler. Chatbotlar ve sesli asistanlar için, toplam döngü süresi metin uzunluğu ve model seçimine bağlı olarak tipik olarak 1-3 saniyedir.

Ücretsiz modelleri (Kokoro, Piper, VITS, MeloTTS) tamamen ücretsizdir. Standart modeller 1K metin başına 2x karakter kullanır. Ücretli modeller 1K metin başına 4x karakter kullanır. 15.000 karakterle ücretsiz kayıt olun. Planlar 500.000 karakter için ayda 9$'dan başlar.

Evet. Referans ses örneğini (5-30 saniye) ses klonlama son noktasına yükleyin, sonra sonraki TTS taleplerinde klonlanmış ses kimliğini kullanın. Klonlamayı destekleyen modellerin arasında CosyVoice 2, Chatterbox, Fish Speech ve GPT-SoVITS bulunmaktadır.

Ücretsiz seviye temel hız sınırlamasına sahiptir (hesap olmadan saatte 3 talep). Ücretli planlar üretim uygulamaları için uygun cömert hız sınırlarına sahiptir. Kurumsal seviye hız gereksinimleri için bizimle iletişime geçin.

WAV (sıkıştırılmamış, en yüksek kalite), MP3 (sıkıştırılmış, daha küçük dosyalar), OGG (açık biçim), ve FLAC (kayıpsız sıkıştırma). İstekinizde biçimi belirtin. Önbellek, modelin yerli örnekleme oranına göre WAV'dır.

Evet. TTS API'mizi bir konuşma-metinde model ve bir LLM ile birleştirerek tam bir ses asistanı boru hattını inşa edin. Kokoro gerçek zamanlı konuşma için ideal bir saniyenin altında gecikme sağlar. CosyVoice 2 daha düşük algılanan yanıt zamanları için akış çıkışını destekler.

CosyVoice 2 ve Kokoro, ses parçalarının üretildikleri gibi teslim edildiği akışlı ses çıkışını destekler. Bu, ses asistanları ve etkileşimli deneyimler gibi gerçek zamanlı uygulamalar için ilk bayta kadar olan zamanı azaltmaktadır.

API standart HTTP durum kodlarını geri verir. 5xx hataları ve hız sınırı cevapları için üstel geri çekilmeyi uygulayın. Görev-kritik uygulamalar için, tekrar deneme mantığıyla bir kuyruk ekleyin. API'miz yüksek çalışma süresine sahiptir ama esnek hata yönetimi her zaman tavsiye edilir.

Evet. /v1/voices ve /v1/models son noktaları, mevcut tüm ses ve modellerin JSON listelerini meta verileriyle birlikte (dil desteği, kalite puanları, hız puanları ve fiyatlandırma seviyesi) geri verir. Bu listeleri uygulamanızda dinamik model seçicileri oluşturmak için kullanın.

Ücretsiz modelleri (Kokoro, Piper, VITS, MeloTTS) etkili bir kum kutusu olarak hizmet ederler çünkü sıfır krediye mal olurlar. Ücretsiz modellerle entegrasyonunuzu test edin, sonra model parametresini değiştirerek üretimde premium modellere geçin. Farklı bir test ortamına ihtiyaç yoktur.

Modellerimizin çoğu açık kaynaklı ve kendine hizmet verebilir. Ancak, kendine hizmet vermek önemli GPU kaynakları gerektirir (toplam 96GB VRAM ile 4x NVIDIA Tesla P40 kullanıyoruz). API altyapı yönetimi olmadan maliyet etkin bir alternatif sağlar.

5.0/5 (1)

Sesli Yapay Zekâ ile Yapmaya Hazır mısın?

Ücretsiz API anahtarınızı alın ve inşa etmeye başlayın. 15 kredi kayıt, ücretsiz modelleri mevcut, kapsamlı belgelendirme.

Ücretsiz Kayıt Ol Fiyatları Gör

Geliştiriciler için metinden konuşmaya API

Şimdi Dene

TTS.ai'yi seviyor musunuz?

Geliştiriciler için API Özellikleri

Basit REST API

OpenAI uyumlu

Mevcut Modeller

İkinci Alt Gecikme

Ses Klonlama API

Çoklu Biçimleri

Geliştirici Entegrasyonu için En İyi Modeller

Kokoro

CosyVoice 2

Sesame CSM

Piper

Bark

TTS API'sini Nasıl Entegre Edilir

API Anahtarını Al

İlk arama yap

Modelinizi Seçiniz

Üretime Gönder

Kısa Başlangıç Kod Örnekleri

TTS.ai ile geliştiricilerin neler yaptığı

AI Chatbots & Assistants

Cep ve Ses Uygulamaları

SaaS Ürünleri

Otomatikleştirme boru hatları

API Özellikleri

Sıkça Sorulan Sorular

API OpenAI TTS formatıyla uyumlu mu?

Gerçek zamanlı uygulamalar için gecikme nedir?

API kullanımı için fiyatlandırma nasıl çalışır?

API üzerinden ses klonlama kullanabilir miyim?

Hız sınırı var mı?

API hangi ses formatlarını geri döndürür?

API'yi bir ses asistanı veya chatbot inşa etmek için kullanabilir miyim?

WebSocket veya streaming API var mı?

Üretimde hataları ve tekrar denemeleri nasıl yönetirim?

Programla kullanılabilir sesleri ve modelleri listeleyebilir miyim?

Bir kum kutusu veya test ortamı var mı?

API'yi kullanmak yerine modelleri kendim hoste edebilir miyim?

Sesli Yapay Zekâ ile Yapmaya Hazır mısın?