Özgür yapay zeka Metinden KonuşmayaName

20+ açık kaynak modelleri, 107+ Sesler, 32+ Hiçbir hesap gerekmez.

1K+
yaratıcılar
2K+
nesilleri
20+
Yapay zeka modelleri
107+
Sesler
0/500 karakter Özgür
TTS.ai gibi?

Sesli Yapay Zeka için İhtiyaç Duyduğunuz Her Şey

Açık kaynaklı yapay zeka modelleri tarafından desteklenen 30+ araç

20+ Yapay Zeka Ses Modelleri

Tek bir platformda açık kaynaklı TTS modellerinin en kapsamlı koleksiyonu

KokoroKokoro Free

Kokoro, ağırlık sınıfının çok üstünde bir performans gösteren 82 milyon parametreli bir metin-sözlü modeldir. Küçük boyutuna rağmen, dikkate değer derecede doğal ve ifade edici bir konuşma üretir. Kokoro, İngilizce, Japonca, Çince ve Korece gibi çoklu dilleri çeşitli ifade edici seslerle destekler. İnanılmaz derecede hızlı çalışır — GPU üzerinde gerçek zamanlı ses üretmekten neredeyse 100 kat daha hızlı.

En iyi: En az gecikme ile yüksek kaliteli TTS, akış uygulamaları

Bedava Dene

PiperPiper Free

Piper, Rhasspy tarafından geliştirilen ve VITS ve larynx mimarilerini kullanan hafif bir metin-söz motorudur. Tümüyle CPU üzerinde çalışır, bu da onu kenar cihazları, ev otomasyonu ve çevrimdışı TTS gerektiren uygulamalar için ideal hale getirir. 30'dan fazla dilde 100'den fazla sesle, Piper Raspberry Pi 4'te bile gerçek zamanlı hızlarda doğal sesli konuşma sağlar.

En iyi: Hızlı önizlemeler, erişilebilirlik ve gömülü uygulamalar

Bedava Dene

VITSVITS Free

VITS (sondan sona Metin-Konuşmaya karşılık gelen öğrenme ile Varyasyonel İnceleme), mevcut iki aşamalı modellerden daha doğal ses çıkaran bir paralel sondan sona TTS yöntemidir. Normalleştirme akışlarıyla ve karşılıklı eğitim süreciyle artırılmış varyasyonel çıkarımı kabul ederek, doğallıkta önemli bir iyileşme sağlar.

En iyi: Doğal prozodi ile genel amaçlı metin-sözleşmeName

Bedava Dene

MeloTTSMeloTTS Free

MyShell.ai tarafından geliştirilen MeloTTS, İngilizce (Amerikan, İngiliz, Hint, Avustralya), İspanyolca, Fransızca, Çince, Japonca ve Korece'yi destekleyen çok dilli bir TTS kütüphanesidir. Aşırı hızlıdır, tek başına CPU'da neredeyse gerçek zamanlı bir hızla metin işleme yapabilir. MeloTTS üretim kullanımı için tasarlanmış ve hem CPU hem de GPU çıkarımlarını destekler.

En iyi: Hızlı, çok dilli TTS gerektiren üretim uygulamaları

Bedava Dene

BarkBark Standard

Gerçekçi konuşma, müzik ve ses efektleri üreten transformatör tabanlı metin-sesine model.

Geliştirici: Suno · Lisans: MIT

Dene.

Bark SmallBark Small Standard

Bark'ın daha hızlı çıkarımlar ve daha düşük bellek kullanımı ile hafif bir sürümü.

Geliştirici: Suno · Lisans: MIT

Dene.

CosyVoice 2CosyVoice 2 Standard

Alibaba'nın ölçeklenebilir akış TTS insan-parite doğallık ve sıfıra yakın gecikme ile.

Geliştirici: Alibaba (Tongyi Lab) · Lisans: Apache 2.0

Dene.

Dia TTSDia TTS Standard

Hoparlörler arasında doğal sohbetler yaratan çoklu hoparlörlü diyalog üretim modeli.

Geliştirici: Nari Labs · Lisans: Apache 2.0

Dene.

Parler TTSParler TTS Standard

İstediğiniz sesi doğal dil ile tanımlayın ve Parler eşleşen konuşmayı oluşturur.

Geliştirici: Hugging Face · Lisans: Apache 2.0

Dene.

GLM-TTSGLM-TTS Standard

Açık kaynaklı TTS modelleri arasında en düşük karakter hata oranını elde eder.

Geliştirici: Zhipu AI · Lisans: GLM-4 License

Dene.

IndexTTS-2IndexTTS-2 Standard

Sıfır-atış TTS ince taneli duygu kontrolü ve yüksek ifade kabiliyeti ile.

Geliştirici: Index Team · Lisans: Bilibili Model License

Dene.

Spark TTSSpark TTS Standard

Ses klonlama TTS kontrol edilebilir duygu ve konuşma tarzıyla uyarılar aracılığıyla.

Geliştirici: SparkAudio · Lisans: CC BY-NC-SA 4.0

Dene.

GPT-SoVITSGPT-SoVITS Standard

Sadece 5 saniye sesten herhangi bir ses kopyalayan birkaç atış ses klonlama TTS.

Geliştirici: RVC-Boss · Lisans: MIT

Dene.

OrpheusOrpheus Standard

İnsan düzeyindeki duygusal TTS modeli 100K saatlik konuşma verileri üzerine eğitildi.

Geliştirici: Canopy Labs · Lisans: Llama 3.2 Community

Dene.

Qwen3 TTSQwen3 TTS Standard

Alibaba'nın çok dilli TTS ses klonlama, önceden ayarlanmış sesler ve metinden ses tasarımı ile.

Geliştirici: Alibaba (Qwen) · Lisans: Apache 2.0

Dene.

ChatterboxChatterbox Premium

En son teknoloji, sıfır atış ses klonlama, duygu kontrolü, Resemble AI'den.

Kalite:

Dene.

Tortoise TTSTortoise TTS Premium

Çok sesli metin-sözde kaliteye odaklanan autoregressive mimari.

Kalite:

Dene.

StyleTTS 2StyleTTS 2 Premium

İnsan düzeyinde metin-söz-ediş, stil yayımı ve karşılıklı eğitim yoluyla.

Kalite:

Dene.

OpenVoiceOpenVoice Premium

Anında ses klonlama, stil, duygu ve aksan üzerinde ince kontrol.

Kalite:

Dene.

Sesame CSMSesame CSM Premium

Konuşma modeli uygun zamanlama ve duygu ile doğal diyalog yaratıyor.

Kalite:

Dene.

CosyVoice 2CosyVoice 2

Alibaba'nın ölçeklenebilir akış TTS insan-parite doğallık ve sıfıra yakın gecikme ile.

Dilleri: en, zh, ja, ko, fr, de, it, es

Ses Klonlama

GLM-TTSGLM-TTS

Açık kaynaklı TTS modelleri arasında en düşük karakter hata oranını elde eder.

Dilleri: en, zh

Ses Klonlama

IndexTTS-2IndexTTS-2

Sıfır-atış TTS ince taneli duygu kontrolü ve yüksek ifade kabiliyeti ile.

Dilleri: en, zh

Ses Klonlama

Spark TTSSpark TTS

Ses klonlama TTS kontrol edilebilir duygu ve konuşma tarzıyla uyarılar aracılığıyla.

Dilleri: en, zh

Ses Klonlama

GPT-SoVITSGPT-SoVITS

Sadece 5 saniye sesten herhangi bir ses kopyalayan birkaç atış ses klonlama TTS.

Dilleri: en, zh, ja, ko

Ses Klonlama

ChatterboxChatterbox

En son teknoloji, sıfır atış ses klonlama, duygu kontrolü, Resemble AI'den.

Dilleri: en

Ses Klonlama

Tortoise TTSTortoise TTS

Çok sesli metin-sözde kaliteye odaklanan autoregressive mimari.

Dilleri: en

Ses Klonlama

OpenVoiceOpenVoice

Anında ses klonlama, stil, duygu ve aksan üzerinde ince kontrol.

Dilleri: en, zh, ja, ko, fr, de, es, it

Ses Klonlama

Qwen3 TTSQwen3 TTS

Alibaba'nın çok dilli TTS ses klonlama, önceden ayarlanmış sesler ve metinden ses tasarımı ile.

Dilleri: en, zh, ja, ko, de, fr, ru, pt, es, it

Ses Klonlama

Geliştirici Öncesi API

OpenAI uyumlu REST API. Tek son nokta, 22+ model. Gerçek zamanlı uygulamalar için akış desteği.

  • OpenAI uyumlu biçim
  • Gerçek zamanlı uygulamalar için TTS akışı
  • Büyük işler için grup işlemi
  • Webhook bildirimleri
API Belgelerini Göster
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Basit, Şeffaf Fiyatlar

Bedava başla, büyüdükçe ölçeklen.

Özgür

$0

15 kredi

  • Kokoro, Piper, VITS, MeloTTS
  • 500 karakter sınırı
  • 3 gen/saat (hesap yok)
Ücretsiz Kayıt Ol

Başlatıcı

$9/ms

500 kredi/ay

  • Tüm 22+ modelleri
  • 100,000 chars per generation
  • Ses Klonlama
Başla
En Popüler

Pro

$29/ms

2,000 kredi/ay

  • Başlatıcıdaki her şey
  • API erişimi
  • Öncelik işlemi
Profesyonel Ol

İş

$99/ms

10,000 kredi/ay

  • Pro'daki her şey
  • Bulk API
  • Öncelik kuyruğu
İş bul

Karakter paketleri dahil tüm planları görüntüle →

Sıkça Sorulan Sorular

TTS.ai, 22+ metin-söz modeller, ses klonlama, konuşma-söz ve ses araçları sunan en kapsamlı yapay zeka ses platformudur.Tüm modeller satıcı kilitleme olmadan açık kaynaktır.

Evet! TTS.ai Kokoro, Piper, VITS ve MeloTTS modelleriyle ücretsiz metin-söz dönüşümü sunuyor. Hesap gerekmiyor. 15.000 ücretsiz karakter almak ve tüm modellere erişmek için kayıt olun. Ücretli planlar ayda 9 $'dan başlıyor.

Hız için Kokoro veya Piper kullanın. Kalite için CosyVoice 2 veya StyleTTS 2 deneyin. Ses klonlaması için Chatterbox veya GPT-SoVITS kullanın. Diyalog için Dia TTS kullanın. Aynı metin üzerinde karşılaştırmak için birden fazla model deneyin.

Evet. TTS, STT, ses klonlama ve ses araçları için OpenAI-uyumlu REST API. Pro ($29/mo) ve Enterprise ($99/mo) planlarında mevcut. tts.ai/api/ adresinde belgeleri görüntüleyin.

Ses kalitesi modelden modele değişir. CosyVoice 2, StyleTTS 2 ve Chatterbox gibi premium modelleri doğal intonasyon ve duygularla neredeyse insan kaliteli konuşma üretir. Kokoro gibi ücretsiz modelleri çoğu kullanım durumunda mükemmel kalite sunar.

TTS.ai model kütüphanesi boyunca 30+ dili destekler. İngilizce en geniş model desteğine sahiptir, ancak CosyVoice 2 gibi modelleri Çince, Japonca ve Korece kapsar; GPT-SoVITS Çince, Japonca, Korece ve İngilizce ile ilgilenir; ve MeloTTS İngilizce, İspanyolca, Fransızca, Çince, Japonca ve Korece destekler.

Evet. Tüm işlemler özel GPU sunucularımızda yapılır. Mesaj girdilerinizi veya gönderildikten sonra oluşturulan sesleri depolamıyoruz. Klonlama için yüklenen ses örnekleri sadece mevcut oturum için kullanılır ve saklanmaz. Verilerinizi hiçbir zaman üçüncü taraflarla paylaşmayız veya modelleri eğitmek için kullanmayız.

Evet. TTS.ai'de üretilen tüm ses, YouTube videoları, podcast'ler, sesli kitaplar, uygulamalar, reklamlar ve ürünler dahil olmak üzere ticari kullanım için sizindir. Modellerimiz izin veren lisanslar altında açık kaynaktır (MIT, Apache 2.0). Ücret veya kaynak gösterme gerekmez.

TTS.ai, maksimum kalite için varsayılan olarak WAV biçiminde ses üretir. Ücretsiz Ses Dönüştürücümüzü kullanarak MP3, FLAC, OGG veya M4A'ya dönüştürebilirsiniz. API, isteğe bağlı çıkış biçiminizi doğrudan talepte belirtmenizi destekler.

Klonlamak istediğiniz sesin kısa bir ses örneğini (5 saniye kadar kısa) yükleyin, sonra bu ses için konuşma üretmek için herhangi bir metin yazın. Chatterbox, GPT-SoVITS ve CosyVoice 2 gibi modeller ses klonlamasını destekler. Klonlanan ses tonu, aksan ve konuşma tarzını yakalayacaktır.

Ücretsiz modelleri (Kokoro, Piper, VITS, MeloTTS) hesap gerektirmez ve sıfır karaktere mal olur. Standart modelleri (2.000 karakter/1K giriş) Bark, CosyVoice 2, F5-TTS ve Dia içerir. Premium modelleri (4.000 karakter/1K giriş) OpenVoice, Chatterbox, StyleTTS 2 ve Tortoise içerir. Ödenmiş modeller genellikle daha yüksek kalite, daha fazla ses ve ses klonlama gibi ek özellikler sunar.

Evet. API, büyük miktarda metni konuşmaya dönüştürmek için grup işlemini destekler. Çok sayıda isteği gönderin ve iş UUID'lerini kullanarak sonuçları eşzamanlı olarak alın. Kurumsal planlar ($99/ay) daha hızlı grup işlemi için öncelikli kuyruk erişimini içerir. Sesli kitap üretimi, ders içeriği ve büyük ölçekli seslendirme projeleri için idealdir.
4.0/5 (8)

Yapay Zeka Sesini Bugün Kullanmaya Başla

TTS.ai kullanan yaratıcılara, geliştiricilere ve işletmelere katılın