Özgür Yapay Zeka Metinden KonuşmayaName
31+ açık kaynak modelleri, 231+ Sesler, 34+ Hesap gerekmez.
Sesli Yapay Zeka için İhtiyaç Duyduğunuz Her Şey
Açık kaynaklı yapay zeka modelleri tarafından desteklenen 30+ araç
31+ Yapay Zeka Ses Modelleri
Tek bir platformda açık kaynaklı TTS modellerinin en kapsamlı koleksiyonu
Kokoro Free
Kokoro, ağırlık sınıfının çok üstünde bir performans gösteren 82 milyon parametreli bir metin-sözlü modeldir. Küçük boyutuna rağmen, dikkate değer derecede doğal ve ifade edici bir konuşma üretir. Kokoro, İngilizce, Japonca, Çince ve Korece gibi çoklu dilleri çeşitli ifade edici seslerle destekler. İnanılmaz derecede hızlı çalışır — GPU üzerinde gerçek zamanlı ses üretmekten neredeyse 100 kat daha hızlı.
En iyi: En az gecikme ile yüksek kaliteli TTS, akış uygulamaları
Bedava Dene
Piper Free
Piper, Rhasspy tarafından geliştirilen ve VITS ve larynx mimarilerini kullanan hafif bir metin-söz motorudur. Tümüyle CPU üzerinde çalışır, bu da onu kenar cihazları, ev otomasyonu ve çevrimdışı TTS gerektiren uygulamalar için ideal hale getirir. 30'dan fazla dilde 100'den fazla sesle, Piper Raspberry Pi 4'te bile gerçek zamanlı hızlarda doğal sesli konuşma sağlar.
En iyi: Hızlı önizlemeler, erişilebilirlik ve gömülü uygulamalar
Bedava Dene
VITS Free
VITS (sondan sona Metin-Konuşmaya karşılık gelen öğrenme ile Varyasyonel İnceleme), mevcut iki aşamalı modellerden daha doğal ses çıkaran bir paralel sondan sona TTS yöntemidir. Normalleştirme akışlarıyla ve karşılıklı eğitim süreciyle artırılmış varyasyonel çıkarımı kabul ederek, doğallıkta önemli bir iyileşme sağlar.
En iyi: Doğal prozodi ile genel amaçlı metin-sözleşmeName
Bedava Dene
MeloTTS Free
MyShell.ai tarafından geliştirilen MeloTTS, İngilizce (Amerikan, İngiliz, Hint, Avustralya), İspanyolca, Fransızca, Çince, Japonca ve Korece'yi destekleyen çok dilli bir TTS kütüphanesidir. Aşırı hızlıdır, tek başına CPU'da neredeyse gerçek zamanlı bir hızla metin işleme yapabilir. MeloTTS üretim kullanımı için tasarlanmış ve hem CPU hem de GPU çıkarımlarını destekler.
En iyi: Hızlı, çok dilli TTS gerektiren üretim uygulamaları
Bedava Dene
OuteTTS Free
OuteTTS, orijinal mimariyi korurken büyük dil modellerini metin-söz-ediş yetenekleriyle genişletir. llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM ve hatta Transformers.js aracılığıyla tarayıcı çıkarımı da dahil olmak üzere çoklu arka planları destekler. JSON olarak kaydedilmiş hoparlör profilleri aracılığıyla sıfır-atış ses klonlama özellikleri.
En iyi: Edge dağıtımı, tarayıcı tabanlı TTS, düşük kaynaklı ortamlar
Bedava Dene
Pocket TTS Free
Kyutai tarafından (Moshi'nin yaratıcıları) geliştirilen Pocket TTS, ağırlığının çok üzerinde bir performans gösteren kompakt 100M parametreli bir metin-söz dönüştürücü modelidir. CPU üzerinde verimli bir şekilde çalışır, tek bir ses örneğinden sıfır-atış ses klonlamasını destekler ve doğal sesli konuşma üretir. Küçük model boyutu onu kenar dağıtımı ve düşük kaynaklı ortamlar için ideal hale getirir.
En iyi: Hafif dağıtım, sadece CPU ortamları, hızlı ses klonlama
Bedava Dene
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
En iyi: Fast lightweight TTS, edge deployment, low-latency applications
Bedava Dene
Bark Standard
Gerçekçi konuşma, müzik ve ses efektleri üreten transformatör tabanlı metin-sesine model.
Geliştirici: Suno · Lisans: MIT
Dene.
Bark Small Standard
Bark'ın daha hızlı çıkarımlar ve daha düşük bellek kullanımı ile hafif bir sürümü.
Geliştirici: Suno · Lisans: MIT
Dene.
CosyVoice 2 Standard
Alibaba'nın ölçeklenebilir akış TTS insan-parite doğallık ve sıfıra yakın gecikme ile.
Geliştirici: Alibaba (Tongyi Lab) · Lisans: Apache 2.0
Dene.
Dia TTS Standard
Konuşanlar arasında doğal konuşmalar yaratan çoklu-konuşan diyalog üretim modeli.
Geliştirici: Nari Labs · Lisans: Apache 2.0
Dene.
Parler TTS Standard
İstediğiniz sesi doğal dil ile tanımlayın ve Parler eşleşen konuşmayı oluşturur.
Geliştirici: Hugging Face · Lisans: Apache 2.0
Dene.
GLM-TTS Standard
Açık kaynaklı TTS modelleri arasında en düşük karakter hata oranını elde eder.
Geliştirici: Zhipu AI · Lisans: GLM-4 License
Dene.
IndexTTS-2 Standard
Sıfır-atış TTS ince taneli duygu kontrolü ve yüksek ifade kabiliyeti ile.
Geliştirici: Index Team · Lisans: Bilibili Model License
Dene.
Spark TTS Standard
Ses klonlama TTS kontrol edilebilir duygu ve konuşma tarzıyla uyarılar aracılığıyla.
Geliştirici: SparkAudio · Lisans: CC BY-NC-SA 4.0
Dene.
GPT-SoVITS Standard
Sadece 5 saniye sesten herhangi bir ses kopyalayan birkaç atış ses klonlama TTS.
Geliştirici: RVC-Boss · Lisans: MIT
Dene.
Orpheus Standard
İnsan düzeyindeki duygusal TTS modeli 100K saatlik konuşma verileri üzerine eğitildi.
Geliştirici: Canopy Labs · Lisans: Llama 3.2 Community
Dene.
Qwen3 TTS Standard
Alibaba'nın çok dilli TTS ses klonlama, önceden ayarlanmış sesler ve metinden ses tasarımı ile.
Geliştirici: Alibaba (Qwen) · Lisans: Apache 2.0
Dene.
Chatterbox Turbo Standard
Sub-200ms gecikme ve gülüşmeler, öksürükler ve daha fazlası için paralinguistic etiketlerle daha hızlı Chatterbox.
Geliştirici: Resemble AI · Lisans: MIT
Dene.
Dia 2 Standard
Çok konuşan diyalog ve paralinguistik işaretlerle akış-ilk konverasyonel TTS.
Geliştirici: Nari Labs · Lisans: Apache 2.0
Dene.
VoxCPM Standard
Tokenizer-free TTS, bağlam bilinçli paragraf tutarlılığı ile 44.1kHz ses üretir.
Geliştirici: OpenBMB · Lisans: Apache 2.0
Dene.
TADA Standard
Sıfır halüsinasyonlu TTS, metin-akustik çift doğrulama, karşılaştırmalı LLM TTS'den 5x daha hızlı.
Geliştirici: Hume AI · Lisans: MIT
Dene.
VibeVoice Standard
Microsoft modeli, podcastler ve sesli kitaplar gibi uzun biçimli çoklu konuşmacı içeriği için.
Geliştirici: Microsoft · Lisans: MIT
Dene.
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Geliştirici: Alibaba (FunAudioLLM) · Lisans: Apache 2.0
Dene.
CosyVoice 2
Alibaba'nın ölçeklenebilir akış TTS insan-parite doğallık ve sıfıra yakın gecikme ile.
Dilleri: en, zh, ja, ko, fr, de, it, es
Ses Klonlama
GLM-TTS
Açık kaynaklı TTS modelleri arasında en düşük karakter hata oranını elde eder.
Dilleri: en, zh
Ses Klonlama
IndexTTS-2
Sıfır-atış TTS ince taneli duygu kontrolü ve yüksek ifade kabiliyeti ile.
Dilleri: en, zh
Ses Klonlama
Spark TTS
Ses klonlama TTS kontrol edilebilir duygu ve konuşma tarzıyla uyarılar aracılığıyla.
Dilleri: en, zh
Ses Klonlama
GPT-SoVITS
Sadece 5 saniye sesten herhangi bir ses kopyalayan birkaç atış ses klonlama TTS.
Dilleri: en, zh, ja, ko
Ses Klonlama
Chatterbox
En son teknoloji, sıfır atış ses klonlama, duygu kontrolü, Resemble AI'den.
Dilleri: en
Ses Klonlama
Tortoise TTS
Çok sesli metin-sözde kaliteye odaklanan autoregressive mimari.
Dilleri: en
Ses Klonlama
OpenVoice
Anında ses klonlama, stil, duygu ve aksan üzerinde ince kontrol.
Dilleri: en, zh, ja, ko, fr, de, es, it
Ses Klonlama
Qwen3 TTS
Alibaba'nın çok dilli TTS ses klonlama, önceden ayarlanmış sesler ve metinden ses tasarımı ile.
Dilleri: en, zh, ja, ko, de, fr, ru, pt, es, it
Ses Klonlama
Chatterbox Turbo
Sub-200ms gecikme ve gülüşmeler, öksürükler ve daha fazlası için paralinguistic etiketlerle daha hızlı Chatterbox.
Dilleri: en
Ses Klonlama
VoxCPM
Tokenizer-free TTS, bağlam bilinçli paragraf tutarlılığı ile 44.1kHz ses üretir.
Dilleri: en, zh
Ses Klonlama
OuteTTS
LLM tabanlı TTS, CPU, GPU veya tarayıcı üzerinden llama.cpp ve Transformers.js üzerinden çalışır.
Dilleri: en
Ses Klonlama
Pocket TTS
Kyutai tarafından tek bir örnekten ses klonlama ile hafif 100M parametre modeli.
Dilleri: en, fr
Ses Klonlama
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Dilleri: en, zh, ja, ko, de, es, fr, it, ru
Ses Klonlama
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Dilleri: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Ses Klonlama
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Dilleri: en, zh
Ses KlonlamaGeliştirici Öncesi API
OpenAI uyumlu REST API. Tek son nokta, 22+ model. Gerçek zamanlı uygulamalar için akış desteği.
- OpenAI uyumlu biçim
- Gerçek zamanlı uygulamalar için TTS akışı
- Büyük işler için grup işlemi
- Webhook bildirimleri
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Basit, Şeffaf Fiyatlar
Bedava başla, büyüdükçe ölçeklen.
Özgür
15 kredi
- Kokoro, Piper, VITS, MeloTTS
- 500 karakter sınırı
- 3 gen/saat (hesap yok)
Pro
2,000 kredi/ay
- Başlatıcıdaki her şey
- API erişimi
- Öncelik işlemi
Sıkça Sorulan Sorular
Neyi geliştirebiliriz?
Yapay Zeka Sesini Bugün Kullanmaya Başla
TTS.ai kullanan yaratıcılara, geliştiricilere ve işletmelere katılın