Özgür Yapay Zeka Metinden KonuşmayaName

33+ açık kaynak modelleri, 273+ Sesler, 33+ Hesap gerekmez.

17K+
yaratıcılar
70K+
nesilleri
33+
Yapay zeka modelleri
273+
Sesler
0/500 karakter · Nesil başına 5000'e kayıt olun. → Özgür
TTS.ai'yi seviyor musunuz?

Sesli Yapay Zeka için İhtiyaç Duyduğunuz Her Şey

Açık kaynaklı yapay zeka modelleri tarafından desteklenen 30+ araç

33+ Yapay Zeka Ses Modelleri

Tek bir platformda açık kaynaklı TTS modellerinin en kapsamlı koleksiyonu

KokoroKokoro Özgür

Kokoro, ağırlık sınıfının çok üstünde bir performans gösteren 82 milyon parametreli bir metin-sözlü modeldir. Küçük boyutuna rağmen, dikkate değer derecede doğal ve ifade edici bir konuşma üretir. Kokoro, İngilizce, Japonca, Çince ve Korece gibi çoklu dilleri çeşitli ifade edici seslerle destekler. İnanılmaz derecede hızlı çalışır — GPU üzerinde gerçek zamanlı ses üretmekten neredeyse 100 kat daha hızlı.

En iyi: En az gecikme ile yüksek kaliteli TTS, akış uygulamaları

Bedava Dene

PiperPiper Özgür

Piper, Rhasspy tarafından geliştirilen ve VITS ve larynx mimarilerini kullanan hafif bir metin-söz motorudur. Tümüyle CPU üzerinde çalışır, bu da onu kenar cihazları, ev otomasyonu ve çevrimdışı TTS gerektiren uygulamalar için ideal hale getirir. 30'dan fazla dilde 100'den fazla sesle, Piper Raspberry Pi 4'te bile gerçek zamanlı hızlarda doğal sesli konuşma sağlar.

En iyi: Hızlı önizlemeler, erişilebilirlik ve gömülü uygulamalar

Bedava Dene

VITSVITS Özgür

VITS (sondan sona Metin-Konuşmaya karşılık gelen öğrenme ile Varyasyonel İnceleme), mevcut iki aşamalı modellerden daha doğal ses çıkaran bir paralel sondan sona TTS yöntemidir. Normalleştirme akışlarıyla ve karşılıklı eğitim süreciyle artırılmış varyasyonel çıkarımı kabul ederek, doğallıkta önemli bir iyileşme sağlar.

En iyi: Doğal prozodi ile genel amaçlı metin-sözleşmeName

Bedava Dene

MeloTTSMeloTTS Özgür

MyShell.ai tarafından geliştirilen MeloTTS, İngilizce (Amerikan, İngiliz, Hint, Avustralya), İspanyolca, Fransızca, Çince, Japonca ve Korece'yi destekleyen çok dilli bir TTS kütüphanesidir. Aşırı hızlıdır, tek başına CPU'da neredeyse gerçek zamanlı bir hızla metin işleme yapabilir. MeloTTS üretim kullanımı için tasarlanmış ve hem CPU hem de GPU çıkarımlarını destekler.

En iyi: Hızlı, çok dilli TTS gerektiren üretim uygulamaları

Bedava Dene

Kani TTS 2Kani TTS 2 Özgür

NineNineSix tarafından geliştirilen Kani-TTS-2, NVIDIA NanoCodec ile Liquid AI LFM2 arka planında inşa edilmiş ultra hafif 400M parametreli bir modeldir. Sadece 3GB VRAM ile çalışır ve A100 (RTF 0.2) üzerinde ~2 saniye içinde ~10 saniye konuşma üretir. Mevcut kamusal sürüm sadece İngilizce `kani-tts-2-en` kontrol noktası gönderir ve ses klonlaması için gereken hoparlör entegre kancasını ortaya çıkarmaz — klonlamak için Chatterbox / IndexTTS2 / F5-TTS, İngilizce olmayanlar için Kokoro / MeloTTS kullanın.

En iyi: Düşük VRAM donanımlı hızlı İngilizce üretimi, hızlı önizlemeler

Bedava Dene

OuteTTSOuteTTS Özgür

OuteTTS, orijinal mimariyi korurken büyük dil modellerini metin-söz-ediş yetenekleriyle genişletir. llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM ve hatta Transformers.js aracılığıyla tarayıcı çıkarımı da dahil olmak üzere çoklu arka planları destekler. JSON olarak kaydedilmiş hoparlör profilleri aracılığıyla sıfır-atış ses klonlama özellikleri.

En iyi: Edge dağıtımı, tarayıcı tabanlı TTS, düşük kaynaklı ortamlar

Bedava Dene

Pocket TTSPocket TTS Özgür

Kyutai tarafından (Moshi'nin yaratıcıları) geliştirilen Pocket TTS, ağırlığının çok üzerinde bir performans gösteren kompakt 100M parametreli bir metin-söz dönüştürücü modelidir. CPU üzerinde verimli bir şekilde çalışır, tek bir ses örneğinden sıfır-atış ses klonlamasını destekler ve doğal sesli konuşma üretir. Küçük model boyutu onu kenar dağıtımı ve düşük kaynaklı ortamlar için ideal hale getirir.

En iyi: Hafif dağıtım, sadece CPU ortamları, hızlı ses klonlama

Bedava Dene

Kitten TTSKitten TTS Özgür

Kitten TTS by KittenML, ONNX üzerinde inşa edilmiş ultra hafif bir metin-sözlü modeldir. 15M ile 80M parametre arasında değişkenlikle (25-80 MB diskte), GPU gerektirmeden CPU üzerinde yüksek kaliteli ses sentezi sağlar. 8 iç ses, ayarlanabilir konuşma hızı ve sayılar, para birimleri ve birimler için iç metin ön işleme özellikleri vardır. Kenar dağıtımı ve düşük gecikmeli uygulamalar için idealdir.

En iyi: Hızlı hafif TTS, uç uygulamaları, düşük gecikmeli uygulamalar

Bedava Dene

Ming-Omni TTSMing-Omni TTS Özgür

InclusionAI tarafından geliştirilen Ming-omni-tts-0.5B, BailingMM yoğun bir arka plan üzerine yapılmış, Patch-by-Patch akış eşleyici ses dekoderiyle donatılmış kompakt bir omni-modal konuşma modelidir. 44.1kHz çıkış sağlar (CD kalitesine yakın), 3+ saniyelik referanstan sıfır-atış ses klonlamasını destekler ve JSON talimatları aracılığıyla içsel duygu / lehçe / BGM kontrolünü içerir. Mükemmel istikrar — Çin referanslarında %0.83 WER.

En iyi: Yüksek kaliteli iki dilde anlatım, duygu kontrollü seslendirme, Çince sesli kitap içeriği

Bedava Dene

MOSS-TTS NanoMOSS-TTS Nano Özgür

MOSS-TTS-Nano-100M, MOSS-TTS ailesinin OpenMOSS'un kompakt 100M-parametre varyantı, gecikme-transformatör mimarisini paylaşır. 8B modelinin zirve kalitesini ~80x daha küçük ağırlıklar ve dramatik olarak daha düşük talep başına VRAM için değiştirir, bu da onu ücretsiz katman ve yüksek verimlilik dağıtımlarına uygun hale getirir. Aynı 20 dil ulaşılabilirliği.

En iyi: Free-layer TTS, yüksek hacimli üretim, düşük gecikmeli etkileşimli kullanım

Bedava Dene

BarkBark Standart

Gerçekçi konuşma, müzik ve ses efektleri üreten transformatör tabanlı metin-sesine model.

Geliştirici: Suno · Lisans: MIT

Dene.

Bark SmallBark Small Standart

Bark'ın daha hızlı çıkarımlar ve daha düşük bellek kullanımı ile hafif bir sürümü.

Geliştirici: Suno · Lisans: MIT

Dene.

CosyVoice 2CosyVoice 2 Standart

Alibaba'nın ölçeklenebilir akış TTS insan-parite doğallık ve sıfıra yakın gecikme ile.

Geliştirici: Alibaba (Tongyi Lab) · Lisans: Apache 2.0

Dene.

Dia TTSDia TTS Standart

Konuşanlar arasında doğal konuşmalar yaratan çoklu-konuşan diyalog üretim modeli.

Geliştirici: Nari Labs · Lisans: Apache 2.0

Dene.

Parler TTSParler TTS Standart

İstediğiniz sesi doğal dil ile tanımlayın ve Parler eşleşen konuşmayı oluşturur.

Geliştirici: Hugging Face · Lisans: Apache 2.0

Dene.

IndexTTS-2IndexTTS-2 Standart

Sıfır-atış TTS ince taneli duygu kontrolü ve yüksek ifade kabiliyeti ile.

Geliştirici: Index Team · Lisans: Bilibili Model License

Dene.

Spark TTSSpark TTS Standart

Ses klonlama TTS kontrol edilebilir duygu ve konuşma tarzıyla uyarılar aracılığıyla.

Geliştirici: SparkAudio · Lisans: CC BY-NC-SA 4.0

Dene.

GPT-SoVITSGPT-SoVITS Standart

Sadece 5 saniye sesten herhangi bir ses kopyalayan birkaç atış ses klonlama TTS.

Geliştirici: RVC-Boss · Lisans: MIT

Dene.

OrpheusOrpheus Standart

İnsan düzeyindeki duygusal TTS modeli 100K saatlik konuşma verileri üzerine eğitildi.

Geliştirici: Canopy Labs · Lisans: Llama 3.2 Community

Dene.

Qwen3 TTSQwen3 TTS Standart

Alibaba'nın çok dilli TTS önceden ayarlanmış seslerle ve metinden ses tasarımı.

Geliştirici: Alibaba (Qwen) · Lisans: Apache 2.0

Dene.

VieNeu-TTS-v2VieNeu-TTS-v2 Standart

Vietnamca + İngilizce kod değiştirme TTS 7 ön ayar ses ve sıfır-atış ses klonlama. Sadece CPU, GPU gerekmiyor.

Geliştirici: Phạm Nguyễn Ngọc Bảo · Lisans: Apache 2.0

Dene.

Chatterbox TurboChatterbox Turbo Standart

Sub-200ms gecikme ve gülüşmeler, öksürükler ve daha fazlası için paralinguistic etiketlerle daha hızlı Chatterbox.

Geliştirici: Resemble AI · Lisans: MIT

Dene.

VoxCPMVoxCPM Standart

Tokenizer-free TTS, bağlam bilinçli paragraf tutarlılığı ile 44.1kHz ses üretir.

Geliştirici: OpenBMB · Lisans: Apache 2.0

Dene.

VibeVoiceVibeVoice Standart

Microsoft modeli, podcastler ve sesli kitaplar gibi uzun biçimli çoklu konuşmacı içeriği için.

Geliştirici: Microsoft · Lisans: MIT

Dene.

CosyVoice3CosyVoice3 Standart

Bi-streaming, duygu kontrolü ve sıfır-atış ses klonlama ile gelecek nesil çok dilli TTS.

Geliştirici: Alibaba (FunAudioLLM) · Lisans: Apache 2.0

Dene.

NAMAA Saudi TTSNAMAA Saudi TTS Standart

İlk açık kaynaklı Suudi Arapça TTS. Chatterbox kaliteli ses klonlama ile yerli Suudi lehçesi.

Geliştirici: NAMAA Space · Lisans: MIT

Dene.

Darwin TTSDarwin TTS Standart

Cross-modal Qwen3-TTS varyantı, FFN ağırlıklarıyla Qwen3-1.7B dil modelinden daha keskin çok dilli klonlama için karıştırılmıştır.

Geliştirici: FINAL-Bench · Lisans: Apache 2.0

Dene.

MOSS-TTSDMOSS-TTSD Standart

Çok sesli diyalog devam modeli - 5 hoparlöre ve 60 dakika tutarlı sesle podcast tarzında konuşmalar oluşturun.

Geliştirici: OpenMOSS · Lisans: Apache 2.0

Dene.

ChatterboxChatterbox Premium

En son teknoloji, sıfır atış ses klonlama, duygu kontrolü, Resemble AI'den.

Kalite:

Dene.

Tortoise TTSTortoise TTS Premium

Çok sesli metin-sözde kaliteye odaklanan autoregressive mimari.

Kalite:

Dene.

StyleTTS 2StyleTTS 2 Premium

İnsan düzeyinde metin-söz-ediş, stil yayımı ve karşılıklı eğitim yoluyla.

Kalite:

Dene.

OpenVoiceOpenVoice Premium

Anında ses klonlama, stil, duygu ve aksan üzerinde ince kontrol.

Kalite:

Dene.

Sesame CSMSesame CSM Premium

Konuşma modeli uygun zamanlama ve duygu ile doğal diyalog yaratıyor.

Kalite:

Dene.

CosyVoice 2CosyVoice 2

Alibaba'nın ölçeklenebilir akış TTS insan-parite doğallık ve sıfıra yakın gecikme ile.

Dilleri: en, zh, ja, ko, fr, de, it, es

Ses Klonlama

IndexTTS-2IndexTTS-2

Sıfır-atış TTS ince taneli duygu kontrolü ve yüksek ifade kabiliyeti ile.

Dilleri: en, zh

Ses Klonlama

Spark TTSSpark TTS

Ses klonlama TTS kontrol edilebilir duygu ve konuşma tarzıyla uyarılar aracılığıyla.

Dilleri: en, zh

Ses Klonlama

GPT-SoVITSGPT-SoVITS

Sadece 5 saniye sesten herhangi bir ses kopyalayan birkaç atış ses klonlama TTS.

Dilleri: en, zh, ja, ko

Ses Klonlama

ChatterboxChatterbox

En son teknoloji, sıfır atış ses klonlama, duygu kontrolü, Resemble AI'den.

Dilleri: en

Ses Klonlama

Tortoise TTSTortoise TTS

Çok sesli metin-sözde kaliteye odaklanan autoregressive mimari.

Dilleri: en

Ses Klonlama

OpenVoiceOpenVoice

Anında ses klonlama, stil, duygu ve aksan üzerinde ince kontrol.

Dilleri: en, zh, ja, ko, fr, es

Ses Klonlama

VieNeu-TTS-v2VieNeu-TTS-v2

Vietnamca + İngilizce kod değiştirme TTS 7 ön ayar ses ve sıfır-atış ses klonlama. Sadece CPU, GPU gerekmiyor.

Dilleri: vi, en

Ses Klonlama

Chatterbox TurboChatterbox Turbo

Sub-200ms gecikme ve gülüşmeler, öksürükler ve daha fazlası için paralinguistic etiketlerle daha hızlı Chatterbox.

Dilleri: en

Ses Klonlama

VoxCPMVoxCPM

Tokenizer-free TTS, bağlam bilinçli paragraf tutarlılığı ile 44.1kHz ses üretir.

Dilleri: en, zh

Ses Klonlama

OuteTTSOuteTTS

LLM tabanlı TTS, CPU, GPU veya tarayıcı üzerinden llama.cpp ve Transformers.js üzerinden çalışır.

Dilleri: en

Ses Klonlama

Pocket TTSPocket TTS

Kyutai tarafından tek bir örnekten ses klonlama ile hafif 100M parametre modeli.

Dilleri: en, fr

Ses Klonlama

CosyVoice3CosyVoice3

Bi-streaming, duygu kontrolü ve sıfır-atış ses klonlama ile gelecek nesil çok dilli TTS.

Dilleri: en, zh, ja, ko, de, es, fr, it, ru

Ses Klonlama

NAMAA Saudi TTSNAMAA Saudi TTS

İlk açık kaynaklı Suudi Arapça TTS. Chatterbox kaliteli ses klonlama ile yerli Suudi lehçesi.

Dilleri: ar

Ses Klonlama

Darwin TTSDarwin TTS

Cross-modal Qwen3-TTS varyantı, FFN ağırlıklarıyla Qwen3-1.7B dil modelinden daha keskin çok dilli klonlama için karıştırılmıştır.

Dilleri: en, ko, ja, zh

Ses Klonlama

MOSS-TTSDMOSS-TTSD

Çok sesli diyalog devam modeli - 5 hoparlöre ve 60 dakika tutarlı sesle podcast tarzında konuşmalar oluşturun.

Dilleri: en, zh

Ses Klonlama

Ming-Omni TTSMing-Omni TTS

InclusionAI'den kompakt 0.5B omni-modal konuşma modeli yüksek-dürüstlük 44.1kHz çıkış ve sıfır-atış ses klonlama ile.

Dilleri: en, zh

Ses Klonlama

MOSS-TTS NanoMOSS-TTS Nano

Tiny 100M MOSS-TTS varyantı — aynı mimari, 80x daha küçük, ücretsiz katman gecikmesi.

Dilleri: en, zh, de, es, fr, ja, it, ko, ru, ar, pt

Ses Klonlama

Geliştirici Öncesi API

OpenAI uyumlu REST API. Tek son nokta, 22+ model. Gerçek zamanlı uygulamalar için akış desteği.

  • OpenAI uyumlu biçim
  • Gerçek zamanlı uygulamalar için TTS akışı
  • Büyük işler için grup işlemi
  • Webhook bildirimleri
API Belgelerini Göster
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Basit, Şeffaf Fiyatlar

Bedava başla, büyüdükçe ölçeklen.

Özgür

$0

15,000 karakter + 5,000/gün

  • Kokoro da dahil olmak üzere 7 ücretsiz model
  • Nesil başına 5000 karakter
  • API erişimi dahil
Ücretsiz Kayıt Ol

Başlatıcı

$9/ms

500 kredi/ay

  • Tüm 22+ modelleri
  • Nesil başına 100.000 karakter
  • Ses Klonlama
Başla
En Popüler

Pro

$29/ms

2,000 kredi/ay

  • Başlatıcıdaki her şey
  • API erişimi
  • Öncelik işlemi
Profesyonel Ol

İş

$99/ms

10,000 kredi/ay

  • Pro'daki her şey
  • Bulk API
  • Öncelik kuyruğu
İş bul

Karakter paketleri dahil tüm planları görüntüle →

Sıkça Sorulan Sorular

TTS.ai, 22+ metin-söz modeller, ses klonlama, konuşma-söz ve ses araçları sunan en kapsamlı yapay zeka ses platformudur.Tüm modeller satıcı kilitleme olmadan açık kaynaktır.

Evet! TTS.ai Kokoro, Piper, VITS ve MeloTTS modelleriyle ücretsiz metin-söz dönüşümü sunuyor. Hesap gerekmiyor. 15.000 ücretsiz karakter almak ve tüm modellere erişmek için kayıt olun. Ücretli planlar ayda 9 $'dan başlıyor.

Hız için Kokoro veya Piper kullanın. Kalite için CosyVoice 2 veya StyleTTS 2 deneyin. Ses klonlaması için Chatterbox veya GPT-SoVITS kullanın. Diyalog için Dia TTS kullanın. Aynı metin üzerinde karşılaştırmak için birden fazla model deneyin.

Evet. TTS, STT, ses klonlama ve ses araçları için OpenAI uyumlu REST API. Ücretsiz de dahil olmak üzere her planda, seviyelere göre ölçeklenen hız sınırları ile (Ücretsiz: 10 req/min, Lite: 20, Başlangıç: 30, Pro: 60, İş: 300) dahildir. Tts.ai/api/ adresinde belgeleri görüntüleyin.

Ses kalitesi modelden modele değişir. CosyVoice 2, StyleTTS 2 ve Chatterbox gibi premium modelleri doğal intonasyon ve duygularla neredeyse insan kaliteli konuşma üretir. Kokoro gibi ücretsiz modelleri çoğu kullanım durumunda mükemmel kalite sunar.

TTS.ai model kütüphanesi boyunca 30+ dilde desteklenir. İngilizce en geniş model desteğine sahiptir, ancak CosyVoice 2 gibi modelleri Çince, Japonca ve Korece kapsar; GPT-SoVITS Çince, Japonca, Korece ve İngilizce ile ilgilenir; ve MeloTTS İngilizce, İspanyolca, Fransızca, Çince, Japonca ve Korece destekler.

Evet. Tüm işlemler özel GPU sunucularımızda yapılır. Mesaj girdilerinizi veya gönderildikten sonra oluşturulan sesleri depolamıyoruz. Klonlama için yüklenen ses örnekleri sadece mevcut oturum için kullanılır ve saklanmaz. Verilerinizi hiçbir zaman üçüncü taraflarla paylaşmayız veya modelleri eğitmek için kullanmayız.

Evet. TTS.ai'de üretilen tüm ses, YouTube videoları, podcast'ler, sesli kitaplar, uygulamalar, reklamlar ve ürünler dahil olmak üzere ticari kullanım için sizindir. Modellerimiz izin veren lisanslar altında açık kaynaktır (MIT, Apache 2.0). Ücret veya kaynak gösterme gerekmez.

TTS.ai, maksimum kalite için varsayılan olarak WAV biçiminde ses üretir. Ücretsiz Ses Dönüştürücümüzü kullanarak MP3, FLAC, OGG veya M4A'ya dönüştürebilirsiniz. API, isteğe bağlı çıkış biçiminizi doğrudan talepte belirtmenizi destekler.

Klonlamak istediğiniz sesin kısa bir ses örneğini (5 saniye kadar kısa) yükleyin, sonra bu ses için konuşma üretmek için herhangi bir metin yazın. Chatterbox, GPT-SoVITS ve CosyVoice 2 gibi modeller ses klonlamasını destekler. Klonlanan ses tonu, aksan ve konuşma tarzını yakalayacaktır.

Ücretsiz modelleri (Kokoro, Piper, VITS, MeloTTS) hesap gerektirmez ve sıfır karaktere mal olur. Standart modelleri (2.000 karakter/1K giriş) Bark, CosyVoice 2, F5-TTS ve Dia içerir. Premium modelleri (4.000 karakter/1K giriş) OpenVoice, Chatterbox, StyleTTS 2 ve Tortoise içerir. Ödenmiş modeller genellikle daha yüksek kalite, daha fazla ses ve ses klonlama gibi ek özellikler sunar.

Evet. API, büyük miktarda metinleri konuşmaya dönüştürmek için grup işlemini destekler. Çoklu talepler gönderin ve iş UUID'leri kullanarak sonuçları senkronize olarak alın. İş planı ($99/ay) ve daha yüksekleri, daha hızlı grup işlemi için öncelikli kuyruk erişimini içerir. Sesli kitap üretimi, ders içeriği ve büyük ölçekli seslendirme projeleri için idealdir.
4.1/5 (42)

Neyi geliştirebiliriz?

Yapay Zeka Sesini Bugün Kullanmaya Başla

TTS.ai kullanan yaratıcılara, geliştiricilere ve işletmelere katılın