Özgür Yapay Zeka Metinden KonuşmayaName

31+ açık kaynak modelleri, 231+ Sesler, 34+ Hesap gerekmez.

8K+
yaratıcılar
30K+
nesilleri
31+
Yapay zeka modelleri
231+
Sesler
0/500 karakter · Sign up for 5,000 per generation → Özgür
TTS.ai'yi seviyor musunuz?

Sesli Yapay Zeka için İhtiyaç Duyduğunuz Her Şey

Açık kaynaklı yapay zeka modelleri tarafından desteklenen 30+ araç

31+ Yapay Zeka Ses Modelleri

Tek bir platformda açık kaynaklı TTS modellerinin en kapsamlı koleksiyonu

KokoroKokoro Free

Kokoro, ağırlık sınıfının çok üstünde bir performans gösteren 82 milyon parametreli bir metin-sözlü modeldir. Küçük boyutuna rağmen, dikkate değer derecede doğal ve ifade edici bir konuşma üretir. Kokoro, İngilizce, Japonca, Çince ve Korece gibi çoklu dilleri çeşitli ifade edici seslerle destekler. İnanılmaz derecede hızlı çalışır — GPU üzerinde gerçek zamanlı ses üretmekten neredeyse 100 kat daha hızlı.

En iyi: En az gecikme ile yüksek kaliteli TTS, akış uygulamaları

Bedava Dene

PiperPiper Free

Piper, Rhasspy tarafından geliştirilen ve VITS ve larynx mimarilerini kullanan hafif bir metin-söz motorudur. Tümüyle CPU üzerinde çalışır, bu da onu kenar cihazları, ev otomasyonu ve çevrimdışı TTS gerektiren uygulamalar için ideal hale getirir. 30'dan fazla dilde 100'den fazla sesle, Piper Raspberry Pi 4'te bile gerçek zamanlı hızlarda doğal sesli konuşma sağlar.

En iyi: Hızlı önizlemeler, erişilebilirlik ve gömülü uygulamalar

Bedava Dene

VITSVITS Free

VITS (sondan sona Metin-Konuşmaya karşılık gelen öğrenme ile Varyasyonel İnceleme), mevcut iki aşamalı modellerden daha doğal ses çıkaran bir paralel sondan sona TTS yöntemidir. Normalleştirme akışlarıyla ve karşılıklı eğitim süreciyle artırılmış varyasyonel çıkarımı kabul ederek, doğallıkta önemli bir iyileşme sağlar.

En iyi: Doğal prozodi ile genel amaçlı metin-sözleşmeName

Bedava Dene

MeloTTSMeloTTS Free

MyShell.ai tarafından geliştirilen MeloTTS, İngilizce (Amerikan, İngiliz, Hint, Avustralya), İspanyolca, Fransızca, Çince, Japonca ve Korece'yi destekleyen çok dilli bir TTS kütüphanesidir. Aşırı hızlıdır, tek başına CPU'da neredeyse gerçek zamanlı bir hızla metin işleme yapabilir. MeloTTS üretim kullanımı için tasarlanmış ve hem CPU hem de GPU çıkarımlarını destekler.

En iyi: Hızlı, çok dilli TTS gerektiren üretim uygulamaları

Bedava Dene

OuteTTSOuteTTS Free

OuteTTS, orijinal mimariyi korurken büyük dil modellerini metin-söz-ediş yetenekleriyle genişletir. llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM ve hatta Transformers.js aracılığıyla tarayıcı çıkarımı da dahil olmak üzere çoklu arka planları destekler. JSON olarak kaydedilmiş hoparlör profilleri aracılığıyla sıfır-atış ses klonlama özellikleri.

En iyi: Edge dağıtımı, tarayıcı tabanlı TTS, düşük kaynaklı ortamlar

Bedava Dene

Pocket TTSPocket TTS Free

Kyutai tarafından (Moshi'nin yaratıcıları) geliştirilen Pocket TTS, ağırlığının çok üzerinde bir performans gösteren kompakt 100M parametreli bir metin-söz dönüştürücü modelidir. CPU üzerinde verimli bir şekilde çalışır, tek bir ses örneğinden sıfır-atış ses klonlamasını destekler ve doğal sesli konuşma üretir. Küçük model boyutu onu kenar dağıtımı ve düşük kaynaklı ortamlar için ideal hale getirir.

En iyi: Hafif dağıtım, sadece CPU ortamları, hızlı ses klonlama

Bedava Dene

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

En iyi: Fast lightweight TTS, edge deployment, low-latency applications

Bedava Dene

BarkBark Standard

Gerçekçi konuşma, müzik ve ses efektleri üreten transformatör tabanlı metin-sesine model.

Geliştirici: Suno · Lisans: MIT

Dene.

Bark SmallBark Small Standard

Bark'ın daha hızlı çıkarımlar ve daha düşük bellek kullanımı ile hafif bir sürümü.

Geliştirici: Suno · Lisans: MIT

Dene.

CosyVoice 2CosyVoice 2 Standard

Alibaba'nın ölçeklenebilir akış TTS insan-parite doğallık ve sıfıra yakın gecikme ile.

Geliştirici: Alibaba (Tongyi Lab) · Lisans: Apache 2.0

Dene.

Dia TTSDia TTS Standard

Konuşanlar arasında doğal konuşmalar yaratan çoklu-konuşan diyalog üretim modeli.

Geliştirici: Nari Labs · Lisans: Apache 2.0

Dene.

Parler TTSParler TTS Standard

İstediğiniz sesi doğal dil ile tanımlayın ve Parler eşleşen konuşmayı oluşturur.

Geliştirici: Hugging Face · Lisans: Apache 2.0

Dene.

GLM-TTSGLM-TTS Standard

Açık kaynaklı TTS modelleri arasında en düşük karakter hata oranını elde eder.

Geliştirici: Zhipu AI · Lisans: GLM-4 License

Dene.

IndexTTS-2IndexTTS-2 Standard

Sıfır-atış TTS ince taneli duygu kontrolü ve yüksek ifade kabiliyeti ile.

Geliştirici: Index Team · Lisans: Bilibili Model License

Dene.

Spark TTSSpark TTS Standard

Ses klonlama TTS kontrol edilebilir duygu ve konuşma tarzıyla uyarılar aracılığıyla.

Geliştirici: SparkAudio · Lisans: CC BY-NC-SA 4.0

Dene.

GPT-SoVITSGPT-SoVITS Standard

Sadece 5 saniye sesten herhangi bir ses kopyalayan birkaç atış ses klonlama TTS.

Geliştirici: RVC-Boss · Lisans: MIT

Dene.

OrpheusOrpheus Standard

İnsan düzeyindeki duygusal TTS modeli 100K saatlik konuşma verileri üzerine eğitildi.

Geliştirici: Canopy Labs · Lisans: Llama 3.2 Community

Dene.

Qwen3 TTSQwen3 TTS Standard

Alibaba'nın çok dilli TTS ses klonlama, önceden ayarlanmış sesler ve metinden ses tasarımı ile.

Geliştirici: Alibaba (Qwen) · Lisans: Apache 2.0

Dene.

Chatterbox TurboChatterbox Turbo Standard

Sub-200ms gecikme ve gülüşmeler, öksürükler ve daha fazlası için paralinguistic etiketlerle daha hızlı Chatterbox.

Geliştirici: Resemble AI · Lisans: MIT

Dene.

Dia 2Dia 2 Standard

Çok konuşan diyalog ve paralinguistik işaretlerle akış-ilk konverasyonel TTS.

Geliştirici: Nari Labs · Lisans: Apache 2.0

Dene.

VoxCPMVoxCPM Standard

Tokenizer-free TTS, bağlam bilinçli paragraf tutarlılığı ile 44.1kHz ses üretir.

Geliştirici: OpenBMB · Lisans: Apache 2.0

Dene.

TADATADA Standard

Sıfır halüsinasyonlu TTS, metin-akustik çift doğrulama, karşılaştırmalı LLM TTS'den 5x daha hızlı.

Geliştirici: Hume AI · Lisans: MIT

Dene.

VibeVoiceVibeVoice Standard

Microsoft modeli, podcastler ve sesli kitaplar gibi uzun biçimli çoklu konuşmacı içeriği için.

Geliştirici: Microsoft · Lisans: MIT

Dene.

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Geliştirici: Alibaba (FunAudioLLM) · Lisans: Apache 2.0

Dene.

ChatterboxChatterbox Premium

En son teknoloji, sıfır atış ses klonlama, duygu kontrolü, Resemble AI'den.

Kalite:

Dene.

Tortoise TTSTortoise TTS Premium

Çok sesli metin-sözde kaliteye odaklanan autoregressive mimari.

Kalite:

Dene.

StyleTTS 2StyleTTS 2 Premium

İnsan düzeyinde metin-söz-ediş, stil yayımı ve karşılıklı eğitim yoluyla.

Kalite:

Dene.

OpenVoiceOpenVoice Premium

Anında ses klonlama, stil, duygu ve aksan üzerinde ince kontrol.

Kalite:

Dene.

Sesame CSMSesame CSM Premium

Konuşma modeli uygun zamanlama ve duygu ile doğal diyalog yaratıyor.

Kalite:

Dene.

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Kalite:

Dene.

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Kalite:

Dene.

CosyVoice 2CosyVoice 2

Alibaba'nın ölçeklenebilir akış TTS insan-parite doğallık ve sıfıra yakın gecikme ile.

Dilleri: en, zh, ja, ko, fr, de, it, es

Ses Klonlama

GLM-TTSGLM-TTS

Açık kaynaklı TTS modelleri arasında en düşük karakter hata oranını elde eder.

Dilleri: en, zh

Ses Klonlama

IndexTTS-2IndexTTS-2

Sıfır-atış TTS ince taneli duygu kontrolü ve yüksek ifade kabiliyeti ile.

Dilleri: en, zh

Ses Klonlama

Spark TTSSpark TTS

Ses klonlama TTS kontrol edilebilir duygu ve konuşma tarzıyla uyarılar aracılığıyla.

Dilleri: en, zh

Ses Klonlama

GPT-SoVITSGPT-SoVITS

Sadece 5 saniye sesten herhangi bir ses kopyalayan birkaç atış ses klonlama TTS.

Dilleri: en, zh, ja, ko

Ses Klonlama

ChatterboxChatterbox

En son teknoloji, sıfır atış ses klonlama, duygu kontrolü, Resemble AI'den.

Dilleri: en

Ses Klonlama

Tortoise TTSTortoise TTS

Çok sesli metin-sözde kaliteye odaklanan autoregressive mimari.

Dilleri: en

Ses Klonlama

OpenVoiceOpenVoice

Anında ses klonlama, stil, duygu ve aksan üzerinde ince kontrol.

Dilleri: en, zh, ja, ko, fr, de, es, it

Ses Klonlama

Qwen3 TTSQwen3 TTS

Alibaba'nın çok dilli TTS ses klonlama, önceden ayarlanmış sesler ve metinden ses tasarımı ile.

Dilleri: en, zh, ja, ko, de, fr, ru, pt, es, it

Ses Klonlama

Chatterbox TurboChatterbox Turbo

Sub-200ms gecikme ve gülüşmeler, öksürükler ve daha fazlası için paralinguistic etiketlerle daha hızlı Chatterbox.

Dilleri: en

Ses Klonlama

VoxCPMVoxCPM

Tokenizer-free TTS, bağlam bilinçli paragraf tutarlılığı ile 44.1kHz ses üretir.

Dilleri: en, zh

Ses Klonlama

OuteTTSOuteTTS

LLM tabanlı TTS, CPU, GPU veya tarayıcı üzerinden llama.cpp ve Transformers.js üzerinden çalışır.

Dilleri: en

Ses Klonlama

Pocket TTSPocket TTS

Kyutai tarafından tek bir örnekten ses klonlama ile hafif 100M parametre modeli.

Dilleri: en, fr

Ses Klonlama

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

Dilleri: en, zh, ja, ko, de, es, fr, it, ru

Ses Klonlama

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

Dilleri: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

Ses Klonlama

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

Dilleri: en, zh

Ses Klonlama

Geliştirici Öncesi API

OpenAI uyumlu REST API. Tek son nokta, 22+ model. Gerçek zamanlı uygulamalar için akış desteği.

  • OpenAI uyumlu biçim
  • Gerçek zamanlı uygulamalar için TTS akışı
  • Büyük işler için grup işlemi
  • Webhook bildirimleri
API Belgelerini Göster
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

Basit, Şeffaf Fiyatlar

Bedava başla, büyüdükçe ölçeklen.

Özgür

$0

15 kredi

  • Kokoro, Piper, VITS, MeloTTS
  • 500 karakter sınırı
  • 3 gen/saat (hesap yok)
Ücretsiz Kayıt Ol

Başlatıcı

$9/ms

500 kredi/ay

  • Tüm 22+ modelleri
  • Nesil başına 100.000 karakter
  • Ses Klonlama
Başla
En Popüler

Pro

$29/ms

2,000 kredi/ay

  • Başlatıcıdaki her şey
  • API erişimi
  • Öncelik işlemi
Profesyonel Ol

İş

$99/ms

10,000 kredi/ay

  • Pro'daki her şey
  • Bulk API
  • Öncelik kuyruğu
İş bul

Karakter paketleri dahil tüm planları görüntüle →

Sıkça Sorulan Sorular

TTS.ai, 22+ metin-söz modeller, ses klonlama, konuşma-söz ve ses araçları sunan en kapsamlı yapay zeka ses platformudur.Tüm modeller satıcı kilitleme olmadan açık kaynaktır.

Evet! TTS.ai Kokoro, Piper, VITS ve MeloTTS modelleriyle ücretsiz metin-söz dönüşümü sunuyor. Hesap gerekmiyor. 15.000 ücretsiz karakter almak ve tüm modellere erişmek için kayıt olun. Ücretli planlar ayda 9 $'dan başlıyor.

Hız için Kokoro veya Piper kullanın. Kalite için CosyVoice 2 veya StyleTTS 2 deneyin. Ses klonlaması için Chatterbox veya GPT-SoVITS kullanın. Diyalog için Dia TTS kullanın. Aynı metin üzerinde karşılaştırmak için birden fazla model deneyin.

Evet. TTS, STT, ses klonlama ve ses araçları için OpenAI-uyumlu REST API. Pro ($29/mo) ve Enterprise ($99/mo) planlarında mevcut. tts.ai/api/ adresinde belgeleri görüntüleyin.

Ses kalitesi modelden modele değişir. CosyVoice 2, StyleTTS 2 ve Chatterbox gibi premium modelleri doğal intonasyon ve duygularla neredeyse insan kaliteli konuşma üretir. Kokoro gibi ücretsiz modelleri çoğu kullanım durumunda mükemmel kalite sunar.

TTS.ai model kütüphanesi boyunca 30+ dilde desteklenir. İngilizce en geniş model desteğine sahiptir, ancak CosyVoice 2 gibi modelleri Çince, Japonca ve Korece kapsar; GPT-SoVITS Çince, Japonca, Korece ve İngilizce ile ilgilenir; ve MeloTTS İngilizce, İspanyolca, Fransızca, Çince, Japonca ve Korece destekler.

Evet. Tüm işlemler özel GPU sunucularımızda yapılır. Mesaj girdilerinizi veya gönderildikten sonra oluşturulan sesleri depolamıyoruz. Klonlama için yüklenen ses örnekleri sadece mevcut oturum için kullanılır ve saklanmaz. Verilerinizi hiçbir zaman üçüncü taraflarla paylaşmayız veya modelleri eğitmek için kullanmayız.

Evet. TTS.ai'de üretilen tüm ses, YouTube videoları, podcast'ler, sesli kitaplar, uygulamalar, reklamlar ve ürünler dahil olmak üzere ticari kullanım için sizindir. Modellerimiz izin veren lisanslar altında açık kaynaktır (MIT, Apache 2.0). Ücret veya kaynak gösterme gerekmez.

TTS.ai, maksimum kalite için varsayılan olarak WAV biçiminde ses üretir. Ücretsiz Ses Dönüştürücümüzü kullanarak MP3, FLAC, OGG veya M4A'ya dönüştürebilirsiniz. API, isteğe bağlı çıkış biçiminizi doğrudan talepte belirtmenizi destekler.

Klonlamak istediğiniz sesin kısa bir ses örneğini (5 saniye kadar kısa) yükleyin, sonra bu ses için konuşma üretmek için herhangi bir metin yazın. Chatterbox, GPT-SoVITS ve CosyVoice 2 gibi modeller ses klonlamasını destekler. Klonlanan ses tonu, aksan ve konuşma tarzını yakalayacaktır.

Ücretsiz modelleri (Kokoro, Piper, VITS, MeloTTS) hesap gerektirmez ve sıfır karaktere mal olur. Standart modelleri (2.000 karakter/1K giriş) Bark, CosyVoice 2, F5-TTS ve Dia içerir. Premium modelleri (4.000 karakter/1K giriş) OpenVoice, Chatterbox, StyleTTS 2 ve Tortoise içerir. Ödenmiş modeller genellikle daha yüksek kalite, daha fazla ses ve ses klonlama gibi ek özellikler sunar.

Evet. API, büyük miktarda metni konuşmaya dönüştürmek için grup işlemini destekler. Çok sayıda isteği gönderin ve iş UUID'lerini kullanarak sonuçları eşzamanlı olarak alın. Kurumsal planlar ($99/ay) daha hızlı grup işlemi için öncelikli kuyruk erişimini içerir. Sesli kitap üretimi, ders içeriği ve büyük ölçekli seslendirme projeleri için idealdir.
4.1/5 (21)

Neyi geliştirebiliriz?

Yapay Zeka Sesini Bugün Kullanmaya Başla

TTS.ai kullanan yaratıcılara, geliştiricilere ve işletmelere katılın