Free AI Mətndən Söhbətə
20+ açıq mənbə modelləri, 107+ səslər, 32+ dillər. Hesab tələb olunmur.
Səsli AI üçün lazım olan hər şey
Açıq mənbəli AI modelləri ilə təchiz olunmuş 30+ alət
20+ AI səs modelləri
Bir platformada açıq mənbəli TTS modellərinin ən geniş kolleksiyası
Kokoro Free
Kokoro 82 milyon parametrli mətndən-söhbətə modeldir ki, öz ağırlıq sinfindən çox üstündür. Kiçik ölçüsünə baxmayaraq, çox təbii və ifadəli bir səs çıxarır. Kokoro ingilis, yapon, çin və koreyalı dilləri də daxil olmaqla bir çox dilləri dəstəkləyir. GPU-da real vaxtdan 100 dəfə daha sürətli səs çıxarır.
Ən Yaxşı: Minimal gecikmə ilə yüksək keyfiyyətli TTS, axın tətbiqetmələri
Pulsuz Yoxla
Piper Free
Piper Rhasspy tərəfindən inkişaf etdirilmiş VITS və larynx arxitekturalarını istifadə edən yüngül mətn-söhbətə motordur. CPU-da işləyir, bu da onu edge cihazları, ev avtomatlaşdırması və offlayn TTS tələb edən proqramlar üçün ideal edir. 30-dan çox dildə 100 səslə Piper Raspberry Pi 4-də belə real vaxt sürətində təbii səsli sözlər təqdim edir.
Ən Yaxşı: Tez önizləmələr, əlçatanlıq və daxili proqramlar
Pulsuz Yoxla
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) hazırkı iki mərhələli modellərdən daha təbii səs çıxaran paralel son-son TTS metodudur. Normallaşdırma axınları və qarşılıqlı öyrənmə prosesi ilə artırılmış variational inference-ni qəbul edir, təbiiliyi əhəmiyyətli dərəcədə yaxşılaşdırır.
Ən Yaxşı: Təbii prozodiya ilə ümumi məqsədli mətn-söhbətə çevirici
Pulsuz Yoxla
MeloTTS Free
MyShell.ai tərəfindən hazırlanmış MeloTTS İngilis (Amerika, İngiltərə, Hindistan, Avstraliya), İspan, Fransız, Çin, Yapon və Koreya dillərini dəstəkləyən çoxdilli TTS kitabxanasıdır. Bu kitabxana çox sürətlidir, yalnız CPU-da mətni real vaxt sürəti ilə işləyə bilir. MeloTTS istehsal üçün nəzərdə tutulmuşdur və CPU və GPU inference-ni dəstəkləyir.
Ən Yaxşı: Çoxdilli və sürətli TTS tələb edən proqramlar
Pulsuz Yoxla
Bark Standard
Realist danışıq, musiqi və səs effektləri yaradan transformator əsaslı mətn-audio modeli.
Yaradıcı: Suno · Lisenziya: MIT
Yoxla
Bark Small Standard
Bark-ın daha sürətli nəticələr və daha az yaddaş istifadəsi ilə daha yüngül versiyası.
Yaradıcı: Suno · Lisenziya: MIT
Yoxla
CosyVoice 2 Standard
Alibaba-nın insan-paritet təbiiliyi və sıfıra yaxın latency ilə ölçə bilən streaming TTS.
Yaradıcı: Alibaba (Tongyi Lab) · Lisenziya: Apache 2.0
Yoxla
Dia TTS Standard
Dinləyicilər arasında təbii söhbətlər yaradan çoxlu dinləyicili dialoq yaratma modeli.
Yaradıcı: Nari Labs · Lisenziya: Apache 2.0
Yoxla
Parler TTS Standard
İstəydiyiniz səsi təbii dildə təsvir edin və Parler uyğun səsi yaradacaq.
Yaradıcı: Hugging Face · Lisenziya: Apache 2.0
Yoxla
GLM-TTS Standard
Açıq mənbəli TTS modelləri arasında ən aşağı xarakter səhv dərəcəsini əldə edir.
Yaradıcı: Zhipu AI · Lisenziya: GLM-4 License
Yoxla
IndexTTS-2 Standard
Zero-shot TTS fine-grained emosional nəzarət və yüksək ekspressivlik.
Yaradıcı: Index Team · Lisenziya: Bilibili Model License
Yoxla
Spark TTS Standard
Sesi klonlaşdıran TTS, idarəolunan hisslər və çağırışlar vasitəsilə danışan üslubla.
Yaradıcı: SparkAudio · Lisenziya: CC BY-NC-SA 4.0
Yoxla
GPT-SoVITS Standard
Yalnız 5 saniyədən ibarət olan səsdən hər hansı bir səsi təkrarlayan az səsli səs klonlaşdırma TTS.
Yaradıcı: RVC-Boss · Lisenziya: MIT
Yoxla
Orpheus Standard
İnsan səviyyəli emosional TTS modeli 100K saatlıq danışıq məlumatları üzərində hazırlanmışdır.
Yaradıcı: Canopy Labs · Lisenziya: Llama 3.2 Community
Yoxla
Qwen3 TTS Standard
Alibaba-nın çoxdilli TTS səs klonlaşdırması, əvvəlcədən seçilmiş səslər və mətndən səs dizaynı ilə.
Yaradıcı: Alibaba (Qwen) · Lisenziya: Apache 2.0
Yoxla
CosyVoice 2
Alibaba-nın insan-paritet təbiiliyi və sıfıra yaxın latency ilə ölçə bilən streaming TTS.
Dillər: en, zh, ja, ko, fr, de, it, es
Sesi Dəyişdir
GLM-TTS
Açıq mənbəli TTS modelləri arasında ən aşağı xarakter səhv dərəcəsini əldə edir.
Dillər: en, zh
Sesi Dəyişdir
IndexTTS-2
Zero-shot TTS fine-grained emosional nəzarət və yüksək ekspressivlik.
Dillər: en, zh
Sesi Dəyişdir
Spark TTS
Sesi klonlaşdıran TTS, idarəolunan hisslər və çağırışlar vasitəsilə danışan üslubla.
Dillər: en, zh
Sesi Dəyişdir
GPT-SoVITS
Yalnız 5 saniyədən ibarət olan səsdən hər hansı bir səsi təkrarlayan az səsli səs klonlaşdırma TTS.
Dillər: en, zh, ja, ko
Sesi Dəyişdir
Chatterbox
Resemble AI-dən emosional nəzarətlə state-of-the-art zero-shot səs klonlaşdırması.
Dillər: en
Sesi Dəyişdir
Tortoise TTS
Multi-sözlü text-to-speech autoregressive arxitektura ilə keyfiyyətə fokuslanır.
Dillər: en
Sesi Dəyişdir
OpenVoice
Stil, emosiya və aksent üzərində granulyar nəzarətlə dərhal səs klonlaşdırması.
Dillər: en, zh, ja, ko, fr, de, es, it
Sesi Dəyişdir
Qwen3 TTS
Alibaba-nın çoxdilli TTS səs klonlaşdırması, əvvəlcədən seçilmiş səslər və mətndən səs dizaynı ilə.
Dillər: en, zh, ja, ko, de, fr, ru, pt, es, it
Sesi Dəyişdirİnkişafçı API
OpenAI-ya uyğun REST API. Bir son nöqtə, 22+ model. Rəsmi proqramlar üçün axın dəstəyi.
- OpenAI-ya uyğun format
- Rəsmi proqramlar üçün TTS axını
- Böyük iş üçün dəstəli işləmə
- Webhook bildirişləri
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Sadə, Şəffaf Qiymətləndirmə
Pulsuz başlayın. Böyüdükcə ölçün.
Pulsuz
15 kredit
- Kokoro, Piper, VITS, MeloTTS
- 500 xarakter həddi
- 3 gen/saat (heç bir hesab yoxdur)
Tez-tez Sorulan Sual
Bu gün AI səsini istifadə etməyə başlayın
TTS.ai istifadə edərək yaradıcılara, inkişaf etdiricilərə və bizneslərə qoşulun