Free AI Mətndən Söhbətə
31+ açıq mənbə modelləri, 231+ səslər, 34+ Hesab tələb olunmur.
Sesi AI üçün lazım olan hər şey
Açıq mənbəli AI modelləri ilə təchiz olunmuş 30+ alət
31+ AI səs modelləri
Bir platformada açıq mənbəli TTS modellərinin ən geniş kolleksiyası
Kokoro Pulsuz
Kokoro 82 milyon parametrli mətndən-sözə modeldir və öz ağırlıq sinfindən çox üstündür. Kiçik ölçüsünə baxmayaraq, o, çox təbii və ifadəli bir səs istehsal edir. Kokoro ingilis, yapon, çin və koreyalı dilləri də daxil olmaqla bir çox dilləri dəstəkləyir və müxtəlif ifadəli səslər istehsal edir. O, inanılmaz sürətlə işləyir - GPU-da real vaxtda səsi 100x sürətlə istehsal edir.
Ən Yaxşı: Minimal gecikmə ilə yüksək keyfiyyətli TTS, axın tətbiqetmələri
Pulsuz Yoxla
Piper Pulsuz
Piper Rhasspy tərəfindən inkişaf etdirilmiş VITS və larynx arxitekturalarını istifadə edən yüngül mətn-söhbətə motordur. CPU-da işləyir, bu da onu edge cihazları, ev avtomatlaşdırması və offlayn TTS tələb edən proqramlar üçün ideal edir. 30-dan çox dildə 100 səslə Piper Raspberry Pi 4-də belə real vaxt sürətində təbii səsli sözlər təqdim edir.
Ən Yaxşı: Tez önizləmələr, əlçatanlıq və daxili proqramlar
Pulsuz Yoxla
VITS Pulsuz
VITS (variasiyalı nəticə ilə qarşılıqlı öyrənmə üçün son-son Text-to-Speech) hazırkı iki mərhələli modellərdən daha təbii səslənən səsi yaradan paralel son-son TTS metodudur. Normallaşdırma axınları ilə artırılmış variasiyalı nəticəni və qarşılıqlı öyrənmə prosesini qəbul edir, təbiiliyi əhəmiyyətli dərəcədə yaxşılaşdırır.
Ən Yaxşı: Təbii prozodiya ilə ümumi məqsədli mətn-söhbətə çevirici
Pulsuz Yoxla
MeloTTS Pulsuz
MyShell.ai tərəfindən yaradılan MeloTTS İngilis (Amerika, İngiltərə, Hindistan, Avstraliya), İspan, Fransız, Çin, Yapon və Koreya dillərini dəstəkləyən çoxdilli TTS kitabxanasıdır. Bu kitabxana çox sürətlidir, yalnız CPU-da mətni real vaxt sürəti ilə işləyir. MeloTTS istehsal üçün hazırlanmışdır və CPU və GPU-nun nəticələrini dəstəkləyir.
Ən Yaxşı: Çoxdilli və sürətli TTS tələb edən proqramlar
Pulsuz Yoxla
OuteTTS Pulsuz
OuteTTS orijinal quruluşunu qoruyaraq mətn-söhbətə imkanları ilə böyük dil modellərini genişləndirir. llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM və hətta Transformers.js vasitəsilə brauzer inference daxil olmaqla bir çox arxa tərəfi dəstəkləyir. JSON olaraq qeyd edilmiş səsvermə profilləri vasitəsilə zero-shot səs klonlaşdırmasını dəstəkləyir.
Ən Yaxşı: Edge işə salma, brauzer əsaslı TTS, az resurs tələb edən mühitə
Pulsuz Yoxla
Pocket TTS Pulsuz
Kyutai tərəfindən (Moshi-nin yaradıcıları) hazırlanmış Pocket TTS, 100M parametrli kompakt mətn-söhbətə çevirmə modelidir. CPU-da səmərəli işləyir, tək səs nümunəsindən səs klonlaşdırmasını dəstəkləyir və təbii səsli söhbət yaradır. Kiçik model ölçüsü onu edge işə salınması və az resurslu mühitə ideal edir.
Ən Yaxşı: Yüngül işə salma, CPU-dan istifadə edən mühitə uyğun, sürətli səs klonlama
Pulsuz Yoxla
Kitten TTS Pulsuz
Kitten TTS by KittenML ONNX üzərində qurulan ultra-yüngül mətn-söhbətə çevirmə modelidir. 15M-dən 80M parametrə qədər variantları ilə (25-80 MB diskdə), CPU-da GPU tələb etmədən yüksək keyfiyyətli səs sintezini təmin edir. 8 daxili səs, düzəldilə bilən danışıq sürəti və rəqəmlər, pul vahidləri və vahidlər üçün daxili mətn əvvəldən işləməsi xüsusiyyətlərinə malikdir. Ən son işə salma və aşağı gecikmə tətbiqləri üçün idealdır.
Ən Yaxşı: Yüksək sürətli TTS, kənar işə salma, aşağı gecikmə tətbiqetmələri
Pulsuz Yoxla
Bark Əsas
Realist danışıq, musiqi və səs effektləri yaradan transformator əsaslı mətn-audio modeli.
Yaradıcı: Suno · Lisenziya: MIT
Yoxla
Bark Small Əsas
Bark-ın daha sürətli nəticələr və daha az yaddaş istifadəsi ilə daha yüngül versiyası.
Yaradıcı: Suno · Lisenziya: MIT
Yoxla
CosyVoice 2 Əsas
Alibaba'nın insan-paritet təbiəti və sıfıra yaxın latency ilə ölçülü streaming TTS.
Yaradıcı: Alibaba (Tongyi Lab) · Lisenziya: Apache 2.0
Yoxla
Dia TTS Əsas
Multi-speaker dialog generasiyası modeli, səsverənlər arasında təbii söhbətlər yaradır.
Yaradıcı: Nari Labs · Lisenziya: Apache 2.0
Yoxla
Parler TTS Əsas
İstəydiyiniz səsi təbii dildə təsvir edin və Parler uyğun səsi yaradacaq.
Yaradıcı: Hugging Face · Lisenziya: Apache 2.0
Yoxla
GLM-TTS Əsas
Açıq mənbəli TTS modelləri arasında ən aşağı xarakter səhv dərəcəsini əldə edir.
Yaradıcı: Zhipu AI · Lisenziya: GLM-4 License
Yoxla
IndexTTS-2 Əsas
Zero-shot TTS fine-grained emosional nəzarət və yüksək ekspressivlik.
Yaradıcı: Index Team · Lisenziya: Bilibili Model License
Yoxla
Spark TTS Əsas
Sesi klonlaşdıran TTS, idarəolunan hisslər və çağırışlar vasitəsilə danışan üslubla.
Yaradıcı: SparkAudio · Lisenziya: CC BY-NC-SA 4.0
Yoxla
GPT-SoVITS Əsas
Yalnız 5 saniyədən ibarət olan səsdən hər hansı bir səsi təkrarlayan az səsli səs klonlaşdırma TTS.
Yaradıcı: RVC-Boss · Lisenziya: MIT
Yoxla
Orpheus Əsas
İnsan səviyyəli emosional TTS modeli 100K saatlıq danışıq məlumatları üzərində hazırlanmışdır.
Yaradıcı: Canopy Labs · Lisenziya: Llama 3.2 Community
Yoxla
Qwen3 TTS Əsas
Alibaba-nın çoxdilli TTS səs klonlaşdırması, əvvəlcədən seçilmiş səslər və mətndən səs dizaynı ilə.
Yaradıcı: Alibaba (Qwen) · Lisenziya: Apache 2.0
Yoxla
Chatterbox Turbo Əsas
Sub-200ms latency ilə daha sürətli Chatterbox və gülüşlər, öskürəklər və daha çox üçün paralingvistik etiketlər.
Yaradıcı: Resemble AI · Lisenziya: MIT
Yoxla
Dia 2 Əsas
Multi-speaking dialog və paralingvistik işarələrlə ilk konversasiya TTS.
Yaradıcı: Nari Labs · Lisenziya: Apache 2.0
Yoxla
VoxCPM Əsas
Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.
Yaradıcı: OpenBMB · Lisenziya: Apache 2.0
Yoxla
TADA Əsas
Zero-hallucinasiya TTS mətn-akustik ikiqat düzəlişlə, müqayisəli LLM TTS-dən 5x daha sürətlidir.
Yaradıcı: Hume AI · Lisenziya: MIT
Yoxla
VibeVoice Əsas
Podkastlar və audiokitablar kimi uzun formalı çox səsli məzmun üçün Microsoft modeli.
Yaradıcı: Microsoft · Lisenziya: MIT
Yoxla
CosyVoice3 Əsas
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Yaradıcı: Alibaba (FunAudioLLM) · Lisenziya: Apache 2.0
Yoxla
CosyVoice 2
Alibaba'nın insan-paritet təbiəti və sıfıra yaxın latency ilə ölçülü streaming TTS.
Dillər: en, zh, ja, ko, fr, de, it, es
Sesi Dəyişdir
GLM-TTS
Açıq mənbəli TTS modelləri arasında ən aşağı xarakter səhv dərəcəsini əldə edir.
Dillər: en, zh
Sesi Dəyişdir
IndexTTS-2
Zero-shot TTS fine-grained emosional nəzarət və yüksək ekspressivlik.
Dillər: en, zh
Sesi Dəyişdir
Spark TTS
Sesi klonlaşdıran TTS, idarəolunan hisslər və çağırışlar vasitəsilə danışan üslubla.
Dillər: en, zh
Sesi Dəyişdir
GPT-SoVITS
Yalnız 5 saniyədən ibarət olan səsdən hər hansı bir səsi təkrarlayan az səsli səs klonlaşdırma TTS.
Dillər: en, zh, ja, ko
Sesi Dəyişdir
Chatterbox
Resemble AI-dən emosional nəzarətlə state-of-the-art zero-shot səs klonlaşdırması.
Dillər: en
Sesi Dəyişdir
Tortoise TTS
Multi-sözlü text-to-speech autoregressive arxitektura ilə keyfiyyətə fokuslanır.
Dillər: en
Sesi Dəyişdir
OpenVoice
Stil, emosionallıq və aksent üzərində granulyar nəzarətlə dərhal səs klonlaşdırması.
Dillər: en, zh, ja, ko, fr, de, es, it
Sesi Dəyişdir
Qwen3 TTS
Alibaba-nın çoxdilli TTS səs klonlaşdırması, əvvəlcədən seçilmiş səslər və mətndən səs dizaynı ilə.
Dillər: en, zh, ja, ko, de, fr, ru, pt, es, it
Sesi Dəyişdir
Chatterbox Turbo
Sub-200ms latency ilə daha sürətli Chatterbox və gülüşlər, öskürəklər və daha çox üçün paralingvistik etiketlər.
Dillər: en
Sesi Dəyişdir
VoxCPM
Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.
Dillər: en, zh
Sesi Dəyişdir
OuteTTS
LLM-ə əsaslanan TTS CPU, GPU, ya da llama.cpp və Transformers.js vasitəsilə brauzer üzərində işləyir.
Dillər: en
Sesi Dəyişdir
Pocket TTS
Kyutai tərəfindən tək nümunədən səs klonlaşdırması ilə yüngül 100M parametr modeli.
Dillər: en, fr
Sesi Dəyişdir
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
Dillər: en, zh, ja, ko, de, es, fr, it, ru
Sesi Dəyişdir
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
Dillər: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
Sesi Dəyişdir
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
Dillər: en, zh
Sesi DəyişdirYaradıcı-Əvvəlcə API
OpenAI-ya uyğun REST API. Bir son nöqtə, 22+ model. Rəsmi proqramlar üçün axın dəstəyi.
- OpenAI-ya uyğun format
- Rəsmi proqramlar üçün TTS axını
- Böyük iş üçün dəstəli işləmə
- Webhook bildirişləri
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
Sadə, Şəffaf Qiymətləndirmə
Pulsuz başlayın. Böyüdükcə ölçün.
Pulsuz
15 kredit
- Kokoro, Piper, VITS, MeloTTS
- 500 xarakter həddi
- 3 gen/saat (heç bir hesab yoxdur)
Tez-tez Sorulan Sual
Nəyi yaxşılaşdıra bilərik? Sizin rəyiniz problemləri düzəltməyə kömək edir.
Bu gün AI səsini istifadə etməyə başlayın
TTS.ai istifadə edərək yaradıcılara, inkişaf etdiricilərə və bizneslərə qoşulun