Free AI Mətndən Söhbətə

82M parametrlər Çox sürətli Ekspressiv səslər Çoxdilli İşıqlandırma dəstəyi

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

_Təkrarla · 1.5GB VRAM Yoxla

Piper

CPU-ya uyğun Xətt kənarında ola bilər 100+ səs 35+ dil SSML dəstək

Raspberry Pi və daxili qurğular üçün optimallaşdırılmış sürətli, yerli neyron mətndən-sözə sistem.

_Təkrarla · 0 (CPU only) VRAM Yoxla

VITS

Son-son sintez Təbii üsul Tez-tez Birdən çox səsləndirici

End-to-end text-to-speech üçün qarşılıqlı öyrənmə ilə şərtləndirilmiş variantlı avtoenkoder.

_Təkrarla · 1GB VRAM Yoxla

MeloTTS

CPU optimallaşdırılmış Çoxdilli Çoxlu Aksentlər Proqram hazırdır Az gözləmə müddəti

CPU-da minimal gecikmə ilə işləyən yüksək keyfiyyətli çoxdilli mətn-söhbətə çevirici.

_Təkrarla · 0.5GB (GPU optional) VRAM Yoxla

Bark

Səs effektləri Gülmək/Nəsihət vermək Musiqi yaradılması 100+ səsləndirici Çoxdilli

Realist danışıq, musiqi və səs effektləri yaradan transformator əsaslı mətn-audio modeli.

Yavaş · 5GB VRAM Yoxla

Bark Small

Yüngül Tam qabıqdan daha sürətli Emosional nitq Çoxdilli

Bark-ın daha sürətli nəticələr və daha az yaddaş istifadəsi ilə daha yüngül versiyası.

Media · 2GB VRAM Yoxla

CosyVoice 2

Dağıdım Zero-shot klonlama Dillərarası Emosional idarəetmə İnsan-paritet

Alibaba'nın insan-paritet təbiəti və sıfıra yaxın latency ilə ölçülü streaming TTS.

Dia TTS

Birdən çox səsləndirici Dialog yaradılır Təbii dönmə Emosional İfadə Parametrlər

Multi-speaker dialog generasiyası modeli, səsverənlər arasında təbii söhbətlər yaradır.

Parler TTS

Səs təsviri Təbii dil idarəsi Elastik səs yaradılması Ön qurğulu səslər lazım deyil

İstəydiyiniz səsi təbii dildə təsvir edin və Parler uyğun səsi yaradacaq.

Indic Parler TTS

11.Azərbaycan dili Seçki Təbii dil idarəsi Authentic Indian [Təsdiqlənmiş Hindcə]

Təbii dil səs idarəsi ilə 8+ Hind dilləri üçün yüksək keyfiyyətli danışıq.

Yavaş · 8GB VRAM Yoxla

KhanomTan TTS

Tay TTS Birdən çox səsləndirici YourTTS arxitekturası Ticarət üçün təhlükəsiz lisenziya

Tay-ilk mətn-söhbətə səsləndirici səslərin seçimi ilə.

_Təkrarla · 2GB VRAM Yoxla

IndexTTS-2

Emosiyalar Zero-shot Emosiya vektorları Ekspressiv danışıq İdarəetmə

Zero-shot TTS fine-grained emosional nəzarət və yüksək ekspressivlik.

Spark TTS

Sesi təkrarla Emosional idarəetmə Tərtib İdarəetmə Prompt-based 5 saniyəlik klonlama

Sesi klonlaşdıran TTS, idarəolunan hisslər və çağırışlar vasitəsilə danışan üslubla.

GPT-SoVITS

5 saniyəlik klonlama Şarkı Sesi Bir neçə dəfə öyrən Yüksək keyfiyyətli Dilli

Yalnız 5 saniyədən ibarət olan səsdən hər hansı bir səsi təkrarlayan az səsli səs klonlaşdırma TTS.

Yavaş · 6GB VRAM Yoxla

Orpheus

İnsan səviyyəli hisslər 100K saat təlim Təbii işıqlandırma Ekspressiv danışıq

İnsan səviyyəli emosional TTS modeli 100K saatlıq danışıq məlumatları üzərində hazırlanmışdır.

Chatterbox

Zero-shot klonlama Emosiyalar Yüksək keyfiyyətli Təsvir köçürmə Tək nümunə klonlaşdırma

Resemble AI-dən emosional nəzarətlə state-of-the-art zero-shot səs klonlaşdırması.

Tortoise TTS

Ən yüksək keyfiyyət Çox səsli DALL-E arxitekturası Sesi təkrarla Avtomatik geriləmə

Multi-sözlü text-to-speech autoregressive arxitektura ilə keyfiyyətə fokuslanır.

Yavaş · 8GB VRAM Yoxla

StyleTTS 2

İnsan səviyyəsi Tərcümə Mübarizə Təbii dəyişən Yüksək keyfiyyətli

İnsan səviyyəsində text-to-speech stil diffuziya və qarşıdurma təlim vasitəsilə.

OpenVoice

Dərhal klonlama Səs çeviricisi Emosiyalar Aksent idarəsi Çoxdilli

Stil, emosionallıq və aksent üzərində granulyar nəzarətlə dərhal səs klonlaşdırması.

Qwen3 TTS

9 əvvəlcədən qurulmuş səs Mətndən səs dizaynı Emosiyalar Dillər

Alibaba'nın çoxdilli TTS-i əvvəlcədən təyin olunmuş səslərlə və mətndən səs dizaynı ilə.

Media · 7GB VRAM Yoxla

VieNeu-TTS-v2

7 əvvəlcədən qurulmuş səs (Şərq + Cənub aksentləri) En-Vi kod-əvəzləməsi Sesi klonlama (3-5s istinad) Podcast / çoxlu səsləndirici dəstəyi Yalnız CPU — GPU tələb olunmur

7 əvvəlcədən təyin olunmuş səs və zero-shot səs klonlaşdırması ilə vietnam + ingilis kod-əsaslı TTS. Yalnız CPU, GPU tələb olunmur.

_Təkrarla · CPU VRAM Yoxla

Sesame CSM

Konversasiya Təbii vaxt Dönüş Geri kanal Parametrlər

Konversasiyalı danışıq modeli, uyğun vaxt və emosionallıqla təbii dialoq yaradan.

Yavaş · 8GB VRAM Yoxla

Chatterbox Turbo

Sub-200ms gecikmə Paralingvistik etiketlər 6x real-time Səs klonlama Su nişanı

Sub-200ms latency ilə daha sürətli Chatterbox və gülüşlər, öskürəklər və daha çox üçün paralingvistik etiketlər.

_Təkrarla · 2GB VRAM Yoxla

VoxCPM

Səs Tokenizer-free Cross-language klonlama Bağlan LoRA düzəltmə

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.

_Təkrarla · 4GB VRAM Yoxla

Kani TTS 2

3GB VRAM Çox sürətli Yüngül NanoCodec Pulsuz

Ultra-yüngül 400M İngilis TTS modeli yalnız 3GB VRAM-da işləyir.

_Təkrarla · 3GB VRAM Yoxla

OuteTTS

CPU inference Səyyahın təyini Birdən çox arxa plan Dinləyici profilləri

LLM-ə əsaslanan TTS CPU, GPU, ya da llama.cpp və Transformers.js vasitəsilə brauzer üzərində işləyir.

Yavaş · 2GB VRAM Yoxla

VibeVoice

Birdən çox səsləndirici 90 dəqiqəyə qədər Podcast yaradılması Dinləyici 200ms axın

Podkastlar və audiokitablar kimi uzun formalı çox səsli məzmun üçün Microsoft modeli.

_Təkrarla · 4GB VRAM Yoxla

Pocket TTS

Parametrlər CPU inference Sesi təkrarla Tək nümunə klonlama Kənar hazır

Kyutai tərəfindən tək nümunədən səs klonlaşdırması ilə yüngül 100M parametr modeli.

_Təkrarla · 1GB VRAM Yoxla

Kitten TTS

CPU-only inference 80MB-dan az model ölçüsü 8 daxili səs Sür'ət idarəsi ONNX əsaslı 24kHz çıxış

80MB-dən az olan ultra-yüngül TTS. CPU-da GPU olmadan işləyir.

_Təkrarla · 0GB VRAM Yoxla

CosyVoice3

İki axın Emosiyalar Sesi təkrarla Sür'ət/həcm idarəsi İcazə

Bi-streaming, emosional nəzarət və zero-shot səs klonlaşdırması ilə yeni nəsil çoxdilli TTS.

_Təkrarla · 4GB VRAM Yoxla

NAMAA Saudi TTS

Səudiyyə ərəb dili Modern Standard Arabic Zero-shot səs klonlama Emosiyalar Yerli səslənmə

İlk açıq Səudiyyə-Ərəb TTS. Chatterbox-keyfiyyətli səs klonlaşdırması ilə yerli Səudiyyə dialekti.

Media · 6GB VRAM Yoxla

Darwin TTS

Sesi təkrarla Dilli FFN-qarışdırılmış 4 əsas dil Qwen3 arxa qurğusu

Qwen3-1.7B dil modeli ilə qarışdırılmış FFN ağırlığı ilə cross-modal Qwen3-TTS variantı daha kəskin çoxdilli klonlaşdırma üçün.

Media · 7GB VRAM Yoxla

MOSS-TTSD

Çoxlu səsləndirici dialoqu 5 səsləndiriciyə qədər 60min koherent audio Sesi təkrarla Podcast optimallaşdırması

Multi-speaker dialog davam modeli — 5-ə qədər səsləndirici və 60 dəqiqəlik koherent audio ilə podcast-style söhbətləri yarada bilərsiniz.

Media · 12GB VRAM Yoxla

Ming-Omni TTS

44.1kHz çıxış Sesi təkrarla Emosiyalar Dialekt İdarəetmə BGM yaradılması Kompakt 0.5B

InclusionAI-dən yüksək keyfiyyətli 44.1kHz çıxışı və sıfır-şot səs klonlaşdırması ilə kompakt 0.5B omni-modal danışıq modeli.

Media · 3GB VRAM Yoxla

MOSS-TTS Nano