Free AI Metinden Söze

82M parametrler Çok tiz Äheňli sesler Birnäçe Dil Akym goldawy

Ýagşy 82M parametr modeli studio-quality sözi çalt inference bilen hödürleýär.

_Gün · 1.5GB VRAM Syna

Piper

CPU-friendly _Çyk Sesler 35+ dil SSML goldawy

Bir tiz, lokal neural metinden söze sistema Raspberry Pi we äpişgeli enjamlar üçin optimizirlen.

_Gün · 0 (CPU only) VRAM Syna

VITS

Sondan-sona sintez Natiral Tiz düşündirme Birnäçe sözleýjiler

Metinden söze öwretmek üçin garşylykly öwretmek bilen şertli variatiw awtoenkoder

_Gün · 1GB VRAM Syna

MeloTTS

CPU-optimized Birnäçe Dil Birnäçe Aksent Proýekt Düşük wagt

CPUda az wagt bilen işleýän ýokary hilli köp dilli metinden söze.

_Gün · 0.5GB (GPU optional) VRAM Syna

Bark

Ses Effekleri Gülmek/Gülmek Müzik emele getiriş 100+ sözleýji Birnäçe Dil

Transform-based text-to-audio model which generates realistic speech, music, and sound effects

Agyr · 5GB VRAM Syna

Bark Small

Ýagty Täzeden başla Emosional söz Birnäçe Dil

Bark'yň ýeňil wersiýasy çalt netije we az ýat ulanmak bilen.

Ortaça · 2GB VRAM Syna

CosyVoice 2

_Gözle Zero-shot klonlamak Diller Arasy Emotikon Kontrol Adam-parity

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Dia TTS

Birnäçe sözleýji Düýpli düwmeler Tebigy Emotikonlar Parametr

Birnäçe sözleýjiler arasyna dogry gürleşige ýol açýan köp sözleýjiler dialogy emele getiriş modeli.

Parler TTS

Ses beýany Takyk Dil Kontrol Sesi döred Ön bellenen sesler gerek däl

Isleýän sesiňizi natiral dilde beýan ediň we Parler deňleşen sözi döreder.

Indic Parler TTS

Hindi dili Ses beýany Takyk Dil Kontrol Authentic Indian pronunciation

8+ Hindi dilleri üçin ýokary hilli ses sözi, tebigy dil ses kontroly bilen.

Agyr · 8GB VRAM Syna

KhanomTan TTS

Taýça TTS Birnäçe sözleýjiler YourTTS architecture Tiz

Thai-first metin-dan-söz sesleri bilen ses saýlawy

_Gün · 2GB VRAM Syna

IndexTTS-2

Emotikon Kontrol Zero-shot Emotikonlar Expressive speech Kontrol

Zero-shot TTS fine-grained emosional kontrol we ýokary ekspressýonlyk bilen.

Spark TTS

Ses klonlamak Emotikon Kontrol Täsli Kontrol Prompt-based 5 sekuntlyk klon

Ses klonlamak TTS kontrol ediji emosiýa we sözleşik üsluby bilen soraglar arkaly.

GPT-SoVITS

5 sekuntlyk klon Sesi Ýandyr Az-şot öwreniş Beýik Diller Arasy

5 sekunt sesden her bir sesi gaýtalaýan az-şot ses klonlamak TTS

Agyr · 6GB VRAM Syna

Orpheus

Human-level emotion 100K sagat tälim Natural emphasis Ekspresiw söz

100K sagat söz maglumaty bilen taýýarlalan adam derejeli emosional TTS modeli.

Chatterbox

Zero-shot klonlamak Emotikon Kontrol Beýik Täze Bir nusga klonlamak

Resemble AI-den emotion kontrol bilen state-of-the-art zero-shot ses klonlama

Tortoise TTS

Beýik hili Birnäçe ses DALL-E binagärligi Ses klonlamak Otomatik Gaýd Et

Birnäçe sesli metinden söze autoregressive binagärlik bilen hile ünsi çeken.

Agyr · 8GB VRAM Syna

StyleTTS 2

Adam derejesi Style diffusion Tälim Takyklyk Beýik

Adam derejeli metin-söze öwrediş we garşydaş öwrediş arkaly.

OpenVoice

Tiz klonlamak Ses Döwresi Emotikon Kontrol Aksent Kontrol Birnäçe Dil

Sesi çalt klonlamak, üslup, duýgu we aksent kontrol etmek bilen.

Qwen3 TTS

9 öň bellenen ses Metinden ses dizaýny Emotikon Kontrol Dil

Alibaba's multilingual TTS with preset voices and voice design from text.

Ortaça · 7GB VRAM Syna

VieNeu-TTS-v2

7 öň bellenen ses (Şol + Günorta aksentler) En-Vi kod-switch Ses klonlama (3-5s referans) Podkast / köp sözleýji goldawy CPU-only — GPU gerek däl

Výetnamça + Inglizçe kod-swap TTS 7 öň bellenen sesler we zero-shot ses klonlama bilen. CPU-dan başga, GPU gerek däl.

_Gün · CPU VRAM Syna

Sesame CSM

Konwersasiýa Takyk wagt Döw Aşak kanal 1B parametrler

Konwersasiýa söz model, dogry wagt we duýgu bilen dogry dialogy döredýär.

Agyr · 8GB VRAM Syna

Chatterbox Turbo

200ms asty wagt geçmişi Paralingwistik tägler 6x real-time Ses klonlamak Suw belgisi

200ms asty wagt bilen tizräk gürleşiş boýag we gülüşler, ösküçler we başgalar üçin paralingwistik taglar.

_Gün · 2GB VRAM Syna

VoxCPM

Ses Tokenizer-free Diller arasy klonlama Kontekst-aware LoRA fin-tuning

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency

_Gün · 4GB VRAM Syna

Kani TTS 2

3GB VRAM Ultra-çalt Ýagty NanoCodec Free

Ultra-lightweight 400M English TTS model running in just 3GB VRAM.

_Gün · 3GB VRAM Syna

OuteTTS

CPU inference _Gözlegçi Birnäçe arkaýynlar Sesçi profilleri

LLM esasly TTS CPU, GPU, ýa-da lama.cpp we Transformers.js arkaly brauzer üstünde işleýär.

Agyr · 2GB VRAM Syna

VibeVoice

Birnäçe sözleýji 90 minut Podkast emele ed Ses 200ms akym

Podkastlar we audiokitaplar ýaly uzak şekilli köp sözleýji mazmun üçin Microsoft modeli.

_Gün · 4GB VRAM Syna

Pocket TTS

100M parametrler CPU inference Ses klonlamak Bir nusgaly klon Kenar taýýar

Kyutai tarapyndan ýekeje nusgadan ses klonlama bilen ýeňil 100M parametr modeli.

_Gün · 1GB VRAM Syna

Kitten TTS

CPU-only inference 80MB-den az model ululyky 8 içindeki sesler Tizlik Kontrol ONNX esasly 24kHz çykdajy

80MB astynda ultra-ýagly TTS. GPU bolmadyk CPUda işleýär.

_Gün · 0GB VRAM Syna

CosyVoice3

Iki-daşarky Emotikon Kontrol Ses klonlamak Tizlik/Gözleg kontroly Ädimleri dowam et

Iki-sýurly, emosiýa kontrol, we zero-şot ses klonlama bilen ýene bir nesil köp dilli TTS

_Gün · 4GB VRAM Syna

NAMAA Saudi TTS

Saud Arabçasy Zäherli Standart Arapça Ses klonlamak Emotikon Kontrol Öz diliňizdäki terjime

Ilki açyk Saud Arab TTS. Çatboş-hiç hili ses klonlama bilen Saud dialekti.

Ortaça · 6GB VRAM Syna

Darwin TTS

Ses klonlamak Diller Arasy FFN-Blended 4 core dilleri Qwen3 arka baglanç

Cross-modal Qwen3-TTS FFN wegtleri bilen Qwen3-1.7B dil modelinden birikdirildi has çuňňur köp dil klonlamak üçin.

Ortaça · 7GB VRAM Syna

MOSS-TTSD

Birnäçe sözleýji düwmesi 5-e çenli sözçü 60min koherent ses Ses klonlamak Podkast optimizirleme

Birnäçe sözleýji dialog dowam model — 5 sözleýji we 60 minutlyk birmeňzeş ses bilen podcast-style söhbetdeşlik dörediň.

Ortaça · 12GB VRAM Syna

Ming-Omni TTS

Çykyş Ses klonlamak Emotikon Kontrol Dialekt Kontrol BGM dörediji Kompýuter

InclusionAI-den 0.5B omni-modal söz model, ýokary-dogrylyk 44.1kHz çykdajy we zero-şot ses klonlama bilen.

Ortaça · 3GB VRAM Syna

MOSS-TTS Nano