Free AI Àkọlé sí Àkọ́kọ́

Àwọn ààtòjọ-ẹ̀yàn Ìjánu-ìsún Àwọn àwòrán ìṣàfihàn Àwọn Àgbègbè Àwọn Ìṣàmúlò-ètò

Móòdù parámetrù 82Ḿ tí ń fi ẹnu-ọ̀rọ̀ ìṣàfilọ́lẹ̀-ìṣàfilọ́lẹ̀ lọ́wọ́lọ́wọ́ pamọ́.

Àwọn àgbègbè · 1.5GB VRAM Wòyé

Piper

CPU-friendly Àwọn Ìṣàmúlò-ètò Àwọn Àmì-ìwé Àwọn Àwọn ìṣàfilọ́lẹ̀ SSML

Àwọn àkọlé àwòrán ààyè-iṣẹ́

Àwọn àgbègbè · 0 (CPU only) VRAM Wòyé

VITS

Àwọn àwọn àgbékalẹ̀ Àwọn ìṣàmúlò-ètò ìṣàfarawé Àwọn àwọn àgbékalẹ̀ Àwọn ìgbàkọ̀ọ̀kan

Àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn àkọlé.

Àwọn àgbègbè · 1GB VRAM Wòyé

MeloTTS

CPU-Óòdúró Àwọn Àwọn àwọn ìṣàfarawégbè Àwọn àwọn ààyè-iṣẹ́ Latency kéré

Àkọlé-si-Ìrọ̀rọ̀ àwọn ìtàn-nípa-ìdáràn-ìdáràn tí o lọ́wọ́lọ́wọ́ nípa CPU pẹlú ìdáràn.

Àwọn àgbègbè · 0.5GB (GPU optional) VRAM Wòyé

Bark

Àwọn ìṣàfarawé àwọn ìṣàfarawé àwòrán Ìfẹ́/ìfẹ́ Ìṣàfilọ́lẹ̀ ìṣàmúlò-ètò Àwọn Àkọlé Àwọn Àgbègbè

Módélù àkọ́lé-si-àwòrán tí a dá lorí ìṣàfarawé-ìṣàfilọ́lẹ̀ tí n ṣẹ̀dá àwọn àwọn ìṣàfilọ́lẹ̀ ìṣàfarawé, àwọn ìṣàfilọ́lẹ̀ ìranlọwọ, àwọn ìṣàfilọ́lẹ̀ ìgbọ́.

Àkóónú · 5GB VRAM Wòyé

Bark Small

Àwọn àwọn Tí o bá jú àwọn àgbègbè ìtàn lọ́wọ́lọ́wọ́ Àwọn Àkọ́kọ́ Ìṣàmúlò-ètò Àwọn

Àwọn ìṣàfarawégbèsì tí o ní ìṣàfarawégbèsì tí o lagbarà àti ìlòòrò.

Àwọn ìṣàmúlò-ètò · 2GB VRAM Wòyé

CosyVoice 2

Ìjánu-ìṣàmúlò-ètò Àwọn àwọn ìṣàfarawé àwọn ààyè-iṣẹ́ Àwọn Ìṣakoso Ìfẹ́ Àwọn ìṣàfarawé àwọn ìṣàfarawé-àyè

TTS ti a le ṣii ti Alibaba pẹlu ifẹ-ara ẹni ati igbẹkẹle ti ko ni ifẹ.

Dia TTS

Àwọn Àkọlé Àwọn Àkọlé Ìjánu-ìṣàmúlò-ètò ìṣàfarawé Àwọn àmì-ìwé àìròyìn Àwọn ààtòjọ-ẹ̀yàn

Módélù ìṣàfilọ́lẹ̀ àgbèkalẹ̀ àwọn ìgbàkọ́-àgbèkalẹ̀-àgbèkalẹ̀ tí n ṣẹ́dá àwọn àgbèkalẹ̀ ìṣàfilọ́lẹ̀ àwọn ìgbàkalẹ̀.

Parler TTS

Àwọn ìṣàfihàn àwọn àmì-ìwé Ìwé ìṣàmúlò-ètò Àwọn àwọn àwòrán Kò ní àwọn ìrànwọ́ àwọn ìrànwọ́ àwọn ìrànwọ́

Fi àwòrán àwòrán tí o fẹ̀ pamọ́ sínú ìṣàfarawe-ìrọ̀ tí a tì kọ̀ nínú ìṣàfarawe-ìrọ̀ tí a tì kọ̀.

Indic Parler TTS

Àwọn Àkọlé Àwọn Àkọlé Àwọn ìṣàfihàn àwọn àmì-ìwé Ìwé ìṣàmúlò-ètò Àwọn ìṣàfarawé India

Àwọn àkọlé àìdájú àwọn àgbègbè inú àwọn ìtàn India 8+ nípa ìdájú àwọn ìtàn inú.

Àkóónú · 8GB VRAM Wòyé

KhanomTan TTS

Thai TTS Àwọn Àkọlé àwòrán Àwọn ààyè-iṣẹ́ YourTTS Àwọn ìṣẹ̀dà àìdáràn

Àkọlé-si-ìrọ̀-ìṣàfilọ́lẹ̀ Thai-ọ̀pẹ̀ nípa àwọn àwòrán àwọn ìgbàkọ́.

Àwọn àgbègbè · 2GB VRAM Wòyé

IndexTTS-2

Ìṣakoso Ìfẹ́ Àwọn ààyè-iṣẹ́ Àwọn bèkì ìrànwọ́ Àwọn Àmì-àṣírí Àwọn Ìṣàmúlò-ètò

TTS tí a fi pamọ́ nípa ìdárawọ́lẹ̀ àti ìṣàfihàn giga.

Spark TTS

Ìṣàfarawé àwọn àmì-ìwé Àwọn Ìṣàmúlò-ètò Ìṣakoso Ìṣàmúlò-ètò Àwọn àgbéwọlé Àwọn ìṣàfarawé àwọn ìṣàmúlò-ètò

Ìṣàfarawe-ìrọ̀ TTS pẹlú àwọn ìrànwọ́ tí a lè ṣakoso àti àwọn ìṣàlàyé ìgbàgbọ́ láti inú àwọn àgbéwọlé.

GPT-SoVITS

Àwọn ìṣàfarawé àwọn ìṣàmúlò-ètò Àwọn àwòrán Àwọn ìṣàfilọ́lẹ̀ àwọn àwọn ààyè-iṣẹ́ Ìdáràn Àwọn

Àwọn àwọn àwòrán-ìṣàmúlò-ètò TTS tí wọ́n ṣẹ̀dà àwọn àwòrán láti inú àwọn ìsẹ́ẹ̀tì 5.

Àkóónú · 6GB VRAM Wòyé

Orpheus

Àwọn ìrànwọ́ ìpele-àwọ̀n-óòdù Àwọn ààyè-iṣẹ́ Ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ Àwọn Àkọ́kọ́

Módélú TTS ìrànwọ́ ìrànwọ́-ìbàlẹ̀-ẹnì tí a kọ̀ nípa àwọn aago 100K tí àwọn ààtò ìsàlẹ̀-ilà ìsàlẹ̀-ilà.

Chatterbox

Àwọn àwọn ìṣàfarawé àwọn ààyè-iṣẹ́ Ìṣakoso Ìfẹ́ Ìdáràn Ìjánu-ìsún Àwọn ààyè-iṣẹ́ ìṣàmúlò-ètò

Iṣàfilọ́lẹ̀ àwòrán tí kò ní ìṣàfilọ́lẹ̀ pẹ̀lú ìṣàfilọ́lẹ̀ ìrànwọ́ láti inú Resemble AI.

Tortoise TTS

Àwọn ìkúndùǹ ìsàlẹ̀-ilà Àwọn àwòrán DALL-E architecture Ìṣàfarawé àwọn àmì-ìwé Àwọn Ìjánu-ìṣàmúlò-ètò

Àkọlé àwòrán-si-ìrọ̀.

Àkóónú · 8GB VRAM Wòyé

StyleTTS 2

Àwọn Ìṣàmúlò-ètò Àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfarawé Àwọn ìṣàmúlò-ètò ìṣàfarawé Àwọn ìfìmúlẹ̀ ìṣàfarawé Ìdáràn

Ìwé-ìrọ̀-si-ìrọ̀ nípa ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfilọ́lẹ̀ àti ìṣàfilọ́lẹ̀.

OpenVoice

Ìṣàmúlò-ètò Àwọn ìyipadà àwòrán Àwọn Ìṣàmúlò-ètò Ìṣakoso Àwọn Àmì-àṣírí Àwọn Àgbègbè

Ìṣàfarawé àwọn ìròyìn àwọn ìsàlẹ̀-ilà nípa ìdáràn àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfarawé àwọn ìṣàfarawé.

Qwen3 TTS

Àwọn ìrànwọ́ àwọn ìrànwọ́ Àwọn àwọn àwòrán àwọn àmì-ìwé Ìṣakoso Ìfẹ́ Àwọn

TTS tí a fi hàn nípa àwọn ìtàn mìíràn ti Alibaba ní àwọn ìrànwọ́ àti àwọn ìṣàfarawé ìtàn láti inú àkọlé.

Àwọn ìṣàmúlò-ètò · 7GB VRAM Wòyé

VieNeu-TTS-v2

Àwọn ìsàlẹ̀-ilà 7 tí a tí fi àwọn ìsàlẹ̀-ilà àwọn àwọn ìṣàmúlò-ilà En-Vi code-switching Ìṣàfarawé àwọn àmì-ìwé (3-5s àkọlé) Àwọn àwọn CPU-kùkan — kò ní GPU kan tí a fẹ́

Vietnam + English TTS tí a fi àwọn àmì-ìwé àwọn àwòrán-ìṣàfilọ́lẹ̀ 7 pamọ́ nípa ìṣàfarawé àwọn àwòrán. CPU-kè ní, kò ní GPU tí a fẹ́.

Àwọn àgbègbè · CPU VRAM Wòyé

Sesame CSM

Àwọn Àkọlé Àwọn ààyè-iṣẹ́ ìtàn Ìjánu-ìṣàmúlò-ètò Àwọn ìṣàmúlò-ètò Àwọn ààtòjọ-ẹ̀yàn

Módélú ìrọ́ ìrọ́ tí n ṣẹ́dá ìrọ́ ìrọ́ tí a ṣè nípa àwọn àkókó tí a fẹ́.

Àkóónú · 8GB VRAM Wòyé

Chatterbox Turbo

Latency tí ò kù jú 200ms lọ Àwọn Àmì-ìwé Paralinguistic 6x akoko gidi Ìṣàfarawé àwọn àmì-ìwé Àwọn àmì-ìwé

Chatterbox tí ò kù jù lọ nípa ìdáràn-200ms àti àwọn àmì-ìwé paralinguistic fún àwọn ẹ̀yàn, àwọn ẹ̀yàn, àti àwọn mìíràn.

Àwọn àgbègbè · 2GB VRAM Wòyé

VoxCPM

Àwọn àmì-ìwé Kò ní àwọn àwọn àyọkà ìṣàfarawé Ìṣàfarawé àwọn ìtàn Àwọn Àkọlé LoRA fine-tuning

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency.

Àwọn àgbègbè · 4GB VRAM Wòyé

Kani TTS 2

3GB VRAM Ójútó Àwọn àwọn NanoCodec Àìfẹ́

Ultra-lightweight 400M English TTS awoṣe ti n ṣiṣẹ ni 3GB VRAM nikan.

Àwọn àgbègbè · 3GB VRAM Wòyé

OuteTTS

Àwọn àwọn àgbéwọlé Àwọn ìṣàmúlò-ètò ìṣàfihàn Àwọn ààyè-iṣẹ́ ìsàlẹ̀-ilà mìíràn Àwọn Àkọlé

TTS LLM-da lori ti o nlọ lori CPU, GPU, tabi aṣawakiri nipasẹ llama.cpp ati Transformers.js.

Àkóónú · 2GB VRAM Wòyé

VibeVoice

Àwọn Àkọlé Àwọn ààyè-iṣẹ́ Àwọn àkọlé Àwọn àwọn ìṣàfarawé àwọn ìṣàfarawé 200ms Ìjánu-ìró

Móòdù Microsoft fún àwọn ààyè-iṣẹ́ ìṣàfilọ́lẹ̀-àpẹẹrẹ

Àwọn àgbègbè · 4GB VRAM Wòyé

Pocket TTS

Àwọn ààtòjọ-ẹ̀yàn Àwọn àwọn àgbéwọlé Ìṣàfarawé àwọn àmì-ìwé Àwọn ààyè-iṣẹ́ ìṣàmúlò-ètò Àwọn Ìgúnrégé

Àwọn àwọn ààyè-iṣẹ́ àwọn àwọn ààyè-iṣẹ́ 100M tí Kyutai fi pamọ́ láti inú àwọn

Àwọn àgbègbè · 1GB VRAM Wòyé

Kitten TTS

Àwọn àgbékalẹ̀ CPU-kè Ìwọ̀n àwọn ìṣàmúlò-ètò ìsàlẹ̀-ètò 80MB Àwọn àwòrán Ìṣakoso Ìjánu-ìsẹ́ ONNX-dájú Àwọn ìṣàfihàn

TTS tí o ní ìpelé kéré jú 80MB lọ. Òlòlò nínú CPU látì GPU.

Àwọn àgbègbè · 0GB VRAM Wòyé

CosyVoice3

Àwọn Ìjánu-ìṣàmúlò-ètò Ìṣakoso Ìfẹ́ Ìṣàfarawé àwọn àmì-ìwé Ìṣakoso Ìgbáráwọ́lù/Ìgbáráwọ́lù Àwọn Àṣẹ

TTS tí a fi hàn nípa àwọn ìtàn mìíràn nípa ìṣàfilọ́lẹ̀, ìdárawọ́, àti ìṣàfilọ́lẹ̀ àwọn àwòrán.

Àwọn àgbègbè · 4GB VRAM Wòyé

NAMAA Saudi TTS

Arabic Arabic Ìṣàfarawé àwòrán-ìdáràn Ìṣakoso Ìfẹ́ Àwọn ìṣàfarawégbè

Ṣí TTS Saudi-Arabic akọkọ. Diẹ̀lì Saudì náà láti inú ìṣàfarawé àwọn ìròyìn àwọn ìròyìn-àwọn ìṣàfilọ́lẹ̀.

Àwọn ìṣàmúlò-ètò · 6GB VRAM Wòyé

Darwin TTS

Ìṣàfarawé àwọn àmì-ìwé Àwọn FFN-Blended Àwọn Qwen3 backbone

Cross-modal Qwen3-TTS variant pẹlu awọn iwuwo FFN ti a ṣe ni iṣọkan lati Qwen3-1.7B aṣa ede fun awọn iṣọkan ti o ni igbẹkẹle.

Àwọn ìṣàmúlò-ètò · 7GB VRAM Wòyé

MOSS-TTSD

Àwọn àgbèkalẹ̀ àwọn ìgbàkọ́ Àwọn ìgbàkọ̀ójútó 60min coherent audio Ìṣàfarawé àwọn àmì-ìwé Àwọn ìṣàfilọ́lẹ̀ Podíẹ̀tì

Multi-speaker dialogue continuation model — gbe awọn ibaraẹnisọrọ aṣa-podcast ranṣẹ pẹlu awọn olugbagbọ 5 ati awọn iṣẹju 60 ti awọn ohun orin ti o ni ibatan.

Àwọn ìṣàmúlò-ètò · 12GB VRAM Wòyé

Ming-Omni TTS

Àwọn Àtòjọ-ẹ̀yàn Ìṣàfarawé àwọn àmì-ìwé Ìṣakoso Ìfẹ́ Ìṣakoso Àwọn Àkọ́kọ́ Àwọn ìṣàfarawégbèsì BGM Ìgúnrégé 0.5B

Compact 0.5B omni-modal ọrọ awoṣe lati inclusionAI pẹlu giga-fidelity 44.1kHz output ati zero-shot ọrọ kloning.

Àwọn ìṣàmúlò-ètò · 3GB VRAM Wòyé

MOSS-TTS Nano