Free AI Texti í talName

82M breytur Mjög hratt Expressive raddir Fjöltyng Straumspilunarstuðningur

Léttur 82M breytu líkan sem skilar stúdíó-gæði ræðu með eldingu-fljótur ályktun.

Fast · 1.5GB VRAM Prófaðu það

Piper

CPU- vingjarnlegur Ótengdur 100 + raddir 35 + tungumál SSML stuðningur

A fljótur, staðbundin tauga texta til talkerfi bjartsýni fyrir Raspberry Pi og innbyggðum tækjum.

Fast · 0 (CPU only) VRAM Prófaðu það

VITS

End-to-end myndun Náttúruleg málfræði Fljótur niðurstaða Margir hátalar

Skilyrt afbrigðileg sjálfvirk kóðari með andstæða námi fyrir enda-til-enda texta-til-tal.

Fast · 1GB VRAM Prófaðu það

MeloTTS

CPU- bjartsýni Fjöltyng Margar greinar Framleiðslu- tilbúinn Lág leynd

Hágæða fjöltyngdur texti-til-tal sem keyrir á CPU með lágmarks leynd.

Fast · 0.5GB (GPU optional) VRAM Prófaðu það

Bark

HljóðblöndunName Hlæja / andvarpa Tónlist kynslóð 100 + hátalara Fjöltyng

Transformer-undirstaða texta-til-hljóð líkan sem býr raunhæfa ræðu, tónlist og hljóð.

Hægur · 5GB VRAM Prófaðu það

Bark Small

Léttur Hraðar en fullur Bark Tilfinningaleg ræða Fjöltyng

Léttari útgáfa af Bark með hraðari ályktun og lægri minni notkun.

Miðlungs · 2GB VRAM Prófaðu það

CosyVoice 2

Straumspilun Zero-shot klónun Þvermál Tilfinningaleg stjórn Mannlegur- parity

Scalable straumspilun TTS Fjarvistarsönnunar með mannlegri jafnrétti náttúruleika og nálægt núll leynd.

Dia TTS

Fjölháttari Myndvinnsla glugga Náttúruleg beygja Tilfinningaleg tjáning 1.6B breytur

Multi-hátalara samtal kynslóð líkan sem skapar náttúruleg samtöl milli hátalara.

Parler TTS

Lýsing á rödd Náttúruleg tungumálastýring Sveigjanleg rödd sköpun Engin forstillt raddir þarf

Lýsið rödd sem þú vilt í náttúrulegu tungumáli og Parler býr til samsvarandi ræðu.

Indic Parler TTS

11 Indversk tungumál Lýsing á rödd Náttúruleg tungumálastýring Authentic Indverska framburð

Hágæða ræða fyrir 8+ indverskum tungumálum með náttúrulegum tungumála rödd stjórna.

Hægur · 8GB VRAM Prófaðu það

KhanomTan TTS

Thai TTS Margir hátalar YourTTS arkitektúr Commercial-öruggt leyfi

Thai-fyrsta texta-til-tal með val á hátalara raddir.

Fast · 2GB VRAM Prófaðu það

IndexTTS-2

Tilfinningaleg stjórn Núllskot Tilfinningavigrar Expressive ræða Fine-grained stjórn

Zero-skot TTS með fínkorna tilfinningastjórnun og mikla tjáningarmátt.

Spark TTS

Raddklóðun Tilfinningaleg stjórn Stíll stjórn Spyrjandi 5 sekúndna klónun

Rödd klónun TTS með stjórnanlegum tilfinningum og talstíl í gegnum kveikjur.

GPT-SoVITS

5 sekúndna klónun Söngrödd Fáir-skot nám High fidelity Tungumálasamþætting

Few-skot rödd klónun TTS sem endurtekur hvaða rödd frá aðeins 5 sekúndur af hljóði.

Hægur · 6GB VRAM Prófaðu það

Orpheus

Tilfinningar á mannlegum stigum 100K klukkustundir þjálfun Náttúruleg áhersla Expressive ræða

Tilfinningaleg TTS líkan á mannlegum stigum þjálfað á 100K klukkustundum talgagna.

Chatterbox

Zero-shot klónun Tilfinningaleg stjórn High fidelity Stíll Einstök sýnishorn klónun

State-of-the-art núll-skot rödd klónun með tilfinningum stjórna frá líkja AI.

Tortoise TTS

Hæsta gæði Fjölrödd DALL-E arkitektúr Raddklóðun Sjálfvirkt

Multi-rödd texti-til-tal lögð áhersla á gæði með autoregressive arkitektúr.

Hægur · 8GB VRAM Prófaðu það

StyleTTS 2

Manns- stig Stíll Andstæðingur þjálfun Náttúruleg breytileiki High fidelity

Human-stigi texta-til-tal í gegnum stíl dreifingu og andstæðingur-þjálfun.

OpenVoice

Augnablik klónun Voice viðskipti Tilfinningaleg stjórn Hljóðstyrkur Fjöltyng

Augnablik rödd klónun með kornuðu stjórn á stíl, tilfinningum og hreim.

Qwen3 TTS

9 forstilltar raddir Rödd hönnun úr texta Tilfinningaleg stjórn 10 tungumál

Fjöltyng TTS Fjarvistarsönnun með forstilltum raddir og raddhönnun úr texta.

Miðlungs · 7GB VRAM Prófaðu það

VieNeu-TTS-v2

7 forstilltar raddir (Norður + Suður hreim) En-Vi kóðaskipti Voice klónun (3-5s tilvísun) Podcast / multi-hátalara stuðningur CPU-aðeins - engin GPU krafist

Víetnamska + enska kóðaskipti TTS með 7 forstilltum raddum og núll-skot radd klónun. CPU-aðeins, engin GPU krafist.

Fast · CPU VRAM Prófaðu það

Sesame CSM

Samræðu Náttúruleg tímasetning Skipta um stöðu Bakrás 1B breytur

Samtals tal líkan sem býr til náttúrulega samræður með viðeigandi tímasetningu og tilfinningar.

Hægur · 8GB VRAM Prófaðu það

Chatterbox Turbo

Sub-200ms leynd Paralinguistic merki 6x rauntíma Raddklóðun Vatnsmerki

Hraðari Chatterbox með undir-200ms leynd og paralinguistic merki fyrir hlátur, hósta og fleira.

Fast · 2GB VRAM Prófaðu það

VoxCPM

44.1kHz hljóð Tokenizer-free Klónun á milli tungumála Samhengisbundið LoRA fínstilling

Tokenizer-frjáls TTS framleiðir 44.1kHz hljóð með samhengi-vitur málsgrein samræmi.

Fast · 4GB VRAM Prófaðu það

Kani TTS 2

3GB VRAM Mjög hratt Léttur NanoCodec Frjáls

Ultra-léttur 400M enska TTS líkan sem keyrir í aðeins 3GB VRAM.

Fast · 3GB VRAM Prófaðu það

OuteTTS

CPU Vafraályktun Margar bakenda Hátalarauppsetningar

LLM-undirstaða TTS sem keyrir á CPU, GPU, eða vafra í gegnum llama.cpp og Transformers.js.

Hægur · 2GB VRAM Prófaðu það

VibeVoice

Fjölháttari Allt að 90 mín Podcast kynslóð Hátalarasamræmi 200ms straumspilun

Microsoft líkan fyrir efni í langri mynd með mörgum hátölurum eins og podcast og hljóðbækur.

Fast · 4GB VRAM Prófaðu það

Pocket TTS

100M breytur CPU Raddklóðun Einstaklingsklónun Edge- Ready

Léttur 100M breytu líkan með Kyutai með rödd klónun úr einu sýni.

Fast · 1GB VRAM Prófaðu það

Kitten TTS

CPU- eingöngu ályktun Undir 80MB líkan stærð 8 innbyggð raddir Hraðastýring ONNX- byggt 24kHz úttak

Ultra-léttur TTS undir 80MB. Keyrir á CPU án GPU.

Fast · 0GB VRAM Prófaðu það

CosyVoice3

Tvístraumur Tilfinningaleg stjórn Raddklóðun Hraði / hljóðstyrkur Leiðbeiningar eftir

Næsta kynslóð fjöltyngdar TTS með tvískiptri straumspilun, tilfinningastjórnun og núll-skot raddklónun.

Fast · 4GB VRAM Prófaðu það

NAMAA Saudi TTS

Sádí-arabíska Modern Standard ArabicKCharselect unicode block name Zero-shot rödd klónun Tilfinningaleg stjórn Móðurmál framburðar

Fyrsta opna Saudi-Arabía TTS. Native Saudi mállýska með Chatterbox-gæði rödd klónun.

Miðlungs · 6GB VRAM Prófaðu það

Darwin TTS

Raddklóðun Tungumálasamþætting FFN- blandað 4 kjarna tungumál Qwen3 bakgrunnur

Cross-modal Qwen3-TTS afbrigði með FFN þyngd blandað úr Qwen3-1.7B tungumál líkan fyrir skarpari fjöltyngd klónun.

Miðlungs · 7GB VRAM Prófaðu það

MOSS-TTSD

Multi- hátalara samræður Allt að 5 hátalara 60min samfellt hljóð Raddklóðun Podcast-bætur

Multi-hátalara samræður áframhaldandi líkan - búa podcast-stíl samtöl með allt að 5 hátalara og 60 mínútur af samfelldu hljóði.

Miðlungs · 12GB VRAM Prófaðu það

Ming-Omni TTS

44. 1kHz úttak Raddklóðun Tilfinningaleg stjórn Dialect stjórn BGM kynslóð Compact 0. 5B

Compact 0.5B omni-modal tal líkan frá inclusionAI með hár-trúverðugleiki 44.1kHz framleiðsla og núll-skot rödd klónun.

Miðlungs · 3GB VRAM Prófaðu það

MOSS-TTS Nano