Vry Kunsmatige inteligensie Teks vir spraak

82M parameters Ultra-vinnig Uiterlike stemme MultilingualGenericName Stroom ondersteuning

Liggewig 82M parameter model lewer ateljee-kwaliteit spraak met gloeiende-vinnigheid.

Vinniggame speed · 1.5GB VRAM Probeer dit

Piper

Sve-vriendy Aflyn in staat 100+-stem 35+ tale SSML-ondersteuning

' n Vinnige, plaaslike neurale teks vir spraakstelsel wat vir Raspberry Pi en ingebedde toestelle vervolmaak is.

Vinniggame speed · 0 (CPU only) VRAM Probeer dit

VITS

Ende- to-end sintesis Natuurlike prosoksie Vinnige inferensie Veelvuldige sprekers

Kondisie variasiese autoenkodeerder met adversariële leer vir einde-na-einde teks-na-spech.

Vinniggame speed · 1GB VRAM Probeer dit

MeloTTS

CPU-optimiseer MultilingualGenericName Veelvuldige aksente Produksie- gereed Lae laatkommery

Hoog-kwaliteit veeltalige teks-na-sech wat loop op Verwerker met minimale laatncy.

Vinniggame speed · 0.5GB (GPU optional) VRAM Probeer dit

Bark

Klankeffekte Laughing/hing Musiekgeslag 100+sprekers MultilingualGenericName

Transformeer-gebaseerde teks-na-audiomodel wat realistiese spraak, musiek en klank effekte voortbring.

Stadiggame speed · 5GB VRAM Probeer dit

Bark Small

Ligtegewig Vinniger as vol Bark Emosionele spraak MultilingualGenericName

Ligter weergawe van Bark met vinniger inferensie en laer geheuegebruik.

Medium · 2GB VRAM Probeer dit

CosyVoice 2

Stroomende Zero- kie kloning Kruis-ling Emosionele beheer Mens-pariteit

Alibaba se kalableging TTS met menslike-pariteit natuurlike en naby-nu-Letncy.

Dia TTS

Multi- Speaker Dialoog geslag Natuurlike afwisseling Emosionele uitdrukking 1.6B parameters

Multi- Conder dialoog model wat skep natuurlike gesprekke tussen sprekers.

Parler TTS

Stembeskrywing Natuurlike taalbeheer Buigbare stemskepping Geen voorafgestelde stemme benodig

Beskryf die stem wat jy in natuurlike taal wil hê en Paler genereer ooreenstemmende spraak.

Indic Parler TTS

11 Indiese tale Stembeskrywing Natuurlike taalbeheer Betroubare uitspraak

Hoog-kwaliteit spraak vir 8+ Indiese tale met natuurlike-taal stembeheer.

Stadiggame speed · 8GB VRAM Probeer dit

KhanomTan TTS

Thaise TTS Veelvuldige sprekers JouTTS-styl Kommonsie-veilige lisensie

Thai-eerste teks- to-seching met 'n keuse van luidspreker stemme.

Vinniggame speed · 2GB VRAM Probeer dit

IndexTTS-2

Emosionele beheer Nul-skoot Emosionele vektore Spreekwoord Fyngewortelde beheer

Nul-skoot TTS met fyngewortelde emosiebeheer en hoë uitdrukkings.

Spark TTS

Stem kloning Emosionele beheer Stylbeheer Por- based 5- second kloning

Stemkloning TTS met beheerbare emosie en spraakstyl deur middel van aansporings.

GPT-SoVITS

5- second kloning Sangstem Min- kie leer Hoë getrouheid Kruis-ling

Min-skoot stem kloning TTS wat enige stem van net 5 sekondes van oudio naboots.

Stadiggame speed · 6GB VRAM Probeer dit

Orpheus

Menslik-vlak emosie 100K ureoefening Natuurlike klem Spreekwoord

Mens-vlak emosionele TTS model opgelei op 100K ure se spraak data.

Chatterbox

Zero- kie kloning Emosionele beheer Hoë getrouheid Styl oorplasing Enkelmonster kloning

State-van-die-art nul-skoot stem kloning met emosie kontrole van Resemble-KI.

Tortoise TTS

Hoogste eienskap Multi- faxLanguage DALL-E- argitektuurComment Stem kloning Outoressief

Multi- fax- to-sech gefokus op kwaliteit met outoregressiewe argitektuur.

Stadiggame speed · 8GB VRAM Probeer dit

StyleTTS 2

Menslik-vlak Styl diffusie Verhalelike opleiding Natuurlike variasie Hoë getrouheid

Human-vlak teks-na-sech deur styl diffusie en adversariële opleiding.

OpenVoice

Onmiddellike kloning Stemomskakeling Emosionele beheer Aktiese beheer MultilingualGenericName

Onmiddellike stem kloning met granulêre beheer oor styl, emosie en aksent.

Qwen3 TTS

9 voorafgestelde stemme Stemontwerp uit teks Emosionele beheer 10 tale

Alibaba se veeltalige TTS met voorafgestelde stemme en stemontwerp uit teks.

Medium · 7GB VRAM Probeer dit

VieNeu-TTS-v2

7 voorafgestelde stemme (Noord + Suid- aksente) En-Vi kode-switching Stem kloning (3- 5s verwysing) Podcaste / multi- Sponser ondersteuning CPU- alleen Waltz nee GPU benodig

Viëtnamese + Engelse kode-switching TTS met 7 voorafgestelde stemme en nul-skoot stem kloning. Sve-net, nee GPU benodig.

Vinniggame speed · CPU VRAM Probeer dit

Sesame CSM

Gesprekvoerings Natuurlike tydsberekening Laaiïng van K- sterre... Terugkanaal 1B parameters

Gesprekvoeringsmodel skep natuurlike dialoog met gepaste tydsberekening en emosie.

Stadiggame speed · 8GB VRAM Probeer dit

Chatterbox Turbo

Sub- 200ms latency Paralinguistiese merkers 6x real-time Stem kloning Watermerking

Vinniger Chatterbox met sub-200m laatncy en paralinguistiese merkers vir lag, hoes, en nog meer.

Vinniggame speed · 2GB VRAM Probeer dit

VoxCPM

44. 1kHz-oudio Tokenizer-free Kruistuele kloning Konteks- aware Leoobject name (optional)

Tokenizer-free TTS produseer 44. 1kHz-oudio met konteks-aware paragraaf konsekwentheid.

Vinniggame speed · 4GB VRAM Probeer dit

Kani TTS 2

3GB VRAM Ultra-vinnig Ligtegewig NanoCodec Beskikbaar

Ultra-liggewig 400M Engelse TTS model wat loop in net 3GB VRAM.

Vinniggame speed · 3GB VRAM Probeer dit

OuteTTS

Sve inference Blaaier inferensie Veelvuldige agterkant Luidprofiele

LM-gebaseerde TTS wat op Sve, GPU, of blaaier via llama loop.cpp and Transformators.js.

Stadiggame speed · 2GB VRAM Probeer dit

VibeVoice

Multi- Speaker Tot 90 min Podcaste geslag Luidspreker konsekwentheid 200ms stroom

Microsoft model vir lang-vorm multi-praater inhoud soos pudcaste en oudioboeke.

Vinniggame speed · 4GB VRAM Probeer dit

Pocket TTS

100M parameters Sve inference Stem kloning Eenvoudige kloning Rand- gereed

Liggewig 100M parameter model deur Kujoetai met stem kloning van een monster.

Vinniggame speed · 1GB VRAM Probeer dit

Kitten TTS

Sve- alleen inference Onder 80mb modelgrootte 8 ingeboude stemme Spoedbeheer ONNX- based 24kHz

Ultra-liggewig TTS onder 80mb. Hardloop op SVE sonder GPU.

Vinniggame speed · 0GB VRAM Probeer dit

CosyVoice3

Bi- streaming Emosionele beheer Stem kloning Spoed/volumebeheer Instruksies:

Volgende geslag veeltalige TTS met bi-stroom, emosie beheer, en nul-kie stem kloning.

Vinniggame speed · 4GB VRAM Probeer dit

NAMAA Saudi TTS

Saoedi - Arabiese dialek Moderne Standaard Arabies Nul-kiestem kloning Emosionele beheer Plaaslike uitspraak

Eers open Saoedi-Arabies TTS. Indiaanse Saoediese dialek met Chaterbox-quarity stem kloning.

Medium · 6GB VRAM Probeer dit

Darwin TTS

Stem kloning Kruis-ling FFN-blended 4 hooftale Qwen3 ruggraat

Kruis-modal Qwen3-TTS-varing met FFN gewigs vermeng van die Qwen3- 1. 7B-taal model vir skerper veeltalige kloning.

Medium · 7GB VRAM Probeer dit

MOSS-TTSD

Multi- Speaker dialoog Tot 5 sprekers 60min samehangende oudio Stem kloning MooreCity in Quebec Canada

Multi- Consion- Contraction model verbly cacated- style gesprekke met tot 5 sprekers en 60 minute van samehangende oudio.

Medium · 12GB VRAM Probeer dit

Ming-Omni TTS

44. 1kHz Stem kloning Emosionele beheer Diaktuurbeheer BGM-geslag Kompakteer Alle Gidse

Kompak 0,5B omni-modale spraakmodel van ingesluiteAI met hoë-deloosheid 44.1kHz afvoer en zero-kie stem kloning.

Medium · 3GB VRAM Probeer dit

MOSS-TTS Nano