ఫ్రీ ఎI మాట్లాడటానికి వచనం

82M పారామితులు ఈల్ట్రా- ఫార్ము శ. పూ. మల్టీగల్ స్ట్రీమింగ్ మద్దతు

లైట్ 82M పారామితి మెట్టు, స్റ്റുడియో- స్థిరమైన సంభాషణను ఉద్భవింపజేసే Frant-fast-place- inference తో.

వేగము · 1.5GB VRAM ప్రయత్నించు

Piper

సిపియు- స్నేహపూర్వక ఆఫ్‌లైన్ సామర్థ్యంగల 100+ శబ్దాలుName 35+ భాషలుName SSML మద్దతు

ప్రఖ్యాత స్మారకచిహ్నాన్ని ప్రయోగించే ప్రిన్సిపియర్స్‌ మ్యూజిక్‌ మ్యూజిక్‌ రీసెర్చ్‌ మ్యూజిక్‌ రీసెర్చ్‌ మ్యూజియల్‌ మ్యూజిక్‌.

వేగము · 0 (CPU only) VRAM ప్రయత్నించు

VITS

చివరి- ముగింపు సినిసాలిస్ సహజ ప్రయొజనం వేగవంతమైన బహుళ స్పీకర్లు

వ్యవహార పరిసర స్వీయ ఎన్కోడర్ తో ముగింపు నుండి ముగింపు పాఠము కొరకు విద్యాభ్యాసం.

వేగము · 1GB VRAM ప్రయత్నించు

MeloTTS

సిపియు- నిర్ధిష్టం మల్టీగల్ బహుళ యాక్సెస్ అభివృద్ది-సిద్ధ తక్కువ లావుగా

సాధారణ సంవిధానంతో CPU న నడుస్తున్న ఎక్కువ స్పెషల్ గ్రీక్ పాఠ్యము- నుండి పదాలు లోకి.

వేగము · 0.5GB (GPU optional) VRAM ప్రయత్నించు

Bark

ధ్వని ప్రభావాలు నవ్వు/ ఉత్పన్నం సంగీత తయారీName 100+ ప్రసంగీకులు మల్టీగల్

వాస్తవ భాష, సంగీతం, సౌండ్ ప్రభావాలు ఉత్పన్నం చేసే వచన ఆధారిత టెక్స్‌చర్‌- ఎడిటివో మోడల్.

నెమ్మదిగా · 5GB VRAM ప్రయత్నించు

Bark Small

కొద్దిగా బరువు పూర్తి బర్క్ కంటే వేగము భావోద్వేగంతో మాట్లాడండి మల్టీగల్

వేగవంతమైన మరియు తక్కువ మెమరీ వుపయోగంతో బార్కె యొక్క లైటర్ వర్షన్.

మీడియం · 2GB VRAM ప్రయత్నించు

CosyVoice 2

స్ట్రీమింగ్ Zero- should Thise సైక్లొ-నడుమ ఇమ్యూజిక్ నియంత్రణ మానవ పారిశుభం

Alibba యొక్క scapting TTS సంపత్తి మానవ సహజ మరియు సమీపమైన మరియు దగ్గరగా-తొలెంట్సీ.

Dia TTS

బహుళ- స్పీకర్ డైలాగ్ వుద్భవంComment సహజ స్థూలన్ ఔట్ భావోద్వేగపరమైన వ్యక్తీకరణ 160B పారామితిలు

చాలా- సంప్రదింపు డైలాగ్ వుద్భవం ప్రసంగీకులు మధ్య సహజ సంభాషణలను ఉత్పత్తి ఇది. Name

Parler TTS

స్వర వివరణ సహజ భాష నియంత్రణ మలుచుకోదగిన స్వర సృష్టి ముందెత్తబడిన శబ్దములు అవసరంలేదు

మీరు ప్రకృతి భాషలో కావాలనుకుంటున్న స్వరం మరియు పార్పర్‌ సరిపోలిన సంభాషణను ఉత్పన్నం చేయండి.

Indic Parler TTS

11 భారతీయ భాషలు స్వర వివరణ సహజ భాష నియంత్రణ సరైన ఇండెటిక్‌ ఉచ్ఛారణ

స్వాభావిక పద నియంత్రణతో 8+ ఇండియన్ భాషల హైకాన్ భాష. Name

నెమ్మదిగా · 8GB VRAM ప్రయత్నించు

KhanomTan TTS

థాయ్‌టివ్‌ బహుళ స్పీకర్లు మీTTS నిర్మాణం వినియోగదారుడు- సురక్షిత లైసెన్స్

స్పీకర్లు ఎంపిక తో తదుపరి-మొదటి పాఠము-చిహ్నాలు.

వేగము · 2GB VRAM ప్రయత్నించు

IndexTTS-2

ఇమ్యూజిక్ నియంత్రణ జోరో- చైల్డ్ ఎగ్జిక్యూటివ్ వెక్టార్లు ఉదాహరించదగిన మాటలు ఫైన్-గ్రేడ్ నియంత్రణ

జరిమానా-shoo-హోట్ TS మంచి-తెరపిన భావోద్వేగ నియంత్రణ మరియు అధిక స్పృహ.

Spark TTS

స్వరం ఇమ్యూజిక్ నియంత్రణ శైలి నియంత్రణ ప్రాధాన్య ఆధారిత 5 రెండవ క్రొయెల్

స్పీకర్‌ డిజైన్‌లు, స్పెషల్‌లు

GPT-SoVITS

5 రెండవ క్రొయెల్ పాటని పాడటం కొద్దిగా-hot నేర్చుకోవడం అధిక విశ్వసనీయత సైక్లొ-నడుమ

కేవలం 5 సెకన్ల నుండి ఏ స్వరం ప్రసారం క్లోనింగ్ టీట్స్ కొద్దిగా.

నెమ్మదిగా · 6GB VRAM ప్రయత్నించు

Orpheus

మానవ స్థాయి భావోద్వేగాలు 100K గంటల శిక్షణ సహజ ప్రాముఖ్యత ఉదాహరించదగిన మాటలు

మానవ స్థాయి భావోద్వేగ TTS మోడల్ 100K ప్రసంగపు దత్తాంశం న శిక్షణ.

Chatterbox

Zero- should Thise ఇమ్యూజిక్ నియంత్రణ అధిక విశ్వసనీయత స్టైల్ బదిలీకరణ ఒంటరి మాదిరి క్రొయెల్

స్టేట్-ఆర్టీ-హోమ్ స్వరం రెస్మింగ్ AI భావోద్వేగ నియంత్రణ తో.

Tortoise TTS

అత్యధిక నాణ్యత బహుళ- ప్రెసిషన్ DALL- EE కట్టడం స్వరం దానంతటదే ఆకర్షణ

Multi-trus-tale-tap-Sublication భవనం తో నాణ్యతపై దృష్టి కేంద్రీకరించబడింది.

నెమ్మదిగా · 8GB VRAM ప్రయత్నించు

StyleTTS 2

మానవ స్థాయి స్టైల్ ఫేడ్ సరైన తర్ఫీదు సహజ మార్పు అధిక విశ్వసనీయత

శైలి ఫాలోరన్ ద్వారా హ్యూమన్ స్థాయి పాఠం-ఉపయోగం

OpenVoice

అప్పటికప్పుడు కన్సోలర్ వాయిస్ మార్పిడి ఇమ్యూజిక్ నియంత్రణ ధృవీకరణ నియంత్రణ మల్టీగల్

కన్పించే స్వరం, శైలి, భావోద్వేగం, ఉచ్చారణలపై గీరింగ్‌ను నిటారుగా ఉంచుతుంది.

Qwen3 TTS

9 ముందుశబ్దమైన ధ్వనులు పాఠము నుండి స్వర రూపం ఇమ్యూజిక్ నియంత్రణ 10 భాషల్లో

మెటాడేటా నుండి స్వరం మరియు స్వర రూపం తో అలైబా యొక్క బహుభాషా TTS

మీడియం · 7GB VRAM ప్రయత్నించు

VieNeu-TTS-v2

7 ముందు ఏర్పాటు చేసిన స్వరాలు (NOT + దక్షిణ ఉచ్ఛారణలు) ఎన్వి-వి కోడ్-విదీకరణ స్వరం క్లోనింగ్ (3- 5 లు) NAME OF TRANSLATORS పోడ్‌కాస్ట్ / బహుళ- స్పీకర్ మద్దతు సిపియు- మాత్రమే — కాదు GPU అవసరం

వియత్నామీస్ + ఇంగ్లీష్ కోడ్-విడ్ TTS ప్రస్థుత ధ్వనులు మరియు సున్నితమైన ధ్వనులు. CPU- మాత్రమే, అవసరం లేదు.

వేగము · CPU VRAM ప్రయత్నించు

Sesame CSM

సంభాషణ సహజ సమయపరిస్థితి (r) రీఫ్రెష్- నడుపు వెనుకchannel 1B పారామితులు

ఆ మాటల భావమేమిటో గ్రహించడానికి అవి మనకు సహాయం చేస్తాయి.

నెమ్మదిగా · 8GB VRAM ప్రయత్నించు

Chatterbox Turbo

వుప- 2000ల లాటికెన్సి పుటలీకరణ టాగ్స్KCharselect unicode block name 6x నిజమైన- సమయం స్వరం వాటర్‌మార్కింగ్

. ఉప-20stency మరియు పారామిలిటి రికార్‍డ్ టాగ్స్. నవ్వులు, దగ్గులు మరియు ఎక్కువ.

వేగము · 2GB VRAM ప్రయత్నించు

VoxCPM

44.1khz ఆడియో టోకెన్జర్- ఫ్రీName సైక్లొ-నడుమ క్సైన్ సందర్భం- అభివృద్ది లోరే మంచి- ఇన్సింగ్

TTS ప్రసార పదకోశం తో 44.1kHz ఆడియోను ఉత్పత్తి చేసే TTS.

వేగము · 4GB VRAM ప్రయత్నించు

Kani TTS 2

3GRRAM ఈల్ట్రా- ఫార్ము కొద్దిగా బరువు నానోConfig ఖాళీ

అట్ట్రా-వెర్షన్ 400M ఇంగ్లీష్ TTS మోడల్ కేవలం 3GB VRAM లో నడుస్తున్న.

వేగము · 3GB VRAM ప్రయత్నించు

OuteTTS

సిపియు ఎగ్జిక్యూటిComment విహరిణిని అన్‌థీమ్ బహుళ బ్యాకెండ్‍స్ స్పీకర్ ప్రొఫైల్సు

LLM- ఆధారిత TTS, CPU, లేదా Lamap.cpp మరియు బదలాయింపుల ద్వారా నడుస్తున్నది.

నెమ్మదిగా · 2GB VRAM ప్రయత్నించు

VibeVoice

బహుళ- స్పీకర్ బరువు 90 ని పోడ్‌కాస్ట్ తరం స్పీకర్ సారూప్యత 200 ms స్ట్రీమింగ్

పోడ్‌కాస్ట్ మరియు ఆడియోపుస్తకాల వంటి బహుళ- స్పీకర్ సారముల కొరకు మైక్రోసాఫ్ట్ మోడ్.

వేగము · 4GB VRAM ప్రయత్నించు

Pocket TTS

100M పారామితిలు సిపియు ఎగ్జిక్యూటిComment స్వరం ఒక్-సాంప్రిల్ సిరాల్ అంచు-సిద్ధి

ఒక మాదిరి నుండి స్వరం క్యుటుయి ద్వారా లైట్ 100M పారామితి మోడల్.

వేగము · 1GB VRAM ప్రయత్నించు

Kitten TTS

సిపియు- మాత్రమే ఆకృతి 80MB లో మాదిరి పరిమాణము 8 నిర్మిత స్వరాలు వేగ నియంత్రణ ONX ఆధారిత 24kHz అవుట్పుట్

80MB కింద అంత తేలికైన TTS. GPU లేకుండా CPU నడుపుతుంది.

వేగము · 0GB VRAM ప్రయత్నించు

CosyVoice3

బై- స్ట్రీమింగ్ ఇమ్యూజిక్ నియంత్రణ స్వరం వేగము/వోల్యుమ్ కంట్రోల్ క్రింది ఆదేశం

తదుపరి-సమయ TTS BITS, భావోద్వేగ నియంత్రణ, మరియు సున్నా-Status వాయిస్.

వేగము · 4GB VRAM ప్రయత్నించు

NAMAA Saudi TTS

సౌదీ అరబిక్ మానిష్Name ఆధునిక ప్రామాణిక అరబిక్‌ జోరో-పట్టు స్వరం క్లోనింగ్ ఇమ్యూజిక్ నియంత్రణ స్వాభావిక ఉచ్ఛారణ

మొదటి ఓపెన్ సౌదీ-అరేబిక్ TTS. చాటర్బాక్స్-సమస్య స్వరం క్లోనింగ్ తో సౌత్ సౌత్ మాండ.

మీడియం · 6GB VRAM ప్రయత్నించు

Darwin TTS

స్వరం సైక్లొ-నడుమ ఎఫ్ ఎఫ్ ఎన్- ప్రొఫైడ్Query 4 ప్రధాన భాషలు క్యువెన్ 3 బెడ్

క్రాస్-మోదల్ క్వాన్ క్విన్-TTS variant FFN పందెం పందెం సమ్మిళిత గ్రీక్ పదకోశం కోసం Gean3-7B భాష మోడల్ నుండి మిషన్.

మీడియం · 7GB VRAM ప్రయత్నించు

MOSS-TTSD

బహుళ- స్పీకర్ డైలాగ్ 5 ప్రసంగీకులకు 60 మినిట్ రికార్‍డ్ ఆడియో స్వరం పోడ్‌కాస్ట్-ప్రత్యయత

బహుళ- స్పీకర్ డైలాగ్ మోడల్ మోడల్ — 5 ప్రసంగీకులు వరకు మరియు 60 నిమిషాల కాంట్రాస్ట్ ఆడియోతో పోడ్‌కాస్ట్- శైలి సంభాషణలను సృష్టిస్తుంది.

మీడియం · 12GB VRAM ప్రయత్నించు

Ming-Omni TTS

44.1kHz అవుట్పుట్ స్వరం ఇమ్యూజిక్ నియంత్రణ సమాచార నియంత్రణ BGM వుద్భవము కాంపౌండ్ 0. 5B

Compact 0. 5B memne-madeatial Stencils నుండి brasero-fidedefault 44.1kz మరియు సున్నా- show- shoult strings లాంచర్.

మీడియం · 3GB VRAM ప్రయత్నించు

MOSS-TTS Nano