ነጻ AI ጽሑፉን ወደ ንግግር ለውጥ

82M ፐራሜትሮች በጣም ፈጣን ድምጾች ብዙ ቋንቋዎች ስትሪሚንግ

ቀላል 82M ፓራሜትር ሞዴል ስቱዲዮ-ጥራት ንግግር ጋር ፈጣን-ፍጥነት ውጤት ይሰጣል.

ቀጥ ያለ · 1.5GB VRAM ይሞክሩት

Piper

CPU-friendly መስመር ውጭ ድምጾች ቋንቋዎች የSSML ድጋፍ

የራስቤሪ ፓይ እና የተቀመጡ መሣሪያዎች ለሚጠቀሙበት የፍጥነት፣ የከተማ ነርቭ ጽሑፍ ወደ ንግግር ስርዓት

ቀጥ ያለ · 0 (CPU only) VRAM ይሞክሩት

VITS

መጨረሻ-ወደ-መጨረሻ ማቀነባበሪያ የቋንቋ ችሎታ የፍጥነት ማጣቀሻ ብዙ ተናጋሪዎች

የመጨረሻ-ወደ-መጨረሻ ጽሑፍ-ወደ-ንግግር ለመማር አቻ መማር ጋር ሁኔታዊ የልዩነት አውቶማቲክ ኮድ

ቀጥ ያለ · 1GB VRAM ይሞክሩት

MeloTTS

CPU-የተሻሻለ ብዙ ቋንቋዎች ብዙ አንቀጾች ምርት-ዘጋጅ ዝቅተኛ

ከፍተኛ ጥራት ያለው የብዙ ቋንቋ ጽሑፍ-ወደ-ንግግር በ CPU ላይ በጥቂት ጊዜ ውስጥ የሚሰራ ነው.

ቀጥ ያለ · 0.5GB (GPU optional) VRAM ይሞክሩት

Bark

የድምፅ ውጤቶች የሚስቅ/የሚጨነቅ የሙዚቃ ምርጫዎች ተናጋሪ ብዙ ቋንቋዎች

የትራንስፎርመር የተመሠረተ ጽሑፍ-ወደ-ኦዲዮ ሞዴል እውነተኛ ንግግር፣ ሙዚቃ፣ እና የድምፅ ውጤቶችን የሚያመነጭ ነው።

ቀስ በቀስ · 5GB VRAM ይሞክሩት

Bark Small

ቀላል ከሙሉ በርክ ይልቅ ፈጣን ስሜታዊ ንግግር ብዙ ቋንቋዎች

የባርክ ቀላል ስሪት በፍጥነት ማረጋገጫ እና ዝቅተኛ የማስታወሻ ጥቅም

መሀከል · 2GB VRAM ይሞክሩት

CosyVoice 2

ስትሪሚንግ ሺል-ሾት ክሎኒንግ ቋንቋ፦ (_L) ስሜት መቆጣጠር የሰው-አስተሳሰብ

የአሊባባ የሰው-አማካይ ተፈጥሮአዊነት እና የዝቅተኛ-ዝቅተኛነት የጨዋታ TTS

Dia TTS

ብዙ-ተናጋሪ የመደቡን ብዛት ቀጥ አድርግ የስነልቦና መግለጫ 1.6B ፐራሜትሮች

በብዙ ተናጋሪዎች መካከል ተፈጥሯዊ ውይይቶችን የሚፈጥር የዳታ ግራፊክ ሞዴል

Parler TTS

የድምፅ መግለጫ የቋንቋ ቁጥጥር የድምፅ መፍጠር የቀድሞው ድምፅ

የሚፈልጉትን ድምፅ በነፃ ቋንቋ ግለጹና ፓርለር የሚስማማውን ንግግር ያወጣል

Indic Parler TTS

የህንድ ቋንቋዎች የድምፅ መግለጫ የቋንቋ ቁጥጥር የሐሰት የህንድ ቃል

የከፍተኛ ጥራት ንግግር ለ 8+ የህንድ ቋንቋዎች በነፃ ቋንቋ የድምፅ ቁጥጥር

ቀስ በቀስ · 8GB VRAM ይሞክሩት

KhanomTan TTS

ታይላንድኛ ብዙ ተናጋሪዎች የእርስዎ TTS አርክቴክቸር የኮሜርሲ-ደህንነት ፈቃድ

ታይኛ-መጀመሪያ ጽሑፍ-ወደ-ንግግር የንግግር ድምፆች ምርጫ ጋር

ቀጥ ያለ · 2GB VRAM ይሞክሩት

IndexTTS-2

ፍላጎት ሺል-ሾት ቪክቶሮች አቀማመጥ መቆጣጠሪያ

0-shot TTS በጥሩ-ግሬን ፍላጎት ቁጥጥር እና ከፍተኛ መግለጫነት.

Spark TTS

የድምፅ ቅጂ ስሜት መቆጣጠር የቅርጽ ምርጫዎች የፕሮምፕ-መሠረት 5 ሰከንዶች

የድምፅ ክሎኒንግ TTS የተቆጣጠረ ስሜት እና የመናገር ዘይቤ በመጠየቅ.

GPT-SoVITS

5 ሰከንዶች የድምፅ ድምፅ ጥቂት-አስማት መማር ከፍተኛ ቋንቋ

የድምፅ ምትክ TTS ከ5 ሰከንዶች ብቻ የድምፅ ድምፅን የሚቀይር

ቀስ በቀስ · 6GB VRAM ይሞክሩት

Orpheus

የሰው ደረጃ ስሜት ሰዓት አቀማመጥ አቀማመጥ

የሰው ደረጃ የስነ-ልቦና TTS ሞዴል በ 100K ሰዓታት የንግግር መረጃዎች ላይ የተጠናቀቀ ነው።

Chatterbox

0-shot ክሎኒንግ ፍላጎት ከፍተኛ የቅርጽ ዓይነት አንድ ቅጂ

የቅርብ ጊዜውን የድምፅ ክሎኒንግ ከ Resemble AI ጋር

Tortoise TTS

ከፍተኛ ጥራት ብዙ-ድምፅ DALL-E አርክቴክቸር የድምፅ ቅጂ በራሱ

የብዙ-ድምፅ ጽሑፍ-ወደ-ንግግር በጥራት ላይ ያተኮረ በራስ-መለወጥ አርክቴክቸር.

ቀስ በቀስ · 8GB VRAM ይሞክሩት

StyleTTS 2

የሰው ደረጃ የሥልጠና ርዕስ መተላለፊያ የተለመደው ለውጥ ከፍተኛ

የሰው ደረጃ ጽሑፍ-ወደ-ንግግር በሥነ-ጥበብ መሰራጨት እና ተቃራኒ ስልጠናዎች

OpenVoice

ቀጥተኛ ክሎኒንግ የድምፅ መለወጫ ፍላጎት የፊደል ቅርጽ ቁጥጥር ብዙ ቋንቋዎች

የድምፅ ክሎኒንግ በቅርጽ፣ በፍላጎትና በድምፅ ላይ በጥልቀት መቆጣጠር

Qwen3 TTS

ድምጾች የድምፅ ዲዛይን ከጽሑፍ ፍላጎት ቋንቋዎች

የአሊባባ የብዙ ቋንቋ TTS ከጽሑፍ ጋር የተቀመጡ ድምጾች እና የድምፅ ዲዛይን

መሀከል · 7GB VRAM ይሞክሩት

VieNeu-TTS-v2

7 ቀደም ሲል የተቀመጡ ድምጾች (የምዕራብ + ደቡብ አቀማመጦች) ቪዲዮ የድምፅ ክሎኒንግ (3-5s ማነሻ) የፖድካስት / የብዙ-ተናጋሪ ድጋፍ CPU ብቻ - GPU አይጠበቅም

ቪዬትናምኛ + እንግሊዝኛ ኮድ-ማስተካከል TTS ጋር 7 ቀድሞ የተሰረዙ ድምጾች እና zero-shot የድምፅ ክሎኒንግ. CPU- ብቻ, ምንም GPU ያስፈልጋል.

ቀጥ ያለ · CPU VRAM ይሞክሩት

Sesame CSM

ቻይንኛ የተለመደው ሰዓት ዙር የቀድሞው ጣቢያ 1B ፐራሜትሮች

የንግግር ሞዴል በበቂ ጊዜና ስሜት የተፈጥሮ ውይይት የሚያመነጭ

ቀስ በቀስ · 8GB VRAM ይሞክሩት

Chatterbox Turbo

200ms ታች የቋንቋ ምልክቶች 6x እውነተኛ ጊዜ የድምፅ ቅጂ የዋሽንግተን

የፍጥነት ቻተርቦክስ ከ200 ሚሊሴኮንዶች ኋላቀርነት እና ለቁጭት፣ ለጉንፋን እና ለሌሎችም የቋንቋ ምልክቶች ጋር

ቀጥ ያለ · 2GB VRAM ይሞክሩት

VoxCPM

ድምፅ ቶኬኒዘር-ነጻ ቋንቋ፦ የቀን መቁጠሪያ አሳይ LoRA ጥሩ-መቆጣጠር

Tokenizer-free TTS producing 44.1kHz audio with context-aware paragraph consistency

ቀጥ ያለ · 4GB VRAM ይሞክሩት

Kani TTS 2

3GB VRAM በጣም ፈጣን ቀላል ኮዴክ ነጻ

400 ሚሊዮን ዩሮ የጀርመን TTS ሞዴል በ3 ጊባ VRAM ብቻ የሚሰራ ነው።

ቀጥ ያለ · 3GB VRAM ይሞክሩት

OuteTTS

CPU መተላለፊያ የባሕርይ መቃኘት ብዙ ባንዶች የድምፅ ፕሮፊል

LLM-based TTS በ CPU, GPU, ወይም በ lama.cpp እና Transformers.js በኩል በብራውዘር ላይ የሚሰራ

ቀስ በቀስ · 2GB VRAM ይሞክሩት

VibeVoice

ብዙ-ተናጋሪ እስከ 90 ደቂቃዎች የፖድካስት መፍጠር የድምፅ አሰጣጥ 200 ሚሊ ሴኮንድ

ማይክሮሶፍት ሞዴል ለረጅም ቅርጽ ብዙ-ተናጋሪ ይዘት እንደ ፖድካስቶች እና የድምፅ መጽሐፍት.

ቀጥ ያለ · 4GB VRAM ይሞክሩት

Pocket TTS

100M ፐራሜትሮች CPU መተላለፊያ የድምፅ ቅጂ አንድ-ምሳሌ ክሎኒንግ ጫፍ-ዘጋጅ

የኪዩታይ ቀላል 100M ፐራሜትር ሞዴል ከአንድ ምሳሌ የድምፅ ክሎኒንግ ጋር

ቀጥ ያለ · 1GB VRAM ይሞክሩት

Kitten TTS

CPU- ብቻ ከ80MB በታች የሞዴል መጠን ድምጾች የፍጥነት ቁጥጥር ONNX-መሠረት 24kHz ውጤት

80 ሜባ በታች የሆኑ ቀላል TTSዎች. CPU ሳይኖር GPU ላይ ይሠራል።

ቀጥ ያለ · 0GB VRAM ይሞክሩት

CosyVoice3

ብልጭታ ፍላጎት የድምፅ ቅጂ የፍጥነት/ድምፅ መጠን መቆጣጠሪያ መመሪያ

የወደፊቱ ትውልድ የብዙ ቋንቋ TTS በሁለት-streaming, ስሜት ቁጥጥር, እና zero-shot የድምፅ ክሎኒንግ ጋር.

ቀጥ ያለ · 4GB VRAM ይሞክሩት

NAMAA Saudi TTS

ሳዑዲኛ የዘመናዊ ዐረብኛ የድምፅ ክሎኒንግ ፍላጎት የቋንቋ መግለጫ

የመጀመሪያው የቀረበው የሳዑዲ-ዐረብኛ TTS. የሳዑዲ ቋንቋ በቻተርቦክስ-ጥራት የድምፅ ክሎኒንግ ጋር

መሀከል · 6GB VRAM ይሞክሩት

Darwin TTS

የድምፅ ቅጂ ቋንቋ ፋይል (_F) ቋንቋዎች የQwen3 ኋላፊ

የQwen3-1.7B ቋንቋ ሞዴል ከ FFN ክብደት ጋር የተቀላቀለ የQwen3-TTS ልዩነት ለብዙ ቋንቋዎች ክሎኒንግ

መሀከል · 7GB VRAM ይሞክሩት

MOSS-TTSD

የብዙ-ተናጋሪ ማያያዣ እስከ 5 ተናጋሪዎች 60min ተከታታይ ድምፅ የድምፅ ቅጂ የፖድካስት ምርጫዎች

የብዙ-ተናጋሪ ውይይት የቀጠለ ሞዴል - እስከ 5 ተናጋሪዎች እና 60 ደቂቃዎች የሚጠበቅ የድምፅ ድምፅ ያላቸው የፖድካስት-ስርዓት ውይይቶችን ይፈጥሩ.

መሀከል · 12GB VRAM ይሞክሩት

Ming-Omni TTS

44.1kHz ውጤት የድምፅ ቅጂ ፍላጎት የቋንቋ መቆጣጠሪያ የBGM ፍጥነት ቅርበት 0.5B

ከinclusionAI ጋር የ 0.5B ኦምኒ-ሞዳል ንግግር ሞዴል ከከፍተኛ ፍቅር 44.1kHz ምርት እና zero-shot የድምፅ ክሎኒንግ ጋር.

መሀከል · 3GB VRAM ይሞክሩት

MOSS-TTS Nano