ነጻ AI ጽሑፉን ወደ ንግግር ለውጥ
20+ ክፍት ምንጭ ሞዴሎች, 107+ ድምጾች 32+ ቋንቋዎች.
ለድምፅ AI የሚያስፈልግዎ ሁሉ
30+ መሣሪያዎች በነጻ ምንጭ AI ሞዴሎች የተገነቡ
20+ የድምፅ ሞዴሎች
በአንድ መድረክ ውስጥ የ TTS ሞዴሎችን በጣም የተሟላ ስብስብ
Kokoro Free
ኮኮሮ 82 ሚሊዮን ፓራሜትሮች ያለው የጽሑፍ-ወደ-ንግግር ሞዴል ሲሆን ከክብደቱ ክፍል በበለጠ ጥሩ ውጤት ያሳያል። በትንሹ መጠንም ቢሆን፣ አስደናቂ የሆነ ተፈጥሯዊና ግልጽ የሆነ ንግግር ያቀርባል። ኮኮሮ ብዙ ቋንቋዎችን ይደግፋል - እንግሊዝኛ፣ ጃፓንኛ፣ ቻይንኛ፣ እና ኮሪያን ጨምሮ በተለያዩ ግልጽ የሆኑ ድምጾች። በጣም ፈጣን ነው - በጂፒዩ ላይ ከውጤታማ ጊዜ 100x ፈጣን የሆነ ድምፅን ያወጣል።
ምርጥ ለ: ከፍተኛ ጥራት ያለው TTS በጥቂት ጊዜ ውስጥ, የዥረት ፕሮግራሞች
ነጻ ይሞክሩ
Piper Free
ፒፐር በራሳስፒ የተፈጠረ ቀላል የጽሑፍ-ወደ-ንግግር ማሽን ነው VITS እና ላርኒክስ አርክቴክቸሮችን የሚጠቀም. በሙሉ በሲፒዩ ላይ ይሠራል ፣ ለ Edge መሣሪያዎች ፣ ለቤት አውቶማቲክስ ፣ እና ለኦፍላይን TTS የሚያስፈልጉ ፕሮግራሞች ተስማሚ ያደርገዋል. በ 30+ ቋንቋዎች ውስጥ ከ 100 በላይ ድምጾች ፣ ፒፐር በራስቤሪ ፒ 4 ላይም ቢሆን በፍጥነት ጊዜ ውስጥ ተፈጥሯዊ የሆነ ንግግር ይሰጣል ፡፡
ምርጥ ለ: የቅርብ ጊዜ ቅድመ ዕይታዎች፣ አቅላይነት፣ እና የተካተቱ ፕሮግራሞች
ነጻ ይሞክሩ
VITS Free
VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) ከቀድሞው የሁለት-ደረጃ ሞዴሎች ይልቅ የበለጠ ተፈጥሯዊ የሆነ ድምፅ የሚፈጥር ተመሳሳይ የመጨረሻ-ወደ-መጨረሻ TTS ዘዴ ነው. በተፈጥሯዊነት ውስጥ ትልቅ ማሻሻያ ለማግኘት በተፈጥሯዊ ፍሰቶች እና በተቃራኒው የልምምድ ሂደት የተጨመረውን የልዩነት ውጤትን ይቀበላል.
ምርጥ ለ: የጽሑፍ-ወደ-ንግግር
ነጻ ይሞክሩ
MeloTTS Free
MeloTTS በ MyShell.ai የብዙ ቋንቋ TTS መጻሕፍት አንግሊዝኛ (አሜሪካዊ, ብሪታኒያ, ህንድ, አውስትራሊያ), ስፓኒሽ, ፈረንሳይኛ, ቻይንኛ, ጃፓንኛ, እና ኮሪያኛ የሚደግፍ ነው. ይህ በጣም ፈጣን ነው, ጽሑፍ በቅርብ የጊዜ ፍጥነት በ CPU ብቻ ላይ ማቀናጀት. MeloTTS ለ ምርት ጥቅም የተቀየሰ ነው እና CPU እና GPU ውጤት የሚደግፍ ነው.
ምርጥ ለ: ምርት ፕሮግራሞች ፈጣን, ብዙ ቋንቋዎች TTS ያስፈልጋሉ
ነጻ ይሞክሩ
Bark Standard
የትራንስፎርመር የተመሠረተ ጽሑፍ-ወደ-ኦዲዮ ሞዴል እውነተኛ ንግግር፣ ሙዚቃ፣ እና የድምፅ ውጤቶችን የሚያመነጭ ነው።
አዘጋጅ፦ Suno · ፈቃድ፦ MIT
ይሞክሩት
CosyVoice 2 Standard
አሊባባ's scaleable streaming TTS with human-parity naturalness and near-zero latency.
አዘጋጅ፦ Alibaba (Tongyi Lab) · ፈቃድ፦ Apache 2.0
ይሞክሩት
Dia TTS Standard
በብዙ ተናጋሪዎች መካከል ተፈጥሯዊ ውይይቶችን የሚፈጥረው የብዙ ተናጋሪ የዳያሎግ ማምረት ሞዴል
አዘጋጅ፦ Nari Labs · ፈቃድ፦ Apache 2.0
ይሞክሩት
Parler TTS Standard
የሚፈልጉትን ድምፅ በነፃ ቋንቋ ግለጹና ፓርለር የሚስማማውን ንግግር ያወጣል
አዘጋጅ፦ Hugging Face · ፈቃድ፦ Apache 2.0
ይሞክሩት
GLM-TTS Standard
የ TTS ሞዴሎችን በነጻ ምንጭ መካከል ዝቅተኛውን የፊደል ስህተት መጠን ያገኛል
አዘጋጅ፦ Zhipu AI · ፈቃድ፦ GLM-4 License
ይሞክሩት
IndexTTS-2 Standard
0-shot TTS በጥሩ-ግሬን ፍላጎት ቁጥጥር እና ከፍተኛ መግለጫነት.
አዘጋጅ፦ Index Team · ፈቃድ፦ Bilibili Model License
ይሞክሩት
Spark TTS Standard
የድምፅ ክሎኒንግ TTS የተቆጣጠረ ስሜት እና የመናገር ዘይቤ በመጠየቅ.
አዘጋጅ፦ SparkAudio · ፈቃድ፦ CC BY-NC-SA 4.0
ይሞክሩት
Orpheus Standard
የሰው ደረጃ የስነ-ልቦና TTS ሞዴል በ 100K ሰዓታት የንግግር መረጃዎች ላይ የተጠናቀቀ ነው።
አዘጋጅ፦ Canopy Labs · ፈቃድ፦ Llama 3.2 Community
ይሞክሩት
Qwen3 TTS Standard
የአሊባባ የብዙ ቋንቋዎች TTS የድምፅ ክሎኒንግ, ቀድሞ የተቀመጡ ድምጾች, እና የድምፅ ዲዛይን ከጽሑፍ ጋር.
አዘጋጅ፦ Alibaba (Qwen) · ፈቃድ፦ Apache 2.0
ይሞክሩት
CosyVoice 2
አሊባባ's scaleable streaming TTS with human-parity naturalness and near-zero latency.
ቋንቋዎች፦ en, zh, ja, ko, fr, de, it, es
የድምፅ ፋይል
OpenVoice
ቀስ በቀስ የድምፅ ክሎኒንግ ላይ ቅርፅ, ስሜት, እና accent ጋር granular ቁጥጥር.
ቋንቋዎች፦ en, zh, ja, ko, fr, de, es, it
የድምፅ ፋይል
Qwen3 TTS
የአሊባባ የብዙ ቋንቋዎች TTS የድምፅ ክሎኒንግ, ቀድሞ የተቀመጡ ድምጾች, እና የድምፅ ዲዛይን ከጽሑፍ ጋር.
ቋንቋዎች፦ en, zh, ja, ko, de, fr, ru, pt, es, it
የድምፅ ፋይልየዲቨሎፐር-መጀመሪያ API
OpenAI-ተኳሃኝ REST API. አንድ መጨረሻ ነጥብ, 22+ ሞዴሎች. ለ እውነተኛ ጊዜ ፕሮግራሞች ስትሪሚንግ ድጋፍ.
- ፋይል (_F)
- ለወቅታዊ ፕሮግራሞች TTS ማስተላለፍ
- ለታላላቅ ስራዎች የቡት ሂደት
- የዌብሆክ ማስታወቂያዎች
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ቀላል, ግልጽ ዋጋ
ነጻ ይጀምሩ. እንደምትጨምሩ መጠን ይጨምሩ.