Baker (Chinese)
Baker (Chinese) በVITS ጽሑፍ-ወደ-ንግግር ሞዴል የተደገፈ የ neutral AI ድምፅ ነው. ይህ ነጻ ድምፅ ቻይንኛ ይናገራል እና ጥሩ-quality የንግግር ማቀነባበሪያን ይሰጣል. በ ቅርበት-ጊዜ የፍጥነት ፍጥነት እና በ 3/5 ጥራት ደረጃ Baker (Chinese) ለ general-purpose text-to-speech with natural prosody ተስማሚ ነው የ VITS ማሽን በ Jaehyeon Kim et al. under the MIT license የተገነባ ሲሆን ለኮሜርሺያል ጥቅም ደህንነቱ የተጠበቀ ነው። የዋና ችሎታዎችን ያካትታል: end-to-end synthesis, natural prosody, fast inference, multiple speakers.
የሞዴል መረጃ
| ሞዴል | VITS |
| አዘጋጅ | Jaehyeon Kim et al. |
| ጥራት | |
| ፍጥነት | ቀጥ ያለ |
| ፈቃድ | MIT |
| መተላለፊያ | አልተገኘም |
| ዐምድ | ነጻ (ምንም ፊደል አልተጠቀመም) |
| መለኪያዎች | 25M |
| አርክቴክቸር | VAE + Normalizing Flows + GAN |
| የቀን መቁጠሪያ ዕይታ | 585 ሰዓቶች |
| ዓመት | 2021 |
ምርጥ የጠቀሙበት ሁኔታዎች Baker (Chinese)
የድምፅ ባህሪያትን በመመርኮዝ የተመረጡ ፕሮግራሞች
የድምፅ መጽሐፍት
Baker (Chinese)ን በመጠቀም ረዥም የሆኑትን ይዘቶች በነፃነት ለመግለጽ ይጠቀሙ
የቪዲዮ ድምፅ
የዩቲዩብ ቪዲዮዎች፣ ማስታወቂያዎች እና ማህበራዊ ሚዲያ ይዘት ላይ የሙያ መዝገበ ቃላትን ጨምር።
አቅላይነት
የፍጥነት ማምጣት ይህ ድምፅ ለጊዜው ፕሮግራሞች፣ ለስክሪን አንባቢዎች፣ እና ለሚቻልባቸው መሣሪያዎች ተስማሚ ያደርገዋል
የኤሌክትሮኒክ መማርና ስልጠና
የጥናት መሣሪያዎችን፣ ኮርሶችን እና የሥልጠና ይዘቶችን በግልጽ AI ታሪክ ውስጥ ያድርጉ።