VITS

Baker (Chinese)

ነጻ ቻይንኛ Neutral VITS

Baker (Chinese) በVITS ጽሑፍ-ወደ-ንግግር ሞዴል የተደገፈ የ neutral AI ድምፅ ነው. ይህ ነጻ ድምፅ ቻይንኛ ይናገራል እና ጥሩ-quality የንግግር ማቀነባበሪያን ይሰጣል. በ ቅርበት-ጊዜ የፍጥነት ፍጥነት እና በ 3/5 ጥራት ደረጃ Baker (Chinese) ለ general-purpose text-to-speech with natural prosody ተስማሚ ነው የ VITS ማሽን በ Jaehyeon Kim et al. under the MIT license የተገነባ ሲሆን ለኮሜርሺያል ጥቅም ደህንነቱ የተጠበቀ ነው። የዋና ችሎታዎችን ያካትታል: end-to-end synthesis, natural prosody, fast inference, multiple speakers.

ደረጃ አልተሰጠም

VITSየሞዴል መረጃ

ሞዴል VITS
አዘጋጅ Jaehyeon Kim et al.
ጥራት
ፍጥነት ቀጥ ያለ
ፈቃድ MIT
መተላለፊያ አልተገኘም
ዐምድ ነጻ (ምንም ፊደል አልተጠቀመም)
መለኪያዎች 25M
አርክቴክቸር VAE + Normalizing Flows + GAN
የቀን መቁጠሪያ ዕይታ 585 ሰዓቶች
ዓመት 2021

ምርጥ የጠቀሙበት ሁኔታዎች Baker (Chinese)

የድምፅ ባህሪያትን በመመርኮዝ የተመረጡ ፕሮግራሞች

የድምፅ መጽሐፍት

Baker (Chinese)ን በመጠቀም ረዥም የሆኑትን ይዘቶች በነፃነት ለመግለጽ ይጠቀሙ

የቪዲዮ ድምፅ

የዩቲዩብ ቪዲዮዎች፣ ማስታወቂያዎች እና ማህበራዊ ሚዲያ ይዘት ላይ የሙያ መዝገበ ቃላትን ጨምር።

አቅላይነት

የፍጥነት ማምጣት ይህ ድምፅ ለጊዜው ፕሮግራሞች፣ ለስክሪን አንባቢዎች፣ እና ለሚቻልባቸው መሣሪያዎች ተስማሚ ያደርገዋል

የኤሌክትሮኒክ መማርና ስልጠና

የጥናት መሣሪያዎችን፣ ኮርሶችን እና የሥልጠና ይዘቶችን በግልጽ AI ታሪክ ውስጥ ያድርጉ።

ተጨማሪ VITS ድምጾች

ሌሎች ድምጾች ከአንድ TTS ሞዴል

Default

እንግሊዝኛ Neutral

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

VITS (የማሻሻያ ውጤት ለመጨረሻው-ወደ-መጨረሻው ጽሑፍ-ወደ-ንግግር ለመማር) ከቀድሞው ሁለት-ደረጃ ሞዴሎች የበለጠ ተፈጥሯዊ የሆነ ድምፅ የሚያመነጭ የመጨረሻ-ወደ-መጨረሻ TTS ዘዴ ነው. በነፃነት ውስጥ ትልቅ ማሻሻያ የሚያገኝ በሆነ የቀድሞው-ወደ-መጨረሻው ቴክኖሎጂ የተሻሻለ የመጨረሻ-ወደ-መጨረሻ TTS ዘዴ ነው.

VITS በጃይሄን ኪም እና ሌሎች የተፈጠረ ሲሆን በኤም.አይ.ቲ. ፈቃድ ስር ይወጣል፣ ይህም የፈጠረውን ድምፅ ለኮሜርሺያል ጥቅም የሚፈቅድ ነው።

VITS 4 ቋንቋዎችን ይደግፋል: እንግሊዝኛ, ቻይንኛ, ጃፓንኛ, ኮሪያኛ.

VITS በነጻ ደረጃ ላይ ነው - ነፃ - ምንም ክሬዲቶች አይጠየቁም. የ VITS ድምፅን ነፃ ድምፅ ከመፍጠርዎ በፊት መቃኘት ይችላሉ።

VITS በጣም ፈጣን የፈጠራ ፍጥነት አለው. በቅርብ ጊዜ ውስጥ ይሠራል፣ ለቀጥታ እና ለተግባራዊ ፕሮግራሞች ተስማሚ ያደርገዋል.

VITS በ TTS.ai ላይ ለድምፅ ጥራት 3/5 ተቆጥሯል. ለብዙ ፕሮግራሞች ተስማሚ የሆነ ጥሩ ጥራት ያለው ንግግር ይሰጣል.

አይደለም VITS የውስጥ ድምፆችን ቀጥተኛ ስብስብ ይጠቀማል. የድምፅ ክሎኒንግን ለመጠቀም እንደ CosiVoice 2, GPT-SoVITS, ወይም Chatterbox ያሉ ሞዴሎችን ይሞክሩ

አዎ, VITS ለታሪክ-ወደ-ንግግር ጠቃሚ ጥቅም ላይ ይውላል. የመጨረሻ-ወደ-መጨረሻው ስብስብ, የቅርብ ጊዜ ችሎታዎች ለዚህ ጥቅም ሁኔታ ምርጥ ምርጫ ያደርገዋል.

አዎ፣ VITS በ MIT ስር ሊሰጥ የሚችል ነው፣ ይህም የኮሜርሺያል ጥቅም ያስችላል። በ VITS ድምጾች የተፈጠረ ድምፅ በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎች፣ እና በሌላ የኮሜርሺያል ፕሮጀክት ሊጠቀም ይችላል።

አዎ፣ በTTS.ai ላይ ያሉት ድምጾች ሁሉ የኮሜርሺያል-ላይሴንስ የተሰጣቸውን የኦፕን-ሶርስ ሞዴሎችን (MIT, Apache 2.0) ይጠቀማሉ፡፡ የተፈጠረው ድምፅ በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎችና በሌሎችም የኮሜርሺያል ፕሮግራሞች ውስጥ ለመጠቀም የእርስዎ ነው

የ POST ጥያቄን ወደ /api/v1/tts/ በሞዴል ስም እና የድምፅ ID ይላኩ. በፒታውን፣ ጃቫስክሪፕት፣ ጎ፣ እና በኩርል የኮድ ምሳሌዎች የ API ማስረጃ ገጽን ይመልከቱ።

አዎ፣ ምሳሌ ለማዳመጥ በእነዚህ ገጾች ላይ ያለውን መጫን ቁልፍ ጠቅ ያድርጉ። በጽሑፍ ወደ ንግግር ገጽ ላይ የግል ጽሑፍን መጻፍ እና በየትኛውም ድምፅ ነፃ ቅድመ ዕይታን ማምጣት ይችላሉ።

መሞከር Baker (Chinese) አሁን

ማንኛውንም ጽሑፍ ይጻፉ እና ይናገሩት Baker (Chinese). ለመጠቀም ነጻ ፊደላትን አያካትትም.