StyleTTS 2

Default

ፕሪሚየም እንግሊዝኛ Neutral StyleTTS 2

Default በStyleTTS 2 ጽሑፍ-ወደ-ንግግር ሞዴል የተደገፈ የ neutral AI ድምፅ ነው. ይህ የፕሪሚየም ደረጃ ድምፅ እንግሊዝኛ ይናገራል እና ስታዲየም-quality የንግግር ማቀነባበሪያን ይሰጣል. በ መካከለኛ የፍጥነት ፍጥነት እና በ 5/5 ጥራት ደረጃ Default ለ studio-quality single-speaker synthesis, professional narration ተስማሚ ነው የ StyleTTS 2 ማሽን በ Columbia University under the MIT license የተገነባ ሲሆን ለኮሜርሺያል ጥቅም ደህንነቱ የተጠበቀ ነው። የዋና ችሎታዎችን ያካትታል: human-level, style diffusion, adversarial training, natural variation, high fidelity.

ደረጃ አልተሰጠም

StyleTTS 2የሞዴል መረጃ

ሞዴል StyleTTS 2
አዘጋጅ Columbia University
ጥራት
ፍጥነት መሀከል
ፈቃድ MIT
መተላለፊያ አልተገኘም
ዐምድ ፊደል(ሎች)
መለኪያዎች 100M
አርክቴክቸር Style Diffusion + Adversarial Training
የቀን መቁጠሪያ ዕይታ 585 ሰዓቶች
ዓመት 2024

ምርጥ የጠቀሙበት ሁኔታዎች Default

የድምፅ ባህሪያትን በመመርኮዝ የተመረጡ ፕሮግራሞች

የድምፅ መጽሐፍት

Defaultን በመጠቀም ረዥም የሆኑትን ይዘቶች በነፃነት ለመግለጽ ይጠቀሙ

የቪዲዮ ድምፅ

የዩቲዩብ ቪዲዮዎች፣ ማስታወቂያዎች እና ማህበራዊ ሚዲያ ይዘት ላይ የሙያ መዝገበ ቃላትን ጨምር።

ብሮድካስት

የስታዲዮ ጥራት ምርት ለፖድካስት, ሬዲዮ, እና ሙያ ብሮድካስቲንግ ተስማሚ ነው.

ጨዋታዎችና ተለዋዋጭ መገናኛዎች

ለጨዋታ ውይይት፣ ለተገናኝ ታሪኮች፣ እና ለተጨባጭ ተሞክሮዎች ከፍተኛ ጥራት ያለው

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

StyleTTS 2 የሰው ደረጃ TTS ማቀነባበሪያን በከፍተኛ የንግግር ቋንቋ ሞዴሎችን በመጠቀም የቋንቋ ልዩነትን እና የቋንቋ ልዩነትን በማቀናጀት ያሳያል. በአንድ-ተናጋሪ ሞዴሎች መካከል በጣም ተፈጥሯዊ የሆነውን ንግግር ያመነጫል ፣ የሰው መዝገቦችን የሚወዳደር። StyleTTS 2 የሰው ንግግር ልዩነትን ለመያዝ የቋንቋ ልዩነትን በመጠቀም የቋንቋ ልዩነትን ያመነጫል ፡፡

StyleTTS 2 በኮሎምቢያ ዩኒቨርሲቲ የተፈጠረ ሲሆን በኤም.አይ.ቲ. ፈቃድ ስር ይወጣል፣ ይህም የፈጠረውን ድምፅ ለኮምፒውተር ጥቅም የሚጠቀምበትን መንገድ ይፈቅዳል።

StyleTTS 2 1 ቋንቋን ይደግፋል: እንግሊዝኛ

StyleTTS 2 በፕሪሚየም ደረጃ ላይ ነው - ለ 1,000 አሃዞች 4 ክሬዲቶች. የ StyleTTS 2 ድምፅን ነፃ በሆነ መንገድ ከመፍጠርዎ በፊት ማየት ይችላሉ።

StyleTTS 2 መካከለኛ የፍጥነት ፍጥነት አለው. ፍጥነት በጽሑፉ ርዝመት ላይ በመመርኮዝ በጥቂት ሰከንዶች ውስጥ ይመጣል.

StyleTTS 2 በTTS.ai ላይ ለድምፅ ጥራት 5/5 ተቆጥሯል። ስቱዲዮ-ደረጃ፣ ሰው-እንደ-ንግግር ይሰጣል ፡፡

አይደለም፣ StyleTTS 2 የውስጥ ድምጾችን ቀጥተኛ ስብስብ ይጠቀማል። ለድምፅ ክሎኒንግ፣ እንደ CosiVoice 2፣ GPT-SoVITS ወይም Chatterbox ያሉ ሞዴሎችን ይሞክሩ።

አዎ, StyleTTS 2 ለስታዲየም-ጥራት አንድ-ተናጋሪ ስብስብ, የሙያ ታሪክ ልዩ ልዩ መከራከሪያ ነው. የሰው-ደረጃ, ስታይል መተላለፊያ, ተቃራኒው ስልጠና አቅሞች ለዚህ ጥቅም ሁኔታ ምርጥ ምርጫ ያደርገዋል.

አዎ፣ StyleTTS 2 በ MIT ስር ሊሰጥ የሚችል ነው፣ ይህም የኮሜርሺያል ጥቅም ያስችላል። በ StyleTTS 2 የተፈጠሩ ድምፆች በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎች፣ እና በሌሎችም የኮሜርሺያል ፕሮጀክቶች ሊጠቀሙባቸው ይችላሉ።

አዎ፣ በTTS.ai ላይ ያሉት ድምጾች ሁሉ የኮሜርሺያል-ላይሴንስ የተሰጣቸውን የኦፕን-ሶርስ ሞዴሎችን (MIT, Apache 2.0) ይጠቀማሉ፡፡ የተፈጠረው ድምፅ በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎችና በሌሎችም የኮሜርሺያል ፕሮግራሞች ውስጥ ለመጠቀም የእርስዎ ነው

የ POST ጥያቄን ወደ /api/v1/tts/ በሞዴል ስም እና የድምፅ ID ይላኩ. በፒታውን፣ ጃቫስክሪፕት፣ ጎ፣ እና በኩርል የኮድ ምሳሌዎች የ API ማስረጃ ገጽን ይመልከቱ።

አዎ፣ ምሳሌ ለማዳመጥ በእነዚህ ገጾች ላይ ያለውን መጫን ቁልፍ ጠቅ ያድርጉ። በጽሑፍ ወደ ንግግር ገጽ ላይ የግል ጽሑፍን መጻፍ እና በየትኛውም ድምፅ ነፃ ቅድመ ዕይታን ማምጣት ይችላሉ።

መሞከር Default አሁን

ማንኛውንም ጽሑፍ ይጻፉ እና ይናገሩት Default. ለመጠቀም ነጻ.