Default

ፕሪሚየም እንግሊዝኛ Neutral

StyleTTS 2

Default በStyleTTS 2 ጽሑፍ-ወደ-ንግግር ሞዴል የተደገፈ የ neutral AI ድምፅ ነው. ይህ የፕሪሚየም ደረጃ ድምፅ እንግሊዝኛ ይናገራል እና ስታዲየም-quality የንግግር ማቀነባበሪያን ይሰጣል. በ መካከለኛ የፍጥነት ፍጥነት እና በ 5/5 ጥራት ደረጃ Default ለ studio-quality single-speaker synthesis, professional narration ተስማሚ ነው የ StyleTTS 2 ማሽን በ Columbia University under the MIT license የተገነባ ሲሆን ለኮሜርሺያል ጥቅም ደህንነቱ የተጠበቀ ነው። የዋና ችሎታዎችን ያካትታል: human-level, style diffusion, adversarial training, natural variation, high fidelity.

ደረጃ አልተሰጠም

ይህንን ድምፅ ይሞክሩ ሁሉንም StyleTTS 2 ድምጾች

የሞዴል መረጃ

ሞዴል	StyleTTS 2
አዘጋጅ	Columbia University
ጥራት
ፍጥነት	መሀከል
ፈቃድ	MIT
መተላለፊያ	አልተገኘም
ዐምድ	ፊደል(ሎች)
መለኪያዎች	100M
አርክቴክቸር	Style Diffusion + Adversarial Training
የቀን መቁጠሪያ ዕይታ	585 ሰዓቶች
ዓመት	2024

ምርጥ የጠቀሙበት ሁኔታዎች Default

የድምፅ ባህሪያትን በመመርኮዝ የተመረጡ ፕሮግራሞች

የድምፅ መጽሐፍት

Defaultን በመጠቀም ረዥም የሆኑትን ይዘቶች በነፃነት ለመግለጽ ይጠቀሙ

የቪዲዮ ድምፅ

የዩቲዩብ ቪዲዮዎች፣ ማስታወቂያዎች እና ማህበራዊ ሚዲያ ይዘት ላይ የሙያ መዝገበ ቃላትን ጨምር።

ብሮድካስት

የስታዲዮ ጥራት ምርት ለፖድካስት, ሬዲዮ, እና ሙያ ብሮድካስቲንግ ተስማሚ ነው.

ጨዋታዎችና ተለዋዋጭ መገናኛዎች

ለጨዋታ ውይይት፣ ለተገናኝ ታሪኮች፣ እና ለተጨባጭ ተሞክሮዎች ከፍተኛ ጥራት ያለው

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

StyleTTS 2 የሰው ደረጃ TTS ማቀነባበሪያን በከፍተኛ የንግግር ቋንቋ ሞዴሎችን በመጠቀም የቋንቋ ልዩነትን እና የቋንቋ ልዩነትን በማቀናጀት ያሳያል. በአንድ-ተናጋሪ ሞዴሎች መካከል በጣም ተፈጥሯዊ የሆነውን ንግግር ያመነጫል ፣ የሰው መዝገቦችን የሚወዳደር። StyleTTS 2 የሰው ንግግር ልዩነትን ለመያዝ የቋንቋ ልዩነትን በመጠቀም የቋንቋ ልዩነትን ያመነጫል ፡፡

StyleTTS 2 በኮሎምቢያ ዩኒቨርሲቲ የተፈጠረ ሲሆን በኤም.አይ.ቲ. ፈቃድ ስር ይወጣል፣ ይህም የፈጠረውን ድምፅ ለኮምፒውተር ጥቅም የሚጠቀምበትን መንገድ ይፈቅዳል።

StyleTTS 2 1 ቋንቋን ይደግፋል: እንግሊዝኛ

StyleTTS 2 በፕሪሚየም ደረጃ ላይ ነው - ለ 1,000 አሃዞች 4 ክሬዲቶች. የ StyleTTS 2 ድምፅን ነፃ በሆነ መንገድ ከመፍጠርዎ በፊት ማየት ይችላሉ።

StyleTTS 2 መካከለኛ የፍጥነት ፍጥነት አለው. ፍጥነት በጽሑፉ ርዝመት ላይ በመመርኮዝ በጥቂት ሰከንዶች ውስጥ ይመጣል.

StyleTTS 2 በTTS.ai ላይ ለድምፅ ጥራት 5/5 ተቆጥሯል። ስቱዲዮ-ደረጃ፣ ሰው-እንደ-ንግግር ይሰጣል ፡፡

አይደለም፣ StyleTTS 2 የውስጥ ድምጾችን ቀጥተኛ ስብስብ ይጠቀማል። ለድምፅ ክሎኒንግ፣ እንደ CosiVoice 2፣ GPT-SoVITS ወይም Chatterbox ያሉ ሞዴሎችን ይሞክሩ።

አዎ, StyleTTS 2 ለስታዲየም-ጥራት አንድ-ተናጋሪ ስብስብ, የሙያ ታሪክ ልዩ ልዩ መከራከሪያ ነው. የሰው-ደረጃ, ስታይል መተላለፊያ, ተቃራኒው ስልጠና አቅሞች ለዚህ ጥቅም ሁኔታ ምርጥ ምርጫ ያደርገዋል.

አዎ፣ StyleTTS 2 በ MIT ስር ሊሰጥ የሚችል ነው፣ ይህም የኮሜርሺያል ጥቅም ያስችላል። በ StyleTTS 2 የተፈጠሩ ድምፆች በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎች፣ እና በሌሎችም የኮሜርሺያል ፕሮጀክቶች ሊጠቀሙባቸው ይችላሉ።

አዎ፣ በTTS.ai ላይ ያሉት ድምጾች ሁሉ የኮሜርሺያል-ላይሴንስ የተሰጣቸውን የኦፕን-ሶርስ ሞዴሎችን (MIT, Apache 2.0) ይጠቀማሉ፡፡ የተፈጠረው ድምፅ በቪዲዮዎች፣ በፖድካስቶች፣ በአፕሊኬሽኖች፣ በጨዋታዎችና በሌሎችም የኮሜርሺያል ፕሮግራሞች ውስጥ ለመጠቀም የእርስዎ ነው

የ POST ጥያቄን ወደ /api/v1/tts/ በሞዴል ስም እና የድምፅ ID ይላኩ. በፒታውን፣ ጃቫስክሪፕት፣ ጎ፣ እና በኩርል የኮድ ምሳሌዎች የ API ማስረጃ ገጽን ይመልከቱ።

አዎ፣ ምሳሌ ለማዳመጥ በእነዚህ ገጾች ላይ ያለውን መጫን ቁልፍ ጠቅ ያድርጉ። በጽሑፍ ወደ ንግግር ገጽ ላይ የግል ጽሑፍን መጻፍ እና በየትኛውም ድምፅ ነፃ ቅድመ ዕይታን ማምጣት ይችላሉ።

መሞከር Default አሁን

ማንኛውንም ጽሑፍ ይጻፉ እና ይናገሩት Default. ለመጠቀም ነጻ.

ንግግር ነጻ

Default

የሞዴል መረጃ

ምርጥ የጠቀሙበት ሁኔታዎች Default

የድምፅ መጽሐፍት

የቪዲዮ ድምፅ

ብሮድካስት

ጨዋታዎችና ተለዋዋጭ መገናኛዎች

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

StyleTTS 2 TTS ምንድን ነው?

ስታይልቲቲኤስ 2ን ማን ፈጠረ?

ምን ቋንቋዎች StyleTTS 2 ይደግፋል?

StyleTTS 2 ድምጾችን ለመጠቀም ምን ያህል ዋጋ አለው?

StyleTTS 2 በንግግር ማምረት ምን ያህል ፈጣን ነው?

የ StyleTTS 2 የድምፅ ጥራት ምንድነው?

የድምፅ ቅርጸት

StyleTTS 2 ለስታዲየም ጥራት አንድ-ተናጋሪ ስብስብ ተስማሚ ነውን?

StyleTTS 2 ድምጾችን በኮሜርሺያል መጠቀም እችላለሁን?

ይህች ድምፅ ለኮሜርሺያል ፕሮጀክቶች ሊጠቀም ይቻላል?

እንዴት ይህን ድምፅ በAPI ውስጥ መጠቀም እችላለሁ?

የድምፅ ፋይል

መሞከር Default አሁን