VITS

Baker (Chinese)

නිදහස් චීන Neutral VITS

Baker (Chinese) යනු VITS පෙළ- සිට- කථාව ආකෘතිය මගින් බලගැන්වෙන neutral AI හඬකි. මෙම නිදහස්- තලය හඬ චීන කතාකරයි සහ හොඳයි- ගුණාත්මක කථා සංස්ලේෂණය ලබාදෙයි. ක්ෂණික ජනනය කිරීමේ වේගය සහ 3/5 ක ගුණාත්මක ශ්‍රේණිගත කිරීමක් සහිතව, Baker (Chinese) general-purpose text-to-speech with natural prosody සඳහා සුදුසු වේ. මෙම ක්‍රමවේදය මඟින් ද්‍රව්‍යය ද්‍රවයක් බවට පත්කර එය ද්‍රවයක් ලෙසින් භාවිතා කිරීමට ඉඩ සලසයි. ඵලදායිතාවය: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය.

තවමත් ශ්‍රේණිගත කිරීම් නැත

VITSආකෘති තොරතුරු

ආකෘතිය VITS
සංවර්‍ධක Jaehyeon Kim et al.
ප්‍රමිතිය
වේගය ස්ථාවර
බලපත්‍රය MIT
ක්ලෝන කිරීම නොමැත
සත්වයා නිදහස් (අකුරු භාවිතා නොවේ)
පරාමිතීන් 25M
ගෘහ නිර්මාණ ශිල්පය VAE + Normalizing Flows + GAN
පුහුණු දත්ත 585 පැය
වසර 2021

සඳහා හොඳම භාවිතය නඩු Baker (Chinese)

මෙම හඬේ ලක්ෂණ මත පදනම්ව නිර්දේශිත යෙදුම්Name

ශ්‍රව්‍ය පොත් සහ කථා

ස්වභාවික ව්‍යවහාරය හා ප්‍රකාශනය සමග දිගු ආකෘති අන්තර්ගතය විස්තර කිරීමට Baker (Chinese) භාවිතා කරන්න.

වීඩියෝ කටහඬ

YouTube වීඩියෝ, දැන්වීම් සහ සමාජ මාධ්ය අන්තර්ගතයට වෘත්තීය කථාව එකතු කරන්න.

යෙදුම් සහ පිවිසුම්

මෙම ක්‍රමවේදය මඟින් ඡායාරූප, ඡායාරූප සංස්කරණ, ඡායාරූප සංස්කරණ ක්‍රම සහ ඡායාරූප සංස්කරණ ක්‍රමවේදයන් නිර්මාණය කළ හැක.

ඉ-ඉගෙනීම සහ පුහුණුව

විද්‍යුත් තැපෑල, විද්‍යුත් ලිපිනය, සහ විද්‍යුත් ලිපිනය යනාදිය විද්‍යුත් ලිපින ලෙස හැඳින්වේ.

තවත් VITS ශබ්ද

එම TTS ආකෘතියෙන් වෙනත් හඬවල්

Default

ඉංග්‍රීසි Neutral

නිතර අසන ප්රශ්න

VITS (අවසන්-අවසන් පෙළ-කථාව සඳහා විරුද්ධාභාස ඉගෙනීම සමග විචලනය උපකල්පනය) වත්මන් අදියර දෙකක් ආකෘති වඩා ස්වභාවික ශබ්ද ශ්රව්ය ජනනය කරන සමාන්තර අවසන්-අවසන් TTS ක්රමයකි. එය ස්වභාවිකත්වය සැලකිය යුතු දියුණුවක් ලබා ගැනීම සඳහා, සාමාන්යකරණය ප්රවාහයන් හා විරුද්ධාභාස පුහුණු ක්රියාවලිය සමග වැඩි දියුණු කරන ලද විචලනය උපකල්පනය අනුගමනය කරයි.

VITS ජේහ්යොන් කිම් සහ අනෙකුන් විසින් සංවර්ධනය කරන ලද අතර එය MIT බලපත්‍රය යටතේ නිකුත් කරන ලදී, එය ජනනය කරන ලද ශ්‍රව්‍යයේ වාණිජමය භාවිතයට ඉඩ සලසයි.

VITS භාෂා4ක් සහාය: ඉංග්රීසි, චීන, ජපන්, කොරියානු.

VITS නිදහස් තලය තුළ වේ - නිදහස් - අවශ්ය ණය කිසිදු. ඔබ සම්පූර්ණ ශ්රව්ය ජනනය කිරීමට පෙර ඕනෑම VITS හඬ නොමිලේ පූර්ව දර්ශනය කළ හැකිය.

VITS ඉතා වේගවත් ජනනය වේගය ඇත. එය සමීප තත්කාලීන ධාවනය, එය ශ්රව්ය හා අන්තර් ක්රියාකාරී යෙදුම් සඳහා සුදුසු වන.

VITS ශ්රව්ය ගුණාත්මක සඳහා TTS.ai මත 3/5 ශ්රේණිගත කර ඇත. එය බොහෝ යෙදුම් සඳහා සුදුසු හොඳ ගුණාත්මක කථාව ලබා දෙයි.

නැත, VITS ස්ථාවර තනන ලද හඬ කට්ටලයක් භාවිතා කරයි. හඬ ක්ලෝන කිරීම සඳහා, CosyVoice2, GPT-SoVITS, හෝ Chatterbox වැනි ආකෘති උත්සාහ කරන්න.

ඔව්, VITS ස්වභාවික prosody සමග සාමාන්ය අරමුණ පෙළ-කථාව සඳහා විශේෂයෙන් නිර්දේශ කරනු ලැබේ. එහි අවසානයේ සිට අවසානය දක්වා සංස්ලේෂණය, ස්වභාවික prosody, ඉක්මන් නිගමනය හැකියාවන් මෙම භාවිතා කිරීම සඳහා විශිෂ්ට තේරීම කරයි.

ඔව්, VITS MIT යටතේ බලපත්ර ලත්, වාණිජ භාවිතය සඳහා ඉඩ දෙන. VITS හඬ සමග ජනනය ශ්රව්ය වීඩියෝ, පොඩ්කාස්ට්, යෙදුම්, ක්රීඩා, සහ වෙනත් ඕනෑම වාණිජ ව්යාපෘතිය භාවිතා කළ හැකිය.

ඔව්, TTS.ai මත සියලු හඬවල් වාණිජමය බලපත්රලාභී විවෘත මූලාශ්ර ආකෘති භාවිතා (MIT, Apache 2.0). ජනනය කරන ලද ශ්රව්ය වීඩියෝ, පොඩ්කාස්ට්, යෙදුම්, ක්රීඩා සහ වෙනත් ඕනෑම වාණිජ යෙදුමක් භාවිතා කිරීමට ඔබගේ ය.

ආකෘති නාමය සහ හඬ ID සමග /api/v1/tts/ වෙත POST ඉල්ලීමක් යවන්න. Python හි කේත උදාහරණ සඳහා අපගේ API ලේඛන පිටුව බලන්න, JavaScript, Go, සහ cURL.

ඔව්, සාම්පලයක් අසන්නට මෙම පිටුවේ ක්ලික් කරන්න ක්ලික් කරන්න. ඔබ ද කටහඬ පිටුව පෙළ මත අභිරුචි පෙළ වර්ග හා ඕනෑම හඬ සමග නිදහස් පූර්ව දර්ශනයක් ජනනය කළ හැකිය.

උත්සහ කරන්න Baker (Chinese) දැන්

ඕනෑම පෙළක් ටයිප් කර එය කථා කරන සවන් දෙන්න Baker (Chinese). භාවිතා කිරීමට නිදහස් අකුරු අවශ්‍ය නොවේ.