VITS

Common Voice (Portuguese)

නිදහස් පෘතුගීසිName Neutral VITS

Common Voice (Portuguese) යනු VITS පෙළ- සිට- කථාව ආකෘතිය මගින් බලගැන්වෙන neutral AI හඬකි. මෙම නිදහස්- තලය හඬ පෘතුගීසිName කතාකරයි සහ හොඳයි- ගුණාත්මක කථා සංස්ලේෂණය ලබාදෙයි. ක්ෂණික ජනනය කිරීමේ වේගය සහ 3/5 ක ගුණාත්මක ශ්‍රේණිගත කිරීමක් සහිතව, Common Voice (Portuguese) general-purpose text-to-speech with natural prosody සඳහා සුදුසු වේ. මෙම ක්‍රමවේදය මඟින් ද්‍රව්‍යය ද්‍රවයක් බවට පත්කර එය ද්‍රවයක් ලෙසින් භාවිතා කිරීමට ඉඩ සලසයි. ඵලදායිතාවය: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය.

තවමත් ශ්‍රේණිගත කිරීම් නැත

VITSආකෘති තොරතුරු

ආකෘතිය VITS
සංවර්‍ධක Jaehyeon Kim et al.
ප්‍රමිතිය
වේගය ස්ථාවර
බලපත්‍රය MIT
ක්ලෝන කිරීම නොමැත
සත්වයා නිදහස් (අකුරු භාවිතා නොවේ)
පරාමිතීන් 25M
ගෘහ නිර්මාණ ශිල්පය VAE + Normalizing Flows + GAN
පුහුණු දත්ත 585 පැය
වසර 2021

සඳහා හොඳම භාවිතය නඩු Common Voice (Portuguese)

මෙම හඬේ ලක්ෂණ මත පදනම්ව නිර්දේශිත යෙදුම්Name

ශ්‍රව්‍ය පොත් සහ කථා

ස්වභාවික ව්‍යවහාරය හා ප්‍රකාශනය සමග දිගු ආකෘති අන්තර්ගතය විස්තර කිරීමට Common Voice (Portuguese) භාවිතා කරන්න.

වීඩියෝ කටහඬ

YouTube වීඩියෝ, දැන්වීම් සහ සමාජ මාධ්ය අන්තර්ගතයට වෘත්තීය කථාව එකතු කරන්න.

යෙදුම් සහ පිවිසුම්

මෙම ක්‍රමවේදය මඟින් ඡායාරූප, ඡායාරූප සංස්කරණ, ඡායාරූප සංස්කරණ ක්‍රම සහ ඡායාරූප සංස්කරණ ක්‍රමවේදයන් නිර්මාණය කළ හැක.

ඉ-ඉගෙනීම සහ පුහුණුව

විද්‍යුත් තැපෑල, විද්‍යුත් ලිපිනය, සහ විද්‍යුත් ලිපිනය යනාදිය විද්‍යුත් ලිපින ලෙස හැඳින්වේ.

තවත් VITS ශබ්ද

එම TTS ආකෘතියෙන් වෙනත් හඬවල්

CSS10 (Dutch)

ඩච්Name Neutral

CSS10 (Finnish)

ෆින්ලන්තName Neutral

CSS10 (French)

ප්‍රංශ Neutral

CSS10 (German)

ජර්මානු Neutral

CSS10 (Hungarian)

හංගේරියානුName Neutral

CSS10 (Spanish)

ස්පාඤ්ඤ Neutral

නිතර අසන ප්රශ්න

VITS (අවසන්-අවසන් පෙළ-කථාව සඳහා විරුද්ධාභාස ඉගෙනීම සමග විචලනය උපකල්පනය) වත්මන් අදියර දෙකක් ආකෘති වඩා ස්වභාවික ශබ්ද ශ්රව්ය ජනනය කරන සමාන්තර අවසන්-අවසන් TTS ක්රමයකි. එය ස්වභාවිකත්වය සැලකිය යුතු දියුණුවක් ලබා ගැනීම සඳහා, සාමාන්යකරණය ප්රවාහයන් හා විරුද්ධාභාස පුහුණු ක්රියාවලිය සමග වැඩි දියුණු කරන ලද විචලනය උපකල්පනය අනුගමනය කරයි.

VITS ජේහ්යොන් කිම් සහ අනෙකුන් විසින් සංවර්ධනය කරන ලද අතර එය MIT බලපත්‍රය යටතේ නිකුත් කරන ලදී, එය ජනනය කරන ලද ශ්‍රව්‍යයේ වාණිජමය භාවිතයට ඉඩ සලසයි.

VITS භාෂා4ක් සහාය: ඉංග්රීසි, චීන, ජපන්, කොරියානු.

VITS නිදහස් තලය තුළ වේ - නිදහස් - අවශ්ය ණය කිසිදු. ඔබ සම්පූර්ණ ශ්රව්ය ජනනය කිරීමට පෙර ඕනෑම VITS හඬ නොමිලේ පූර්ව දර්ශනය කළ හැකිය.

VITS ඉතා වේගවත් ජනනය වේගය ඇත. එය සමීප තත්කාලීන ධාවනය, එය ශ්රව්ය හා අන්තර් ක්රියාකාරී යෙදුම් සඳහා සුදුසු වන.

VITS ශ්රව්ය ගුණාත්මක සඳහා TTS.ai මත 3/5 ශ්රේණිගත කර ඇත. එය බොහෝ යෙදුම් සඳහා සුදුසු හොඳ ගුණාත්මක කථාව ලබා දෙයි.

නැත, VITS ස්ථාවර තනන ලද හඬ කට්ටලයක් භාවිතා කරයි. හඬ ක්ලෝන කිරීම සඳහා, CosyVoice2, GPT-SoVITS, හෝ Chatterbox වැනි ආකෘති උත්සාහ කරන්න.

ඔව්, VITS ස්වභාවික prosody සමග සාමාන්ය අරමුණ පෙළ-කථාව සඳහා විශේෂයෙන් නිර්දේශ කරනු ලැබේ. එහි අවසානයේ සිට අවසානය දක්වා සංස්ලේෂණය, ස්වභාවික prosody, ඉක්මන් නිගමනය හැකියාවන් මෙම භාවිතා කිරීම සඳහා විශිෂ්ට තේරීම කරයි.

ඔව්, VITS MIT යටතේ බලපත්ර ලත්, වාණිජ භාවිතය සඳහා ඉඩ දෙන. VITS හඬ සමග ජනනය ශ්රව්ය වීඩියෝ, පොඩ්කාස්ට්, යෙදුම්, ක්රීඩා, සහ වෙනත් ඕනෑම වාණිජ ව්යාපෘතිය භාවිතා කළ හැකිය.

ඔව්, TTS.ai මත සියලු හඬවල් වාණිජමය බලපත්රලාභී විවෘත මූලාශ්ර ආකෘති භාවිතා (MIT, Apache 2.0). ජනනය කරන ලද ශ්රව්ය වීඩියෝ, පොඩ්කාස්ට්, යෙදුම්, ක්රීඩා සහ වෙනත් ඕනෑම වාණිජ යෙදුමක් භාවිතා කිරීමට ඔබගේ ය.

ආකෘති නාමය සහ හඬ ID සමග /api/v1/tts/ වෙත POST ඉල්ලීමක් යවන්න. Python හි කේත උදාහරණ සඳහා අපගේ API ලේඛන පිටුව බලන්න, JavaScript, Go, සහ cURL.

ඔව්, සාම්පලයක් අසන්නට මෙම පිටුවේ ක්ලික් කරන්න ක්ලික් කරන්න. ඔබ ද කටහඬ පිටුව පෙළ මත අභිරුචි පෙළ වර්ග හා ඕනෑම හඬ සමග නිදහස් පූර්ව දර්ශනයක් ජනනය කළ හැකිය.

උත්සහ කරන්න Common Voice (Portuguese) දැන්

ඕනෑම පෙළක් ටයිප් කර එය කථා කරන සවන් දෙන්න Common Voice (Portuguese). භාවිතා කිරීමට නිදහස් අකුරු අවශ්‍ය නොවේ.