VITS

Default

ഫ്രീ ഇംഗ്ലീഷ്Name Neutral VITS

{നമ്പര്‍} എന്നത് {മൈന്‍ഡര്‍} {മൈല്‍} ടെക്സ്റ്റില്‍ പ്രവര്‍ത്തിപ്പിക്കുന്ന ശബ്ദം. {Language} സംസാരം {Language} നല്‍കുകയും (Shift} Synitis) നല്‍കുകയും ചെയ്യും. അടുത്തതു്- ഇന്‍സ്റ്റന്‍റ് തലമുറയുടെ വേഗതയും ഗുണമേന്മയും {rakeing}/5, Default-നു് {Set_ }-നു് നന്നായി ചേരുന്നു. {മൈല്‍} എന്‍ജിന്‍ നിര്‍മ്മിച്ചിരിക്കുന്നത് {ഇന്‍ജിനര്‍} കൊണ്ട്, വാണിജ്യ ഉപയോഗത്തില്‍ സുരക്ഷിതമാക്കുന്നു. കീയുടെ കഴിവുകള്‍ : {fences}.

ഇതുവരെ റേറ്ററുകള്‍ ഇല്ല

VITSമോഡല്‍ വിവരം

മോഡ് VITS
രചയിതാവു് Jaehyeon Kim et al.
നിലവാരം
വേഗത വേഗത
അനുമതി MIT
ക്ളൈനിങ്ങ് ലഭ്യമല്ല
ടിയെര്‍ ഫ്രീ (പയോഗിയ്ക്കുന്ന ക്യാരക്ടറുകള്‍ ലഭ്യമല്ല)
പരാമീറ്ററുകള്‍ 25M
ഭൂമദ്ധ്യരേഖ/ അഗ്രകോടി ഉയര്‍ത്തല്‍ [ENTER] VAE + Normalizing Flows + GAN
പരിശീലന ഡേറ്റാ 585 മണിക്കൂറുകള്‍
കൊല്ലം 2021

കേസുകള്‍ നല്ല രീതിയില്‍ ഉപയോഗിക്കുക Default

ഈ ശബ്ദത്തിന്റെ വിശേഷതകളെ അടിസ്ഥാനമാക്കിയുള്ള പ്രയോഗങ്ങള്‍ ശുപാര്‍ശ ചെയ്യുന്നു

ഓഡിയോ പുസ്തകങ്ങളും ശ്രോതസ്സുകളും

സ്വാഭാവികമായ പ്രൊസോഡിയും ഭാവവും ഉള്ള ഉള്ളടക്കത്തെ വിവരിയ്ക്കാന്‍ Default ഉപയോഗിയ്ക്കുക.

ചലച്ചിത്രശബ്ദങ്ങള്‍Name

യു. എ⁠സ്‌.

Apps & ആക്സസിബിളിറ്റി

വേഗത്തിലുള്ള തലമുറ യഥാര്‍ത്ഥ സമയ വായനകള്‍, സ്ക്രീന്‍ വായനകള്‍, ആക്സസിബിളിറ്റി ഉപകരണങ്ങള്‍ എന്നിവയ്ക്കു് ഈ ശബ്ദം അനുയോജ്യമാക്കും.

ഇ- പഠനവും പരിശീലനവും

പരിശീലന വസ്‌തുക്കൾ, വിദ്യാഭ്യാസങ്ങൾ, വിദ്യാഭ്യാസം എന്നിവയുമായി ഒത്തുചേരുക.

കൂടുതല്‍ VITS ശബ്ദംകള്‍

ഒരേ TTS മാതൃകയില്‍ നിന്നുള്ള ശബ്ദങ്ങള്‍

Baker (Chinese)

ചൈനീസ്‌ Neutral

പലപ്പോഴും ചോദിക്കപ്പെടുന്ന ചോദ്യങ്ങൾ

VITS (അന്ത്യ-ഘടകത്തില്‍ നിന്ന് വായിക്കാന്‍ പഠിക്കല്‍) ഒരു സമാന്തര രീതിയാണ്. അത്, ഇപ്പോഴത്തെ രണ്ട് കേന്ദ്ര മോഡലുകള്‍ക്കപ്പുറം പ്രകൃതിയിലെ ശബ്ദോപകരണങ്ങള്‍ ഉണ്ടാക്കുന്ന ശബ്ദ രീതിയാണ്. അപ്പോള്‍, പരമ്പരാഗത പരിവര്‍ത്തനം, പരമ്പരാഗികമായ പരിശീലന പ്രക്രിയകള്‍, പ്രകൃതിയില്‍ ശ്രദ്ധേയമായ പുരോഗതി നേടുന്നു.

എയ്‌ഡ്‌സ്‌ വികസിപ്പിച്ചെടുത്തത്‌ ജേയോൺ കിം എറ്റ്‌ ആൽ ആണ്‌.

VITS 4 ഭാഷകളെ പിന്തുണയ്‌ക്കുന്നു: ഇംഗ്ലീഷുകാർ, ചൈനീസ്‌, ജാപ്പനീസ്‌, കൊറിയൻ.

VIS - യിൽ ഫ്രീ ടൈപ്പറിലാണ്‌ —⁠ സ്വതന്ത്രമായ ഒരു കടവും ഉണ്ടായിരിക്കില്ല.

വി.ഡി.ടി. യുടെ വേഗത വളരെ വേഗത്തിലാണ്. ഇത് യഥാര്‍ത്ഥ സമയത്തിനടുത്ത് പ്രവര്‍ത്തിക്കും. ഇതു് സ്പ്രിങ്സ് ചെയ്യുന്നതിനും ഇന്ററാക്ടീവ് പ്രയോഗങ്ങള്‍ക്കും അനുയോജ്യമാക്കുന്നു.

TTS.ai-ല്‍ ഓഡിയോ ഗുണത്തിന് VITS 3/5 ആണ് നിരത്തുന്നത്. മിക്ക പ്രയോഗങ്ങള്‍ക്കും അനുയോജ്യമായ ഗുണമേന്മയുള്ള സംസാരം നല്‍കുന്നു.

ഇല്ല, വി.ടി. സ്വരങ്ങള്‍ നിര്‍മ്മിച്ച ശബ്ദങ്ങള്‍ ഉപയോഗിക്കുന്നു. ശബ്ദങ്ങള്‍ക്ക്, കൊസിവോയിസ് 2, GPTI- സോവിയറ്റ്‌, അല്ലെങ്കില്‍ ചാറ്റര്‍ട്ടര്‍ബോക്സ് പോലെയുള്ള മോഡലുകള്‍ പരീക്ഷിക്കുക.

അതെ, VITS സവിശേഷമായി, സ്വാഭാവിക പ്രൊജക്ടിനൊപ്പം സാധാരണ വായിക്കാന്‍ ശുപാര്‍ശ ചെയ്യുന്നു. ഇതിന്റെ അവസാനം മുതല്‍ അവസാനിക്കുന്ന, സ്വാഭാവികമായ പ്രൊജക്ട്സിസ്, വേഗത്തില്‍ പ്രവര്‍ത്തനസജ്ജമായ കഴിവുകള്‍ ഈ കേസ് ഉപയോഗിക്കാന്‍ ഏറ്റവും മികച്ച വഴികാട്ടിയാണ്.

അതേ, വിഐടിഎസ്‌ എം.റ്റി. - യുടെ കീഴിലാണ്‌ ലൈസൻസ്‌ ലഭിക്കുന്നത്‌, അത്‌ വാണിജ്യ ഉപയോഗം അനുവദിക്കുന്നത്‌.

അതെ, TTS.ai ലെ എല്ലാ ശബ്ദങ്ങളും വാണിജ്യ വിതരണ സജ്ജീകരണ മോഡലുകള്‍ (MIT, അച്ചാരാട്ട് 2. 0) ഉപയോഗിക്കുന്നു. നിര്‍മ്മിക്കപ്പെട്ട ഓഡിയോ നിങ്ങള്‍ക്ക് വീഡിയോകള്‍, പോസ്റ്റ്‌പോര്‍ട്ട് ആപ്സ്, ആപ്സ്, കളികള്‍, മറ്റ് ഏതെങ്കിലും വാണിജ്യ പ്രയോഗങ്ങള്‍ ഉപയോഗിക്കാനാണു്.

/api/v/ 1/ tts/ ല്‍ മാതൃകയുടെ നാമത്തോടും ശബ്ദത്തിന്റെ ഐഡിയോടും കൂടി ഒരു PAST അഭ്യര്‍ത്ഥന അയക്കുക. പൈത്തണ്‍, ജാവാസ്ക്രിപ്റ്റ്, Go, ക്യുഎസ് എന്നിവയിലുളള ഉദാഹരണങ്ങള്‍ക്കായി ഞങ്ങളുടെ API സഹായക്കുറിപ്പു് താള്‍ കാണുക.

അതെ, മാതൃകകള്‍ കേള്‍ക്കാന്‍ ഈ താളില്‍ കളിക്കുന്നതിനുള്ള ബട്ടണ്‍ ഞൊട്ടുക. സംസാര താളിലെ പദാവലിയില്‍ നിങ്ങള്‍ക്കു് യഥേഷ്ടമായ പദാവലി ടൈപ്പ് ചെയ്യുകയും ഏതെങ്കിലും ശബ്ദത്താല്‍ സ്വതന്ത്രമായ പ്രിവ്യൂ ഉണ്ടാക്കുകയും ചെയ്യാം.

ശ്രമിക്കൂ Default ഉടന്‍

ഏതു് വാചകവും ടൈപ്പ് ചെയ്തു് അതു് കേള്‍പ്പിക്കുക Default. ഉപയോഗിക്കുവാനുളള ഫ്രീ ആവശ്യമില്ലാത്ത ക്യാരക്ടറുകള്‍.