VITS

Default

இலவச ஆங்கிலம் Neutral VITS

Default என்பது VITS உரை- இருந்து- பேச்சு மாதிரியினால் இயக்கப்படும் neutral AI குரல். இந்த இலவச- தரை குரல் ஆங்கிலம் பேசுகிறது மற்றும் நல்ல- தரமான பேச்சு சேர்க்கையை வழங்குகிறது. நெருங்கிய-தடவை உருவாக்க வேகம் மற்றும் 3/5 தர மதிப்பீடுகளுடன், Default general-purpose text-to-speech with natural prosody க்கு மிகவும் பொருத்தமானது. இவ்வகைப் பறவைகள் ஈரமான இடங்களில் வாழக்கூடியவை, இவை வசிக்கும் இடம் பாதுகாப்பானது. முக்கியமான திறன்கள்: end-to-end synthesis, natural prosody, fast inference, multiple speakers.

மதிப்பீடுகள் இல்லை

VITSமாதிரி தகவல்

மாதிரி VITS
உருவாக்குநர் Jaehyeon Kim et al.
தரம்
வேகம் தற்காலிக
உரிமம் MIT
மாதிரியாக்கம் கிடைக்கவில்லை
மிருகம் இலவச (எழுத்துக்கள் பயன்படுத்தப்படவில்லை)
அளபுருக்கள் 25M
கட்டிடக்கலை VAE + Normalizing Flows + GAN
பயிற்சி தரவு 585 மணிகள்
ஆண்டு 2021

சிறந்த பயன்பாடுகள் Default

இந்த குரலின் குணங்களை அடிப்படையாகக் கொண்ட பரிந்துரைக்கப்பட்ட பயன்பாடுகள்

ஒலிப்புத்தகங்கள் & உரையாடல்Name

இயற்கையான வரிவடிவம் மற்றும் வெளிப்பாட்டின் மூலம் நீண்ட வடிவ உள்ளடக்கத்தை கூற Default ஐ பயன்படுத்தவும்.

வீடியோ குரல் மேலாண்மை

யூடியூப் வீடியோக்களுக்கு, விளம்பரங்களுக்கும், சமூக ஊடக உள்ளடக்கங்களுக்கும் தொழில்முறை உரையாடலை சேர்க்கவும்.

பயன்பாடுகள் & அணுகல்

வேகமான உருவாக்கம் இந்த குரலை உண்மையான நேர பயன்பாடுகள், திரை வாசிப்பவர்கள் மற்றும் அணுகக்கூடிய கருவிகளுக்கு சிறந்ததாக ஆக்குகிறது.

E- கற்றல் & பயிற்சி

தெளிவான AI கதையைக் கொண்ட பயிற்சிப் பொருட்கள், பயிற்சிகள் மற்றும் கல்வித் தரங்களை உருவாக்கவும்.

மேலும் VITS குரல்கள்

அதே TTS மாதிரியில் உள்ள மற்ற குரல்கள்

Baker (Chinese)

சீன மொழி Neutral

அடிக்கடி கேட்கப்படும் கேள்விகள்

VITS (முடிவு- முதல்- முடிவு உரை- இருந்து- பேச்சிற்கு எதிர்மறை கற்றல் கொண்ட மாறுபட்ட கற்பனை) என்பது ஒரு இணையான முடிவு- முதல்- முடிவு TTS முறையாகும், இது தற்போதைய இரு நிலை மாதிரிகளை விட இயல்பான ஒலியை உருவாக்குகிறது. இது இயல்பான ஓட்டங்களுடன் கூடிய மாறுபட்ட கற்பனை மற்றும் எதிர்மறை பயிற்சி செயல்முறையை ஏற்றுக் கொள்கிறது, இயல்பான ஒரு குறிப்பிடத்தக்க மேம்பாட்டை அடைகிறது.

VITS Jaehyeon Kim et al. என்பவரால் உருவாக்கப்பட்டது மற்றும் MIT உரிமத்தின் கீழ் வெளியிடப்பட்டது, இது உருவாக்கப்பட்ட ஒலியை வணிக ரீதியாக பயன்படுத்த அனுமதிக்கிறது.

VITS4மொழிகளை ஆதரிக்கின்றது: ஆங்கிலம், சீனம், ஜப்பானியம், கொரியன்.

VITS இலவச நிலையில் உள்ளது - இலவசம் - எந்த கடன்களும் தேவையில்லை. நீங்கள் முழு ஒலியை உருவாக்குவதற்கு முன் எந்த VITS குரலையும் இலவசமாக முன்பார்வை செய்யலாம்.

VITS மிகவும் வேகமான உருவாக்க வேகத்தை கொண்டுள்ளது. இது உண்மையான நேரத்திற்கு நெருக்கமாக இயங்குகிறது, இது ஒலி மற்றும் உரையாடல் பயன்பாடுகளுக்கு ஏற்றது.

VITS TTS.ai இல் ஒலி தரத்திற்காக 3/5 மதிப்பெண் பெற்றுள்ளது. இது பெரும்பாலான பயன்பாடுகளுக்கு ஏற்ற நல்ல தரமான பேச்சை வழங்குகிறது.

இல்லை, VITS ஒரு நிலையான உள்ளமைந்த குரல்களை பயன்படுத்துகிறது. குரல் ஒத்தமைப்பிற்கு, காசிவாயஸ்2, ஜிபிடி- சோவிட்ஸ் அல்லது சாட்டர்பாக்ஸ் போன்ற மாதிரிகளை முயற்சிக்கவும்.

ஆம், VITS இயற்கையான குரல்வளையைக் கொண்ட பொதுவான உரை- இருந்து- பேச்சிற்கு குறிப்பாக பரிந்துரைக்கப்படுகிறது. அதன் முடிவிலிருந்து முடிவிற்குச் சேர்த்தல், இயற்கையான குரல்வளையைக் கொண்டது, விரைவான கண்டுபிடிப்பு திறன்கள் இதை ஒரு சிறந்த தேர்வாக மாற்றுகின்றன.

ஆம், VITS MIT கீழ் அனுமதி பெற்றுள்ளது, இது வணிக பயன்பாட்டிற்கு அனுமதிக்கிறது. VITS குரல்களுடன் உருவாக்கப்பட்ட ஒலியை வீடியோக்கள், ப்ளாட்ஃபார்ம்கள், பயன்பாடுகள், விளையாட்டுகள் மற்றும் வேறு எந்த வணிக திட்டங்களிலும் பயன்படுத்தலாம்.

ஆம், TTS.aiல் உள்ள அனைத்து குரல்களும் வர்த்தக ரீதியாக அனுமதிக்கப்பட்ட திறந்த மூல மாதிரிகளை பயன்படுத்துகின்றன (MIT, Apache 2.0). உருவாக்கப்பட்ட ஒலியை வீடியோக்கள், ப்ளாட்ஃபார்ம்கள், பயன்பாடுகள், விளையாட்டுகள் மற்றும் வேறு எந்த வர்த்தக பயன்பாடுகளிலும் பயன்படுத்தலாம்.

/api/v1/tts/ க்கு ஒரு POST கோரிக்கையை அனுப்பவும். அதில் மாதிரி பெயர் மற்றும் குரல் அடையாளம் இருக்க வேண்டும். பைத்தான், ஜாவாஸ்கிரிப்ட், கோ மற்றும் cURL க்கான குறிமுறை உதாரணங்களுக்கு எங்கள் API ஆவணப் பக்கத்தைப் பாருங்கள்.

ஆம், இந்த பக்கத்தில் உள்ள இயக்க பொத்தானை க்ளிக் செய்து ஒரு மாதிரியை கேட்கலாம். உரை உரையாடல் பக்கத்தில் தனிப்பயன் உரையை நீங்கள் உள்ளிடலாம் மற்றும் எந்த குரலையும் பயன்படுத்தி இலவசமாக முன்பார்வை உருவாக்கலாம்.

முயற்சிக்கவும் Default இப்பொழுது

எந்தவொரு உரையையும் தட்டச்சு செய்து அதை பேசுவதைக் கேட்கவும்Name Default. பயன்படுத்துவதற்கு இலவசம் எழுத்துக்கள் தேவையில்லை.