VITS

Default

இலவச ஆங்கிலம் Neutral VITS

Default என்பது VITS உரை- இருந்து- பேச்சு மாதிரியினால் இயக்கப்படும் neutral AI குரல். இந்த இலவச- தரை குரல் ஆங்கிலம் பேசுகிறது மற்றும் நல்ல- தரமான பேச்சு சேர்க்கையை வழங்குகிறது. நெருங்கிய-தடவை உருவாக்க வேகம் மற்றும் 3/5 தர மதிப்பீடுகளுடன், Default general-purpose text-to-speech with natural prosody க்கு மிகவும் பொருத்தமானது. The VITS engine is developed by Jaehyeon Kim et al. under the MIT license, making it safe for commercial use. முக்கியமான திறன்கள்: end-to-end synthesis, natural prosody, fast inference, multiple speakers.

மதிப்பீடுகள் இல்லை

VITSமாதிரி தகவல்

மாதிரி VITS
உருவாக்குநர் Jaehyeon Kim et al.
தரம்
வேகம் தற்காலிக
உரிமம் MIT
மாதிரியாக்கம் கிடைக்கவில்லை
மிருகம் இலவச (எழுத்துக்கள் பயன்படுத்தப்படவில்லை)
அளபுருக்கள் 25M
கட்டிடக்கலை VAE + Normalizing Flows + GAN
பயிற்சி தரவு 585 மணிகள்
ஆண்டு 2021

சிறந்த பயன்பாடுகள் Default

இந்த குரலின் குணங்களை அடிப்படையாகக் கொண்ட பரிந்துரைக்கப்பட்ட பயன்பாடுகள்

ஒலிப்புத்தகங்கள் & உரையாடல்Name

இயற்கையான வரிவடிவம் மற்றும் வெளிப்பாட்டின் மூலம் நீண்ட வடிவ உள்ளடக்கத்தை கூற Default ஐ பயன்படுத்தவும்.

வீடியோ குரல் மேலாண்மை

யூடியூப் வீடியோக்களுக்கு, விளம்பரங்களுக்கும், சமூக ஊடக உள்ளடக்கங்களுக்கும் தொழில்முறை உரையாடலை சேர்க்கவும்.

பயன்பாடுகள் & அணுகல்

வேகமான உருவாக்கம் இந்த குரலை உண்மையான நேர பயன்பாடுகள், திரை வாசிப்பவர்கள் மற்றும் அணுகக்கூடிய கருவிகளுக்கு சிறந்ததாக ஆக்குகிறது.

E- கற்றல் & பயிற்சி

தெளிவான AI கதையைக் கொண்ட பயிற்சிப் பொருட்கள், பயிற்சிகள் மற்றும் கல்வித் தரங்களை உருவாக்கவும்.

மேலும் VITS குரல்கள்

அதே TTS மாதிரியில் உள்ள மற்ற குரல்கள்

CSS10 (Dutch)

டச்சு Neutral

CSS10 (Finnish)

ஃபினிஷ்Name Neutral

CSS10 (French)

பிரெஞ்சு Neutral

CSS10 (German)

ஜெர்மன் Neutral

CSS10 (Hungarian)

அங்கேரியன்Name Neutral

CSS10 (Spanish)

ஸ்பானிஷ்Name Neutral

அடிக்கடி கேட்கப்படும் கேள்விகள்

VITS (முடிவு- முதல்- முடிவு உரை- இருந்து- பேச்சிற்கு எதிர்மறை கற்றல் கொண்ட மாறுபட்ட கற்பனை) என்பது ஒரு இணையான முடிவு- முதல்- முடிவு TTS முறையாகும், இது தற்போதைய இரு நிலை மாதிரிகளை விட இயல்பான ஒலியை உருவாக்குகிறது. இது இயல்பான ஓட்டங்களுடன் கூடிய மாறுபட்ட கற்பனை மற்றும் எதிர்மறை பயிற்சி செயல்முறையை ஏற்றுக் கொள்கிறது, இயல்பான ஒரு குறிப்பிடத்தக்க மேம்பாட்டை அடைகிறது.

VITS Jaehyeon Kim et al. என்பவரால் உருவாக்கப்பட்டது மற்றும் MIT உரிமத்தின் கீழ் வெளியிடப்பட்டது, இது உருவாக்கப்பட்ட ஒலியை வணிக ரீதியாக பயன்படுத்த அனுமதிக்கிறது.

VITS4மொழிகளை ஆதரிக்கின்றது: ஆங்கிலம், சீனம், ஜப்பானியம், கொரியன்.

VITS இலவச நிலையில் உள்ளது - இலவசம் - எந்த கடன்களும் தேவையில்லை. நீங்கள் முழு ஒலியை உருவாக்குவதற்கு முன் எந்த VITS குரலையும் இலவசமாக முன்பார்வை செய்யலாம்.

VITS மிகவும் வேகமான உருவாக்க வேகத்தை கொண்டுள்ளது. இது உண்மையான நேரத்திற்கு நெருக்கமாக இயங்குகிறது, இது ஒலி மற்றும் உரையாடல் பயன்பாடுகளுக்கு ஏற்றது.

VITS TTS.ai இல் ஒலி தரத்திற்காக 3/5 மதிப்பெண் பெற்றுள்ளது. இது பெரும்பாலான பயன்பாடுகளுக்கு ஏற்ற நல்ல தரமான பேச்சை வழங்குகிறது.

இல்லை, VITS ஒரு நிலையான உள்ளமைந்த குரல்களை பயன்படுத்துகிறது. குரல் ஒத்தமைப்பிற்கு, காசிவாயஸ்2, ஜிபிடி- சோவிட்ஸ் அல்லது சாட்டர்பாக்ஸ் போன்ற மாதிரிகளை முயற்சிக்கவும்.

ஆம், VITS இயற்கையான குரல்வளையைக் கொண்ட பொதுவான உரை- இருந்து- பேச்சிற்கு குறிப்பாக பரிந்துரைக்கப்படுகிறது. அதன் முடிவிலிருந்து முடிவிற்குச் சேர்த்தல், இயற்கையான குரல்வளையைக் கொண்டது, விரைவான கண்டுபிடிப்பு திறன்கள் இதை ஒரு சிறந்த தேர்வாக மாற்றுகின்றன.

ஆம், VITS MIT கீழ் அனுமதி பெற்றுள்ளது, இது வணிக பயன்பாட்டிற்கு அனுமதிக்கிறது. VITS குரல்களுடன் உருவாக்கப்பட்ட ஒலியை வீடியோக்கள், ப்ளாட்ஃபார்ம்கள், பயன்பாடுகள், விளையாட்டுகள் மற்றும் வேறு எந்த வணிக திட்டங்களிலும் பயன்படுத்தலாம்.

ஆம், TTS.aiல் உள்ள அனைத்து குரல்களும் வர்த்தக ரீதியாக அனுமதிக்கப்பட்ட திறந்த மூல மாதிரிகளை பயன்படுத்துகின்றன (MIT, Apache 2.0). உருவாக்கப்பட்ட ஒலியை வீடியோக்கள், ப்ளாட்ஃபார்ம்கள், பயன்பாடுகள், விளையாட்டுகள் மற்றும் வேறு எந்த வர்த்தக பயன்பாடுகளிலும் பயன்படுத்தலாம்.

/api/v1/tts/ க்கு ஒரு POST கோரிக்கையை அனுப்பவும். அதில் மாதிரி பெயர் மற்றும் குரல் அடையாளம் இருக்க வேண்டும். பைத்தான், ஜாவாஸ்கிரிப்ட், கோ மற்றும் cURL க்கான குறிமுறை உதாரணங்களுக்கு எங்கள் API ஆவணப் பக்கத்தைப் பாருங்கள்.

ஆம், இந்த பக்கத்தில் உள்ள இயக்க பொத்தானை க்ளிக் செய்து ஒரு மாதிரியை கேட்கலாம். உரை உரையாடல் பக்கத்தில் தனிப்பயன் உரையை நீங்கள் உள்ளிடலாம் மற்றும் எந்த குரலையும் பயன்படுத்தி இலவசமாக முன்பார்வை உருவாக்கலாம்.

முயற்சிக்கவும் Default இப்பொழுது

எந்தவொரு உரையையும் தட்டச்சு செய்து அதை பேசுவதைக் கேட்கவும்Name Default. பயன்படுத்துவதற்கு இலவசம் எழுத்துக்கள் தேவையில்லை.