VITS

Default

ମୁକ୍ତ ଇଂରାଜୀName Neutral VITS

Default ଗୋଟିଏ neutral AI ଧ୍ୱନି ଯାହାକି VITS ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ମୁକ୍ତ-ସ୍ତର ଧ୍ୱନି ଇଂରାଜୀName କୁ କହୁଛି ଏବଂ ଭଲ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ପାଖାପାଖି-ତତ୍କାଳ ଉତ୍ପାଦନ ଗତି ଏବଂ 3/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, Default general-purpose text-to-speech with natural prosody ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। VITS ଯନ୍ତ୍ରଟି Jaehyeon Kim et al. under the MIT license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। ମୁଖ୍ୟ କ୍ଷମତାଗୁଡ଼ିକ ମଧ୍ୟରେ ରହିଛି: {ବିଶେଷତାଗୁଡ଼ିକ}।

ବର୍ତ୍ତମାନ କୌଣସି ଆକଳନ ନାହିଁ

VITSଆକାର ସୂଚନାName

ଆକାର VITS
ବିକାଶକାରୀ Jaehyeon Kim et al.
ଗୁଣବତ୍ତା
ବେଗ ସ୍ଥିର
ଅନୁମତିପତ୍ର MIT
କ୍ଲୋନ କରୁଅଛି ଉପଲବ୍ଧ ନାହିଁ
ଅକ୍ଟୋବର ମୁକ୍ତ (କୌଣସି ଅକ୍ଷର ବ୍ୟବହାର ହୋଇନାହିଁ)
ପ୍ରାଚଳଗୁଡ଼ିକ 25M
ବାସ୍ତୁଶାସ୍ତ୍ର VAE + Normalizing Flows + GAN
ତାଲିମ ତଥ୍ୟName 585 ଘଣ୍ଟାunit-format
ବର୍ଷ 2021

ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା Default

ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ

ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ Default କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ଭିଡିଓ ଭାଷା

YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।

ପ୍ରୟୋଗଗୁଡ଼ିକ ଏବଂ ସୁଗମତାName

ଦ୍ରୁତ ଉତ୍ପାଦନ ଏହି ଧ୍ୱନିକୁ ରିୟଲ-ଟାଇମ ପ୍ରୟୋଗ, ପରଦା ପାଠକ, ଏବଂ ସୁଗମତା ସାଧନଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ।

ଇ-ଶିକ୍ଷା ଏବଂ ପ୍ରଶିକ୍ଷଣName

ସ୍ପଷ୍ଟ ଆଇ ନାରେଟିଂ ସହିତ ଆକର୍ଷଣୀୟ ପ୍ରଶିକ୍ଷଣ ସାମଗ୍ରୀ, ପାଠ୍ୟକ୍ରମ ଏବଂ ଶିକ୍ଷାଗତ ବିଷୟବସ୍ତୁ ସୃଷ୍ଟି କରନ୍ତୁ ।

ଅଧିକ VITS ଧ୍ୱନିName

ସମାନ TTS ନମୂନାରୁ ଅନ୍ୟାନ୍ୟ ଧ୍ୱନିଗୁଡ଼ିକ

Baker (Chinese)

ଚାଇନିଜName Neutral

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

VITS (ଅନୁସରଣୀୟ ସନ୍ଧାନ ସହିତ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱିତା ଜ୍ଞାନ ପାଇଁ ଶେଷ-ରୁ-ଶେଷ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ) ଏକ ସମତଳ ଶେଷ-ରୁ-ଶେଷ TTS ପଦ୍ଧତି ଯାହାକି ବର୍ତ୍ତମାନ ଦୁଇ-ସ୍ତରୀୟ ମଡେଲ ଅପେକ୍ଷା ଅଧିକ ପ୍ରାକୃତିକ ସ୍ୱର ଧ୍ୱନି ସୃଷ୍ଟି କରିଥାଏ। ଏହା ପ୍ରାକୃତିକତାରେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ଉନ୍ନତି ହାସଲ କରିବା ପାଇଁ ସାଧାରଣକରଣ ପ୍ରବାହ ଏବଂ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱିତା ପ୍ରଶିକ୍ଷା ପ୍ରକ୍ରିୟା ସହିତ ବୃଦ୍ଧି ପାଇଥିବା ଅନୁସରଣୀୟ ସନ୍ଧାନକୁ ଗ୍ରହଣ କରିଥାଏ।

VITSକୁ ଜାଏହୟୋନ କିମ ଏବଂ ଅନ୍ୟମାନେ ବିକଶିତ କରିଛନ୍ତି ଏବଂ ଏହାକୁ ଏମ୍ଆଇଟି ଲାଇସେନ୍ସ ଅଧୀନରେ ମୁକ୍ତ କରାଯାଇଛି, ଯାହାକି ଉତ୍ପନ୍ନ ଧ୍ୱନିର ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ ।

VITS4ଭାଷାକୁ ସମର୍ଥନ କରେ: ଇଂରାଜୀ, ଚାଇନିଜ, ଜାପାନୀ, କୋରିଆନ ।

VITS ମୁକ୍ତ ସ୍ତରରେ ଅଛି - ମୁକ୍ତ - କୌଣସି କ୍ରେଡିଟ ଆବଶ୍ୟକ ନାହିଁ। ଆପଣ ସମ୍ପୂର୍ଣ୍ଣ ଧ୍ୱନି ସୃଷ୍ଟି କରିବା ପୂର୍ବରୁ କୌଣସି VITS ଧ୍ୱନିକୁ ମୁକ୍ତ ଭାବରେ ପ୍ରାକଦର୍ଶନ କରିପାରିବେ।

VITS ରେ ବହୁତ ଦ୍ରୁତ ଉତ୍ପାଦନ ବେଗ ଅଛି। ଏହା ପାଖାପାଖି ରିୟଲ-ଟାଇମରେ ଚାଲୁଛି, ଏହାକୁ ଷ୍ଟ୍ରିମିଂ ଏବଂ ଅନ୍ତରାପୃଷ୍ଠ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଉପଯୁକ୍ତ କରିଥାଏ।

VITSକୁ TTS.ai ରେ ଧ୍ୱନି ଗୁଣବତ୍ତା ପାଇଁ 3/5 ରୂପେ ମାନ ଦିଆଯାଇଛି। ଏହା ଅଧିକାଂଶ ପ୍ରୟୋଗ ପାଇଁ ଉପଯୁକ୍ତ ଭଲ ଗୁଣବତ୍ତା ବିଶିଷ୍ଟ ଭାଷା ପ୍ରଦାନ କରିଥାଏ।

ନା, VITS ସ୍ଥାପିତ ଧ୍ୱନିଗୁଡ଼ିକର ଗୋଟିଏ ସ୍ଥିର ସେଟକୁ ବ୍ୟବହାର କରେ। ଧ୍ୱନି କ୍ଲୋନିଂ ପାଇଁ, CosyVoice2, GPT-SoVITS, କିମ୍ବା Chatterbox ପରି ନମୂନାକୁ ଚେଷ୍ଟାକରନ୍ତୁ।

ହଁ, VITS କୁ ପ୍ରାକୃତିକ ସ୍ପର୍ଶ ସହିତ ସାଧାରଣ ଉଦ୍ଦେଶ୍ୟ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ପାଇଁ ବିଶେଷ ଭାବରେ ପରାମର୍ଶ ଦିଆଯାଏ । ଏହାର ଶେଷ-ରୁ-ଶେଷ ସଂଶ୍ଲେଷଣ, ପ୍ରାକୃତିକ ସ୍ପର୍ଶ, ଦ୍ରୁତ ଅନୁମାନ କ୍ଷମତା ଏହାକୁ ଏହି ବ୍ୟବହାର ମାମଲା ପାଇଁ ଏକ ଉତ୍ତମ ଚୟନ କରିଥାଏ ।

ହଁ, VITS MIT ଅନ୍ତର୍ଗତ ଲାଇସେନ୍ସିତ, ଯାହା ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ। VITS ଧ୍ୱନି ସହିତ ଉତ୍ପନ୍ନ ଧ୍ୱନିକୁ ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରକଳ୍ପରେ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ହଁ, TTS.ai ରେ ସମସ୍ତ ଧ୍ୱନି ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (MIT, Apache 2.0) ବ୍ୟବହାର କରିଥାଏ। ନିର୍ଗତ ଧ୍ୱନିଟି ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରୟୋଗରେ ବ୍ୟବହାର ପାଇଁ ଆପଣଙ୍କର ଅଟେ।

/api/v1/tts/କୁ ଆକାର ନାମ ଏବଂ ଭାଷା ID ସହିତ ଗୋଟିଏ POST ଅନୁରୋଧ ପଠାନ୍ତୁ। Python, JavaScript, Go, ଏବଂ cURL ରେ କୋଡ ଉଦାହରଣ ପାଇଁ ଆମର API ଦଲିଲିକରଣ ପୃଷ୍ଠାକୁ ଦେଖନ୍ତୁ।

ହଁ, ଗୋଟିଏ ନମୁନା ଶୁଣିବା ପାଇଁ ଏହି ପୃଷ୍ଠାରେ ଚାଲାଇବା ବଟନକୁ କ୍ଲିକ କରନ୍ତୁ। ଆପଣ ପାଠ୍ୟରୁ ଭାଷଣ ପୃଷ୍ଠାରେ ଇଚ୍ଛାରୂପୀ ପାଠ୍ୟ ଟାଇପ କରିପାରିବେ ଏବଂ କୌଣସି ଭାଷା ସହିତ ମୁକ୍ତ ପ୍ରାକଦର୍ଶନ ସୃଷ୍ଟି କରିପାରିବେ।

ଚେଷ୍ଟାକରନ୍ତୁ Default ବର୍ତ୍ତମାନ

ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ Default. ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ କୌଣସି ଅକ୍ଷର ଆବଶ୍ୟକ ନାହିଁ.