VITS

Common Voice (Bulgarian)

ମୁକ୍ତ ବୁଲଗାରିଆନName Neutral VITS

Common Voice (Bulgarian) ଗୋଟିଏ neutral AI ଧ୍ୱନି ଯାହାକି VITS ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ମୁକ୍ତ-ସ୍ତର ଧ୍ୱନି ବୁଲଗାରିଆନName କୁ କହୁଛି ଏବଂ ଭଲ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ପାଖାପାଖି-ତତ୍କାଳ ଉତ୍ପାଦନ ଗତି ଏବଂ 3/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, Common Voice (Bulgarian) general-purpose text-to-speech with natural prosody ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। VITS ଯନ୍ତ୍ରଟି Jaehyeon Kim et al. under the MIT license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। ମୁଖ୍ୟ କ୍ଷମତାଗୁଡ଼ିକ ମଧ୍ୟରେ ରହିଛି: {ବିଶେଷତାଗୁଡ଼ିକ}।

ବର୍ତ୍ତମାନ କୌଣସି ଆକଳନ ନାହିଁ

VITSଆକାର ସୂଚନାName

ଆକାର VITS
ବିକାଶକାରୀ Jaehyeon Kim et al.
ଗୁଣବତ୍ତା
ବେଗ ସ୍ଥିର
ଅନୁମତିପତ୍ର MIT
କ୍ଲୋନ କରୁଅଛି ଉପଲବ୍ଧ ନାହିଁ
ଅକ୍ଟୋବର ମୁକ୍ତ (କୌଣସି ଅକ୍ଷର ବ୍ୟବହାର ହୋଇନାହିଁ)
ପ୍ରାଚଳଗୁଡ଼ିକ 25M
ବାସ୍ତୁଶାସ୍ତ୍ର VAE + Normalizing Flows + GAN
ତାଲିମ ତଥ୍ୟName 585 ଘଣ୍ଟାunit-format
ବର୍ଷ 2021

ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା Common Voice (Bulgarian)

ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ

ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ Common Voice (Bulgarian) କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ଭିଡିଓ ଭାଷା

YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।

ପ୍ରୟୋଗଗୁଡ଼ିକ ଏବଂ ସୁଗମତାName

ଦ୍ରୁତ ଉତ୍ପାଦନ ଏହି ଧ୍ୱନିକୁ ରିୟଲ-ଟାଇମ ପ୍ରୟୋଗ, ପରଦା ପାଠକ, ଏବଂ ସୁଗମତା ସାଧନଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ।

ଇ-ଶିକ୍ଷା ଏବଂ ପ୍ରଶିକ୍ଷଣName

ସ୍ପଷ୍ଟ ଆଇ ନାରେଟିଂ ସହିତ ଆକର୍ଷଣୀୟ ପ୍ରଶିକ୍ଷଣ ସାମଗ୍ରୀ, ପାଠ୍ୟକ୍ରମ ଏବଂ ଶିକ୍ଷାଗତ ବିଷୟବସ୍ତୁ ସୃଷ୍ଟି କରନ୍ତୁ ।

ଅଧିକ VITS ଧ୍ୱନିName

ସମାନ TTS ନମୂନାରୁ ଅନ୍ୟାନ୍ୟ ଧ୍ୱନିଗୁଡ଼ିକ

CSS10 (Dutch)

ଡଚName Neutral

CSS10 (Finnish)

ଫିନଲ୍ୟାଣ୍ଡName Neutral

CSS10 (French)

ଫ୍ରେଞ୍ଚName Neutral

CSS10 (German)

ଜର୍ମାନName Neutral

CSS10 (Hungarian)

ହଙ୍ଗେରିୟନName Neutral

CSS10 (Spanish)

ସ୍ପେନିସName Neutral

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

VITS (ଅନୁସରଣୀୟ ସନ୍ଧାନ ସହିତ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱିତା ଜ୍ଞାନ ପାଇଁ ଶେଷ-ରୁ-ଶେଷ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ) ଏକ ସମତଳ ଶେଷ-ରୁ-ଶେଷ TTS ପଦ୍ଧତି ଯାହାକି ବର୍ତ୍ତମାନ ଦୁଇ-ସ୍ତରୀୟ ମଡେଲ ଅପେକ୍ଷା ଅଧିକ ପ୍ରାକୃତିକ ସ୍ୱର ଧ୍ୱନି ସୃଷ୍ଟି କରିଥାଏ। ଏହା ପ୍ରାକୃତିକତାରେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ଉନ୍ନତି ହାସଲ କରିବା ପାଇଁ ସାଧାରଣକରଣ ପ୍ରବାହ ଏବଂ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱିତା ପ୍ରଶିକ୍ଷା ପ୍ରକ୍ରିୟା ସହିତ ବୃଦ୍ଧି ପାଇଥିବା ଅନୁସରଣୀୟ ସନ୍ଧାନକୁ ଗ୍ରହଣ କରିଥାଏ।

VITSକୁ ଜାଏହୟୋନ କିମ ଏବଂ ଅନ୍ୟମାନେ ବିକଶିତ କରିଛନ୍ତି ଏବଂ ଏହାକୁ ଏମ୍ଆଇଟି ଲାଇସେନ୍ସ ଅଧୀନରେ ମୁକ୍ତ କରାଯାଇଛି, ଯାହାକି ଉତ୍ପନ୍ନ ଧ୍ୱନିର ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ ।

VITS4ଭାଷାକୁ ସମର୍ଥନ କରେ: ଇଂରାଜୀ, ଚାଇନିଜ, ଜାପାନୀ, କୋରିଆନ ।

VITS ମୁକ୍ତ ସ୍ତରରେ ଅଛି - ମୁକ୍ତ - କୌଣସି କ୍ରେଡିଟ ଆବଶ୍ୟକ ନାହିଁ। ଆପଣ ସମ୍ପୂର୍ଣ୍ଣ ଧ୍ୱନି ସୃଷ୍ଟି କରିବା ପୂର୍ବରୁ କୌଣସି VITS ଧ୍ୱନିକୁ ମୁକ୍ତ ଭାବରେ ପ୍ରାକଦର୍ଶନ କରିପାରିବେ।

VITS ରେ ବହୁତ ଦ୍ରୁତ ଉତ୍ପାଦନ ବେଗ ଅଛି। ଏହା ପାଖାପାଖି ରିୟଲ-ଟାଇମରେ ଚାଲୁଛି, ଏହାକୁ ଷ୍ଟ୍ରିମିଂ ଏବଂ ଅନ୍ତରାପୃଷ୍ଠ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଉପଯୁକ୍ତ କରିଥାଏ।

VITSକୁ TTS.ai ରେ ଧ୍ୱନି ଗୁଣବତ୍ତା ପାଇଁ 3/5 ରୂପେ ମାନ ଦିଆଯାଇଛି। ଏହା ଅଧିକାଂଶ ପ୍ରୟୋଗ ପାଇଁ ଉପଯୁକ୍ତ ଭଲ ଗୁଣବତ୍ତା ବିଶିଷ୍ଟ ଭାଷା ପ୍ରଦାନ କରିଥାଏ।

ନା, VITS ସ୍ଥାପିତ ଧ୍ୱନିଗୁଡ଼ିକର ଗୋଟିଏ ସ୍ଥିର ସେଟକୁ ବ୍ୟବହାର କରେ। ଧ୍ୱନି କ୍ଲୋନିଂ ପାଇଁ, CosyVoice2, GPT-SoVITS, କିମ୍ବା Chatterbox ପରି ନମୂନାକୁ ଚେଷ୍ଟାକରନ୍ତୁ।

ହଁ, VITS କୁ ପ୍ରାକୃତିକ ସ୍ପର୍ଶ ସହିତ ସାଧାରଣ ଉଦ୍ଦେଶ୍ୟ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ପାଇଁ ବିଶେଷ ଭାବରେ ପରାମର୍ଶ ଦିଆଯାଏ । ଏହାର ଶେଷ-ରୁ-ଶେଷ ସଂଶ୍ଲେଷଣ, ପ୍ରାକୃତିକ ସ୍ପର୍ଶ, ଦ୍ରୁତ ଅନୁମାନ କ୍ଷମତା ଏହାକୁ ଏହି ବ୍ୟବହାର ମାମଲା ପାଇଁ ଏକ ଉତ୍ତମ ଚୟନ କରିଥାଏ ।

ହଁ, VITS MIT ଅନ୍ତର୍ଗତ ଲାଇସେନ୍ସିତ, ଯାହା ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ। VITS ଧ୍ୱନି ସହିତ ଉତ୍ପନ୍ନ ଧ୍ୱନିକୁ ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରକଳ୍ପରେ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ହଁ, TTS.ai ରେ ସମସ୍ତ ଧ୍ୱନି ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (MIT, Apache 2.0) ବ୍ୟବହାର କରିଥାଏ। ନିର୍ଗତ ଧ୍ୱନିଟି ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରୟୋଗରେ ବ୍ୟବହାର ପାଇଁ ଆପଣଙ୍କର ଅଟେ।

/api/v1/tts/କୁ ଆକାର ନାମ ଏବଂ ଭାଷା ID ସହିତ ଗୋଟିଏ POST ଅନୁରୋଧ ପଠାନ୍ତୁ। Python, JavaScript, Go, ଏବଂ cURL ରେ କୋଡ ଉଦାହରଣ ପାଇଁ ଆମର API ଦଲିଲିକରଣ ପୃଷ୍ଠାକୁ ଦେଖନ୍ତୁ।

ହଁ, ଗୋଟିଏ ନମୁନା ଶୁଣିବା ପାଇଁ ଏହି ପୃଷ୍ଠାରେ ଚାଲାଇବା ବଟନକୁ କ୍ଲିକ କରନ୍ତୁ। ଆପଣ ପାଠ୍ୟରୁ ଭାଷଣ ପୃଷ୍ଠାରେ ଇଚ୍ଛାରୂପୀ ପାଠ୍ୟ ଟାଇପ କରିପାରିବେ ଏବଂ କୌଣସି ଭାଷା ସହିତ ମୁକ୍ତ ପ୍ରାକଦର୍ଶନ ସୃଷ୍ଟି କରିପାରିବେ।

ଚେଷ୍ଟାକରନ୍ତୁ Common Voice (Bulgarian) ବର୍ତ୍ତମାନ

ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ Common Voice (Bulgarian). ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ କୌଣସି ଅକ୍ଷର ଆବଶ୍ୟକ ନାହିଁ.