GPT-SoVITS

Korean Default

ପୂର୍ବନିର୍ଦ୍ଧାରିତ କୋରିଆନName Neutral GPT-SoVITS

Korean Default ଗୋଟିଏ neutral AI ଧ୍ୱନି ଯାହାକି GPT-SoVITS ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ପୂର୍ବନିର୍ଦ୍ଧାରିତ ସ୍ତର ଧ୍ୱନି କୋରିଆନName କୁ କହୁଛି ଏବଂ ଷ୍ଟୁଡିଓ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ଧୀରେ ଧୀରେ କିନ୍ତୁ ଉଚ୍ଚ-ସତ୍ୟତା ଉତ୍ପାଦନ ଗତି ଏବଂ 5/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, Korean Default voice cloning, singing synthesis, content creator voice replication ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। GPT-SoVITS ଯନ୍ତ୍ରଟି RVC-Boss under the MIT license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। ମୁଖ୍ୟ କ୍ଷମତାଗୁଡ଼ିକ ମଧ୍ୟରେ ରହିଛି: {ବିଶେଷତାଗୁଡ଼ିକ}। GPT-SoVITS ନମୁନାଟି ମଧ୍ୟ ସ୍ୱର କ୍ଲୋନିଂକୁ ସମର୍ଥନ କରେ - ଗୋଟିଏ ଇଚ୍ଛାରୂପୀ ସ୍ୱର ନିର୍ମାଣ କରିବା ପାଇଁ ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଯାହାକି ସମାନ ଗୁଣବତ୍ତା ଗୁଣଧର୍ମକୁ ଧାରଣ କରିଥାଏ।

ବର୍ତ୍ତମାନ କୌଣସି ଆକଳନ ନାହିଁ

GPT-SoVITSଆକାର ସୂଚନାName

ଆକାର GPT-SoVITS
ବିକାଶକାରୀ RVC-Boss
ଗୁଣବତ୍ତା
ବେଗ ଧୀରେ ଧୀରେ
ଅନୁମତିପତ୍ର MIT
କ୍ଲୋନ କରୁଅଛି ସମର୍ଥିତ
ଅକ୍ଟୋବର ମାନକ (2 କ୍ରେଡିଟ/1K ଅକ୍ଷର)
ପ୍ରାଚଳଗୁଡ଼ିକ 200M
ବାସ୍ତୁଶାସ୍ତ୍ର GPT + SoVITS
ବର୍ଷ 2024

ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା Korean Default

ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ

ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ Korean Default କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ଭିଡିଓ ଭାଷା

YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।

ପଡକଡ଼ଗୁଡ଼ିକ ଏବଂ ପ୍ରସାରଣName

ପଡକଡ଼, ରେଡିଓ ଏବଂ ବ୍ଯବସାୟିକ ପ୍ରସାରଣ ପାଇଁ ଉପଯୁକ୍ତ ଷ୍ଟୁଡିଓ-ଗୁଣମାନର ନିର୍ଗମ।

ଇଚ୍ଛାରୂପଣ ବ୍ରାଣ୍ଡ ଧ୍ୱନି

ଗୋଟିଏ ଭିନ୍ନ ଭିନ୍ନ ବ୍ରାଣ୍ଡ TTS ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ ଏହି ଧ୍ୱନି ଶୈଳୀକୁ ଆପଣଙ୍କର ନିଜ ଧ୍ୱନି ସହିତ କ୍ଲୋନ କରନ୍ତୁ।

ଅଧିକ GPT-SoVITS ଧ୍ୱନିName

ସମାନ TTS ନମୂନାରୁ ଅନ୍ୟାନ୍ୟ ଧ୍ୱନିଗୁଡ଼ିକ

Default

ଚାଇନିଜName Neutral

English Default

ଇଂରାଜୀName Neutral

Japanese Default

ଜାପାନୀଜName Neutral

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

GPT-SoVITS ଶକ୍ତିଶାଳୀ କିଛି-ଶଟ ସ୍ୱର କ୍ଲୋନିଂ ପାଇଁ SoVITS (ସଂବାଦ ଓ ସଂଶ୍ଳୋଧନ ମାଧ୍ୟମରେ ଗୀତ ଗାଇବାର ଅନୁମାନ) ସହିତ GPT-ଶୈଳୀ ଭାଷା ମଡେଲିଂକୁ ସଂଯୋଜିତ କରିଥାଏ।5ସେକେଣ୍ଡ ସଂରକ୍ଷିତ ସଂଦୃଶ ଧ୍ୱନି ସହିତ, ଏହା ସଠିକ୍ ଭାବରେ ଗୋଟିଏ ସ୍ୱରକୁ କ୍ଲୋନ କରିପାରେ ଏବଂ ବକ୍ତାଙ୍କ ଭିନ୍ନ ଭିନ୍ନ ଗୁଣଧର୍ମକୁ ସଂରକ୍ଷଣ କରି ନୂତନ ବକ୍ତବ୍ୟ ସୃଷ୍ଟି କରିପାରେ। ଏହା ଉଭୟ ବକ୍ତବ୍ୟ ଏବଂ ଗୀତ ଗାଇବାର ସ୍ୱର ସଂଶ୍ଳୋଧନରେ ଉତ୍ତମ।

GPT-SoVITSକୁ RVC-Boss ଦ୍ୱାରା ବିକଶିତ କରାଯାଇଛି ଏବଂ MIT ଲାଇସେନ୍ସ ଅନ୍ତର୍ଗତ ପ୍ରକାଶିତ ହୋଇଛି, ଯାହାକି ଉତ୍ପନ୍ନ ଧ୍ୱନିର ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ ।

GPT-SoVITS4ଭାଷାକୁ ସମର୍ଥନ କରେ: ଇଂରାଜୀ, ଚାଇନିଜ, ଜାପାନୀ, କୋରିଆନ।

GPT-SoVITS ମାନକ ସ୍ତରରେ ଅଛି - ପ୍ରତି 1,000 ଅକ୍ଷରରେ2କରେଡିଟ। ଆପଣ ସମ୍ପୂର୍ଣ୍ଣ ଧ୍ୱନି ସୃଷ୍ଟି କରିବା ପୂର୍ବରୁ ଯେକୌଣସି GPT-SoVITS ଧ୍ୱନିକୁ ମୁକ୍ତରେ ପ୍ରାକଦର୍ଶନ କରିପାରିବେ।

GPT-SoVITS ରେ ଧିରେ (ଗୁଣବତ୍ତାକୁ ପ୍ରାଥମିକତା ଦେଇ) ଉତ୍ପାଦନ ବେଗ ଅଛି। ଏହା ପ୍ରତି ଉତ୍ପାଦନ ପାଇଁ ଅଧିକ ସମୟ ଗ୍ରହଣ କରେ କିନ୍ତୁ ଉଚ୍ଚ ସ୍ଥାୟୀତା ନିର୍ଗମ କରିଥାଏ।

GPT-SoVITS କୁ TTS.ai ରେ ଧ୍ୱନି ଗୁଣବତ୍ତା ପାଇଁ 5/5 ରୂପେ ମାନ ଦିଆଯାଇଛି। ଏହା ଷ୍ଟୁଡିଓ-ସ୍ତରୀୟ, ମାନବୀୟ-ସଦୃଶ ଭାଷଣ ପ୍ରଦାନ କରିଥାଏ।

ହଁ, GPT-SoVITS ଶୂନ୍ଯ-ଶଟ ଧ୍ୱନି କ୍ଲୋନକୁ ସମର୍ଥନ କରେ। ଗୋଟିଏ ଇଚ୍ଛାରୂପଣ ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ 5-30 ସେକଣ୍ଡର ସଂଯୋଗ ଧ୍ୱନିକୁ ଅଦ୍ୟତନ କରନ୍ତୁ।

ହଁ, GPT-SoVITS କୁ ସ୍ୱର କ୍ଲୋନିଂ, ଗୀତ ସଂଶ୍ଳୋଧନ, ବିଷୟବସ୍ତୁ ନିର୍ମାତା ସ୍ୱର ପ୍ରତିଲିପିକରଣ ପାଇଁ ବିଶେଷ ଭାବରେ ପରାମର୍ଶ ଦିଆଯାଏ। ଏହାର5ସେକେଣ୍ଡ କ୍ଲୋନିଂ, ଗୀତ ଗାଇବାର ସ୍ୱର, କିଛି-ଶଟ ଶିକ୍ଷାଦାନ କ୍ଷମତା ଏହାକୁ ଏହି ବ୍ୟବହାର ମାମଲା ପାଇଁ ଏକ ଉତ୍ତମ ଚୟନ କରିଥାଏ।

ହଁ, GPT-SoVITS MIT ଅନ୍ତର୍ଗତ ଲାଇସେନ୍ସିତ, ଯାହା ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ। GPT-SoVITS ଧ୍ୱନି ସହିତ ଉତ୍ପନ୍ନ ଧ୍ୱନିକୁ ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରକଳ୍ପରେ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ହଁ, TTS.ai ରେ ସମସ୍ତ ଧ୍ୱନି ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (MIT, Apache 2.0) ବ୍ୟବହାର କରିଥାଏ। ନିର୍ଗତ ଧ୍ୱନିଟି ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରୟୋଗରେ ବ୍ୟବହାର ପାଇଁ ଆପଣଙ୍କର ଅଟେ।

/api/v1/tts/କୁ ଆକାର ନାମ ଏବଂ ଭାଷା ID ସହିତ ଗୋଟିଏ POST ଅନୁରୋଧ ପଠାନ୍ତୁ। Python, JavaScript, Go, ଏବଂ cURL ରେ କୋଡ ଉଦାହରଣ ପାଇଁ ଆମର API ଦଲିଲିକରଣ ପୃଷ୍ଠାକୁ ଦେଖନ୍ତୁ।

ହଁ, ଗୋଟିଏ ନମୁନା ଶୁଣିବା ପାଇଁ ଏହି ପୃଷ୍ଠାରେ ଚାଲାଇବା ବଟନକୁ କ୍ଲିକ କରନ୍ତୁ। ଆପଣ ପାଠ୍ୟରୁ ଭାଷଣ ପୃଷ୍ଠାରେ ଇଚ୍ଛାରୂପୀ ପାଠ୍ୟ ଟାଇପ କରିପାରିବେ ଏବଂ କୌଣସି ଭାଷା ସହିତ ମୁକ୍ତ ପ୍ରାକଦର୍ଶନ ସୃଷ୍ଟି କରିପାରିବେ।

ଚେଷ୍ଟାକରନ୍ତୁ Korean Default ବର୍ତ୍ତମାନ

ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ Korean Default. ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ.