GPT-SoVITS

English Default

ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଇଂରାଜୀName Neutral GPT-SoVITS

English Default ଗୋଟିଏ neutral AI ଧ୍ୱନି ଯାହାକି GPT-SoVITS ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ପୂର୍ବନିର୍ଦ୍ଧାରିତ ସ୍ତର ଧ୍ୱନି ଇଂରାଜୀName କୁ କହୁଛି ଏବଂ ଷ୍ଟୁଡିଓ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ଧୀରେ ଧୀରେ କିନ୍ତୁ ଉଚ୍ଚ-ସତ୍ୟତା ଉତ୍ପାଦନ ଗତି ଏବଂ 5/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, English Default voice cloning, singing synthesis, content creator voice replication ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। GPT-SoVITS ଯନ୍ତ୍ରଟି RVC-Boss under the MIT license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। ମୁଖ୍ୟ କ୍ଷମତାଗୁଡ଼ିକ ମଧ୍ୟରେ ରହିଛି: {ବିଶେଷତାଗୁଡ଼ିକ}। GPT-SoVITS ନମୁନାଟି ମଧ୍ୟ ସ୍ୱର କ୍ଲୋନିଂକୁ ସମର୍ଥନ କରେ - ଗୋଟିଏ ଇଚ୍ଛାରୂପୀ ସ୍ୱର ନିର୍ମାଣ କରିବା ପାଇଁ ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଯାହାକି ସମାନ ଗୁଣବତ୍ତା ଗୁଣଧର୍ମକୁ ଧାରଣ କରିଥାଏ।

ବର୍ତ୍ତମାନ କୌଣସି ଆକଳନ ନାହିଁ

GPT-SoVITSଆକାର ସୂଚନାName

ଆକାର GPT-SoVITS
ବିକାଶକାରୀ RVC-Boss
ଗୁଣବତ୍ତା
ବେଗ ଧୀରେ ଧୀରେ
ଅନୁମତିପତ୍ର MIT
କ୍ଲୋନ କରୁଅଛି ସମର୍ଥିତ
ଅକ୍ଟୋବର ମାନକ (2 କ୍ରେଡିଟ/1K ଅକ୍ଷର)
ପ୍ରାଚଳଗୁଡ଼ିକ 200M
ବାସ୍ତୁଶାସ୍ତ୍ର GPT + SoVITS
ବର୍ଷ 2024

ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା English Default

ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ

ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ English Default କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ଭିଡିଓ ଭାଷା

YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।

ପଡକଡ଼ଗୁଡ଼ିକ ଏବଂ ପ୍ରସାରଣName

ପଡକଡ଼, ରେଡିଓ ଏବଂ ବ୍ଯବସାୟିକ ପ୍ରସାରଣ ପାଇଁ ଉପଯୁକ୍ତ ଷ୍ଟୁଡିଓ-ଗୁଣମାନର ନିର୍ଗମ।

ଇଚ୍ଛାରୂପଣ ବ୍ରାଣ୍ଡ ଧ୍ୱନି

ଗୋଟିଏ ଭିନ୍ନ ଭିନ୍ନ ବ୍ରାଣ୍ଡ TTS ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ ଏହି ଧ୍ୱନି ଶୈଳୀକୁ ଆପଣଙ୍କର ନିଜ ଧ୍ୱନି ସହିତ କ୍ଲୋନ କରନ୍ତୁ।

ଅଧିକ GPT-SoVITS ଧ୍ୱନିName

ସମାନ TTS ନମୂନାରୁ ଅନ୍ୟାନ୍ୟ ଧ୍ୱନିଗୁଡ଼ିକ

Default

ଚାଇନିଜName Neutral

Japanese Default

ଜାପାନୀଜName Neutral

Korean Default

କୋରିଆନName Neutral

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

GPT-SoVITS ଶକ୍ତିଶାଳୀ କିଛି-ଶଟ ସ୍ୱର କ୍ଲୋନିଂ ପାଇଁ SoVITS (ସଂବାଦ ଓ ସଂଶ୍ଳୋଧନ ମାଧ୍ୟମରେ ଗୀତ ଗାଇବାର ଅନୁମାନ) ସହିତ GPT-ଶୈଳୀ ଭାଷା ମଡେଲିଂକୁ ସଂଯୋଜିତ କରିଥାଏ।5ସେକେଣ୍ଡ ସଂରକ୍ଷିତ ସଂଦୃଶ ଧ୍ୱନି ସହିତ, ଏହା ସଠିକ୍ ଭାବରେ ଗୋଟିଏ ସ୍ୱରକୁ କ୍ଲୋନ କରିପାରେ ଏବଂ ବକ୍ତାଙ୍କ ଭିନ୍ନ ଭିନ୍ନ ଗୁଣଧର୍ମକୁ ସଂରକ୍ଷଣ କରି ନୂତନ ବକ୍ତବ୍ୟ ସୃଷ୍ଟି କରିପାରେ। ଏହା ଉଭୟ ବକ୍ତବ୍ୟ ଏବଂ ଗୀତ ଗାଇବାର ସ୍ୱର ସଂଶ୍ଳୋଧନରେ ଉତ୍ତମ।

GPT-SoVITSକୁ RVC-Boss ଦ୍ୱାରା ବିକଶିତ କରାଯାଇଛି ଏବଂ MIT ଲାଇସେନ୍ସ ଅନ୍ତର୍ଗତ ପ୍ରକାଶିତ ହୋଇଛି, ଯାହାକି ଉତ୍ପନ୍ନ ଧ୍ୱନିର ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ ।

GPT-SoVITS4ଭାଷାକୁ ସମର୍ଥନ କରେ: ଇଂରାଜୀ, ଚାଇନିଜ, ଜାପାନୀ, କୋରିଆନ।

GPT-SoVITS ମାନକ ସ୍ତରରେ ଅଛି - ପ୍ରତି 1,000 ଅକ୍ଷରରେ2କରେଡିଟ। ଆପଣ ସମ୍ପୂର୍ଣ୍ଣ ଧ୍ୱନି ସୃଷ୍ଟି କରିବା ପୂର୍ବରୁ ଯେକୌଣସି GPT-SoVITS ଧ୍ୱନିକୁ ମୁକ୍ତରେ ପ୍ରାକଦର୍ଶନ କରିପାରିବେ।

GPT-SoVITS ରେ ଧିରେ (ଗୁଣବତ୍ତାକୁ ପ୍ରାଥମିକତା ଦେଇ) ଉତ୍ପାଦନ ବେଗ ଅଛି। ଏହା ପ୍ରତି ଉତ୍ପାଦନ ପାଇଁ ଅଧିକ ସମୟ ଗ୍ରହଣ କରେ କିନ୍ତୁ ଉଚ୍ଚ ସ୍ଥାୟୀତା ନିର୍ଗମ କରିଥାଏ।

GPT-SoVITS କୁ TTS.ai ରେ ଧ୍ୱନି ଗୁଣବତ୍ତା ପାଇଁ 5/5 ରୂପେ ମାନ ଦିଆଯାଇଛି। ଏହା ଷ୍ଟୁଡିଓ-ସ୍ତରୀୟ, ମାନବୀୟ-ସଦୃଶ ଭାଷଣ ପ୍ରଦାନ କରିଥାଏ।

ହଁ, GPT-SoVITS ଶୂନ୍ଯ-ଶଟ ଧ୍ୱନି କ୍ଲୋନକୁ ସମର୍ଥନ କରେ। ଗୋଟିଏ ଇଚ୍ଛାରୂପଣ ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ 5-30 ସେକଣ୍ଡର ସଂଯୋଗ ଧ୍ୱନିକୁ ଅଦ୍ୟତନ କରନ୍ତୁ।

ହଁ, GPT-SoVITS କୁ ସ୍ୱର କ୍ଲୋନିଂ, ଗୀତ ସଂଶ୍ଳୋଧନ, ବିଷୟବସ୍ତୁ ନିର୍ମାତା ସ୍ୱର ପ୍ରତିଲିପିକରଣ ପାଇଁ ବିଶେଷ ଭାବରେ ପରାମର୍ଶ ଦିଆଯାଏ। ଏହାର5ସେକେଣ୍ଡ କ୍ଲୋନିଂ, ଗୀତ ଗାଇବାର ସ୍ୱର, କିଛି-ଶଟ ଶିକ୍ଷାଦାନ କ୍ଷମତା ଏହାକୁ ଏହି ବ୍ୟବହାର ମାମଲା ପାଇଁ ଏକ ଉତ୍ତମ ଚୟନ କରିଥାଏ।

ହଁ, GPT-SoVITS MIT ଅନ୍ତର୍ଗତ ଲାଇସେନ୍ସିତ, ଯାହା ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ। GPT-SoVITS ଧ୍ୱନି ସହିତ ଉତ୍ପନ୍ନ ଧ୍ୱନିକୁ ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରକଳ୍ପରେ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ହଁ, TTS.ai ରେ ସମସ୍ତ ଧ୍ୱନି ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (MIT, Apache 2.0) ବ୍ୟବହାର କରିଥାଏ। ନିର୍ଗତ ଧ୍ୱନିଟି ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରୟୋଗରେ ବ୍ୟବହାର ପାଇଁ ଆପଣଙ୍କର ଅଟେ।

/api/v1/tts/କୁ ଆକାର ନାମ ଏବଂ ଭାଷା ID ସହିତ ଗୋଟିଏ POST ଅନୁରୋଧ ପଠାନ୍ତୁ। Python, JavaScript, Go, ଏବଂ cURL ରେ କୋଡ ଉଦାହରଣ ପାଇଁ ଆମର API ଦଲିଲିକରଣ ପୃଷ୍ଠାକୁ ଦେଖନ୍ତୁ।

ହଁ, ଗୋଟିଏ ନମୁନା ଶୁଣିବା ପାଇଁ ଏହି ପୃଷ୍ଠାରେ ଚାଲାଇବା ବଟନକୁ କ୍ଲିକ କରନ୍ତୁ। ଆପଣ ପାଠ୍ୟରୁ ଭାଷଣ ପୃଷ୍ଠାରେ ଇଚ୍ଛାରୂପୀ ପାଠ୍ୟ ଟାଇପ କରିପାରିବେ ଏବଂ କୌଣସି ଭାଷା ସହିତ ମୁକ୍ତ ପ୍ରାକଦର୍ଶନ ସୃଷ୍ଟି କରିପାରିବେ।

ଚେଷ୍ଟାକରନ୍ତୁ English Default ବର୍ତ୍ତମାନ

ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ English Default. ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ.