VoxCPM

Default Chinese

ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଚାଇନିଜName Neutral VoxCPM

Default Chinese ଗୋଟିଏ neutral AI ଧ୍ୱନି ଯାହାକି VoxCPM ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ପୂର୍ବନିର୍ଦ୍ଧାରିତ ସ୍ତର ଧ୍ୱନି ଚାଇନିଜName କୁ କହୁଛି ଏବଂ ଷ୍ଟୁଡିଓ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ପାଖାପାଖି-ତତ୍କାଳ ଉତ୍ପାଦନ ଗତି ଏବଂ 5/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, Default Chinese high-fidelity audio, audiobooks, long-form content with voice consistency ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। VoxCPM ଯନ୍ତ୍ରଟି OpenBMB under the Apache 2.0 license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। ମୁଖ୍ୟ କ୍ଷମତାଗୁଡ଼ିକ ମଧ୍ୟରେ ରହିଛି: {ବିଶେଷତାଗୁଡ଼ିକ}। VoxCPM ନମୁନାଟି ମଧ୍ୟ ସ୍ୱର କ୍ଲୋନିଂକୁ ସମର୍ଥନ କରେ - ଗୋଟିଏ ଇଚ୍ଛାରୂପୀ ସ୍ୱର ନିର୍ମାଣ କରିବା ପାଇଁ ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଯାହାକି ସମାନ ଗୁଣବତ୍ତା ଗୁଣଧର୍ମକୁ ଧାରଣ କରିଥାଏ।

ବର୍ତ୍ତମାନ କୌଣସି ଆକଳନ ନାହିଁ

VoxCPMଆକାର ସୂଚନାName

ଆକାର VoxCPM
ବିକାଶକାରୀ OpenBMB
ଗୁଣବତ୍ତା
ବେଗ ସ୍ଥିର
ଅନୁମତିପତ୍ର Apache 2.0
କ୍ଲୋନ କରୁଅଛି ସମର୍ଥିତ
ଅକ୍ଟୋବର ମାନକ (2 କ୍ରେଡିଟ/1K ଅକ୍ଷର)
ପ୍ରାଚଳଗୁଡ଼ିକ 500M
ବାସ୍ତୁଶାସ୍ତ୍ର Continuous Space + Flow Matching
ତାଲିମ ତଥ୍ୟName 1800000 ଘଣ୍ଟାunit-format
ବର୍ଷ 2025

ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା Default Chinese

ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ

ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ Default Chinese କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ଭିଡିଓ ଭାଷା

YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।

ପ୍ରୟୋଗଗୁଡ଼ିକ ଏବଂ ସୁଗମତାName

ଦ୍ରୁତ ଉତ୍ପାଦନ ଏହି ଧ୍ୱନିକୁ ରିୟଲ-ଟାଇମ ପ୍ରୟୋଗ, ପରଦା ପାଠକ, ଏବଂ ସୁଗମତା ସାଧନଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ।

ପଡକଡ଼ଗୁଡ଼ିକ ଏବଂ ପ୍ରସାରଣName

ପଡକଡ଼, ରେଡିଓ ଏବଂ ବ୍ଯବସାୟିକ ପ୍ରସାରଣ ପାଇଁ ଉପଯୁକ୍ତ ଷ୍ଟୁଡିଓ-ଗୁଣମାନର ନିର୍ଗମ।

ଅଧିକ VoxCPM ଧ୍ୱନିName

ସମାନ TTS ନମୂନାରୁ ଅନ୍ୟାନ୍ୟ ଧ୍ୱନିଗୁଡ଼ିକ

Default

ଇଂରାଜୀName Neutral

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

OpenBMB ଦ୍ୱାରା VoxCPM 1.5 ଏକ ନୂତନ ଟୋକେନାଇଜର-ମୁକ୍ତ TTS ମଡେଲ ଯାହାକି ଅଲଗା ଟୋକେନଗୁଡ଼ିକ ବଦଳରେ ନିରନ୍ତର ସ୍ଥାନରେ କାର୍ଯ୍ୟ କରିଥାଏ। ଏହା ଉଚ୍ଚ-ସତ୍ୟତା 44.1kHz ଧ୍ୱନି ଉତ୍ପାଦନ କରେ, 3-10 ସେକେଣ୍ଡରୁ ଶୂନ୍ୟ-ଶଟ ଧ୍ୱନି କ୍ଲୋନକୁ ସମର୍ଥନ କରେ, ଏବଂ ଅନୁଚ୍ଛେଦଗୁଡ଼ିକରେ ସ୍ଥିରତା ବଜାୟ ରଖିଥାଏ। କ୍ରସ-ଭାଷା କ୍ଲୋନିଂ ଆପଣଙ୍କୁ ଚାଇନିଜ ଭାଷାରେ ଇଂରାଜୀ ଧ୍ୱନି ପ୍ରୟୋଗ କରିବା ପାଇଁ ଅନୁମତି ଦେଇଥାଏ ଏବଂ ବିପରୀତ ଦିଗରେ।

VoxCPM କୁ OpenBMB ଦ୍ୱାରା ବିକଶିତ କରାଯାଇଛି ଏବଂ ଏହାକୁ Apache 2.0 ଲାଇସେନ୍ସ ଅନ୍ତର୍ଗତ ମୁକ୍ତ କରାଯାଇଛି, ଯାହାକି ଉତ୍ପନ୍ନ ଧ୍ୱନିର ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ।

VoxCPM2ଭାଷାକୁ ସମର୍ଥନ କରେ: ଇଂରାଜୀ, ଚାଇନିଜ।

VoxCPM ମାନକ ସ୍ତରରେ ଅଛି - ପ୍ରତି 1,000 ଅକ୍ଷରରେ2କରେଡିଟ। ଆପଣ ସମ୍ପୂର୍ଣ୍ଣ ଧ୍ୱନି ସୃଷ୍ଟି କରିବା ପୂର୍ବରୁ ଯେକୌଣସି VoxCPM ଧ୍ୱନିକୁ ମୁକ୍ତରେ ପ୍ରାକଦର୍ଶନ କରିପାରିବେ।

VoxCPM ରେ ବହୁତ ଦ୍ରୁତ ଉତ୍ପାଦନ ବେଗ ଅଛି। ଏହା ପାଖାପାଖି ରିୟଲ-ଟାଇମରେ ଚାଲୁଛି, ଏହାକୁ ଷ୍ଟ୍ରିମିଂ ଏବଂ ଅନ୍ତରାପୃଷ୍ଠ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଉପଯୁକ୍ତ କରିଥାଏ।

VoxCPM କୁ TTS.ai ରେ ଧ୍ୱନି ଗୁଣବତ୍ତା ପାଇଁ 5/5 ରୂପେ ମାନ ଦିଆଯାଇଛି। ଏହା ଷ୍ଟୁଡିଓ-ସ୍ତରୀୟ, ମାନବ-ସଦୃଶ ଭାଷଣ ପ୍ରଦାନ କରିଥାଏ।

ହଁ, VoxCPM ଶୂନ୍ୟ-ଶଟ ଧ୍ୱନି କ୍ଲୋନକୁ ସମର୍ଥନ କରିଥାଏ। ଗୋଟିଏ ଇଚ୍ଛାରୂପଣ ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ 5-30 ସେକଣ୍ଡର ସଂଯୋଗ ଧ୍ୱନିକୁ ଅଦ୍ୟତନ କରନ୍ତୁ।

ହଁ, VoxCPMକୁ ଉଚ୍ଚ-ସତ୍ୟତା ଧ୍ୱନି, ଧ୍ୱନି ପୁସ୍ତକ, ଧ୍ୱନି ସ୍ଥିରତା ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁ ପାଇଁ ବିଶେଷ ଭାବରେ ପରାମର୍ଶ ଦିଆଯାଏ। ଏହାର 44.1khz ଧ୍ୱନି, ଟୋକେନାଇଜର-ମୁକ୍ତ, କ୍ରସ-ଭାଷା କ୍ଲୋନିଂ କ୍ଷମତା ଏହାକୁ ଏହି ବ୍ୟବହାର ମାମଲା ପାଇଁ ଏକ ଉତ୍ତମ ଚୟନ କରିଥାଏ।

ହଁ, VoxCPM କୁ Apache 2.0 ଅନ୍ତର୍ଗତ ଲାଇସେନ୍ସ ଦିଆଯାଇଛି, ଯାହାକି ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ। VoxCPM ଧ୍ୱନି ସହିତ ନିର୍ଗତ ଧ୍ୱନିକୁ ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରକଳ୍ପରେ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ହଁ, TTS.ai ରେ ସମସ୍ତ ଧ୍ୱନି ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (MIT, Apache 2.0) ବ୍ୟବହାର କରିଥାଏ। ନିର୍ଗତ ଧ୍ୱନିଟି ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରୟୋଗରେ ବ୍ୟବହାର ପାଇଁ ଆପଣଙ୍କର ଅଟେ।

/api/v1/tts/କୁ ଆକାର ନାମ ଏବଂ ଭାଷା ID ସହିତ ଗୋଟିଏ POST ଅନୁରୋଧ ପଠାନ୍ତୁ। Python, JavaScript, Go, ଏବଂ cURL ରେ କୋଡ ଉଦାହରଣ ପାଇଁ ଆମର API ଦଲିଲିକରଣ ପୃଷ୍ଠାକୁ ଦେଖନ୍ତୁ।

ହଁ, ଗୋଟିଏ ନମୁନା ଶୁଣିବା ପାଇଁ ଏହି ପୃଷ୍ଠାରେ ଚାଲାଇବା ବଟନକୁ କ୍ଲିକ କରନ୍ତୁ। ଆପଣ ପାଠ୍ୟରୁ ଭାଷଣ ପୃଷ୍ଠାରେ ଇଚ୍ଛାରୂପୀ ପାଠ୍ୟ ଟାଇପ କରିପାରିବେ ଏବଂ କୌଣସି ଭାଷା ସହିତ ମୁକ୍ତ ପ୍ରାକଦର୍ଶନ ସୃଷ୍ଟି କରିପାରିବେ।

ଚେଷ୍ଟାକରନ୍ତୁ Default Chinese ବର୍ତ୍ତମାନ

ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ Default Chinese. ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ.