Default
Default ଗୋଟିଏ neutral AI ଧ୍ୱନି ଯାହାକି VoxCPM ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ପୂର୍ବନିର୍ଦ୍ଧାରିତ ସ୍ତର ଧ୍ୱନି ଇଂରାଜୀName କୁ କହୁଛି ଏବଂ ଷ୍ଟୁଡିଓ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ପାଖାପାଖି-ତତ୍କାଳ ଉତ୍ପାଦନ ଗତି ଏବଂ 5/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, Default high-fidelity audio, audiobooks, long-form content with voice consistency ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। VoxCPM ଯନ୍ତ୍ରଟି OpenBMB under the Apache 2.0 license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। Key capabilities include: 44.1khz audio, tokenizer-free, cross-lingual cloning, context-aware, lora fine-tuning. VoxCPM ନମୁନାଟି ମଧ୍ୟ ସ୍ୱର କ୍ଲୋନିଂକୁ ସମର୍ଥନ କରେ - ଗୋଟିଏ ଇଚ୍ଛାରୂପୀ ସ୍ୱର ନିର୍ମାଣ କରିବା ପାଇଁ ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଯାହାକି ସମାନ ଗୁଣବତ୍ତା ଗୁଣଧର୍ମକୁ ଧାରଣ କରିଥାଏ।
ଆକାର ସୂଚନାName
| ଆକାର | VoxCPM |
| ବିକାଶକାରୀ | OpenBMB |
| ଗୁଣବତ୍ତା | |
| ବେଗ | ସ୍ଥିର |
| ଅନୁମତିପତ୍ର | Apache 2.0 |
| କ୍ଲୋନ କରୁଅଛି | ସମର୍ଥିତ |
| ଅକ୍ଟୋବର | ମାନକ (2 କ୍ରେଡିଟ/1K ଅକ୍ଷର) |
| ପ୍ରାଚଳଗୁଡ଼ିକ | 500M |
| ବାସ୍ତୁଶାସ୍ତ୍ର | Continuous Space + Flow Matching |
| ତାଲିମ ତଥ୍ୟName | 1800000 ଘଣ୍ଟାunit-format |
| ବର୍ଷ | 2025 |
ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା Default
ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ
ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName
ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ Default କୁ ବ୍ୟବହାର କରନ୍ତୁ।
ଭିଡିଓ ଭାଷା
YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।
ପ୍ରୟୋଗଗୁଡ଼ିକ ଏବଂ ସୁଗମତାName
ଦ୍ରୁତ ଉତ୍ପାଦନ ଏହି ଧ୍ୱନିକୁ ରିୟଲ-ଟାଇମ ପ୍ରୟୋଗ, ପରଦା ପାଠକ, ଏବଂ ସୁଗମତା ସାଧନଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ।
ପଡକଡ଼ଗୁଡ଼ିକ ଏବଂ ପ୍ରସାରଣName
ପଡକଡ଼, ରେଡିଓ ଏବଂ ବ୍ଯବସାୟିକ ପ୍ରସାରଣ ପାଇଁ ଉପଯୁକ୍ତ ଷ୍ଟୁଡିଓ-ଗୁଣମାନର ନିର୍ଗମ।
ଅଧିକ VoxCPM ଧ୍ୱନିName
ସମାନ TTS ନମୂନାରୁ ଅନ୍ୟାନ୍ୟ ଧ୍ୱନିଗୁଡ଼ିକ
ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName
ଚେଷ୍ଟାକରନ୍ତୁ Default ବର୍ତ୍ତମାନ
ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ Default. ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ.