Report Bug / Feature Request

ଧ୍ୱନି କ୍ଲୋନିଂ

ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାରୁ ଯେକୌଣସି ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ। AI ସହିତ କ୍ଲୋନ ଧ୍ୱନିରେ ଭାଷଣ ସୃଷ୍ଟି କରନ୍ତୁ।

ଆପଣଙ୍କ ଭାଷାରେ ଆମ ପାଖରେ ବର୍ତ୍ତମାନ TTS ଧ୍ୱନି ନାହିଁ । ଆମକୁ ଆପଣଙ୍କର ଯୋଗ କରିବାରେ ସହାୟତା କରନ୍ତୁ! ଆପଣଙ୍କର ସ୍ୱର ବିକ୍ରି କରନ୍ତୁ

ସଂଯୋଗ ଧ୍ୱନି

ସାଧନ 1: ଆପଣ କ୍ଲୋନ କରିବାକୁ ଚାହୁଁଥିବା ସ୍ୱର (5-30 ସେକେଣ୍ଡର ସ୍ପଷ୍ଟ ଭାଷଣ)ର ଗୋଟିଏ ଧ୍ୱନି କଲିପକୁ ଅଦ୍ୟତନ କରନ୍ତୁ। ସାଧନ2: ତଳକୁ ଗୋଟିଏ ନମୂନା ବାଛନ୍ତୁ। ସାଧନ3: ଆପଣଙ୍କର ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ସୃଷ୍ଟି କରନ୍ତୁ କ୍ଲିକ କରନ୍ତୁ।

ଆପଣଙ୍କର ଫାଇଲକୁ ଏଠାରେ ଟାଣି ନିଅନ୍ତୁ ଏବଂ ଛାଡିଦିଅନ୍ତୁ, କିମ୍ବା ବ୍ରାଉଜ କରନ୍ତୁ

Upload a voice sample to clone from. MP3, WAV, FLAC. The selected model's per-engine limit is shown below — uploads beyond that are auto-trimmed to the cleanest section. Max upload 500MB.

file.mp3

0 MB
ଧ୍ୱନି ଗୁଣଧର୍ମ ...
ଅବଧି: -- ଧ୍ୱନି: -- ନିରବତା: --
- କିମ୍ବା ସିଧାସଳଖ ରେକର୍ଡ କରନ୍ତୁ -
00:00

ନମୂନାକୁ କ୍ଲୋନ କରୁଅଛି

Reference audio: 5s – 30s (longer is auto-trimmed to the cleanest section)

ଗୁଣବତ୍ତା:
ଦ୍ରୁତ ପ୍ରାକଦର୍ଶନ

ପାଠ୍ୟକୁ କହିବା ପାଇଁ

ଭାଷାଟି ସଂଯୋଗ ଧ୍ୱନି ସହିତ ମେଳ ଖାଉଛି
ଆରମ୍ଭ କରିବା ପାଇଁ ଉପରସ୍ଥିତ ଗୋଟିଏ ଧ୍ୱନି ନମୁନାକୁ ଅଦ୍ୟତନ କରନ୍ତୁ
5,000 ଅକ୍ଷର ସଦସ୍ୟତା ନିଅନ୍ତୁ ବ୍ୟବହାର ବିଧି ଅନୁସରଣ କରନ୍ତୁ

ଫଳାଫଳ

ଗୋଟିଏ ସଂରକ୍ଷଣ ଧ୍ୱନିକୁ ଆହରଣ କରନ୍ତୁ, ପାଠ୍ୟ ଭରଣ କରନ୍ତୁ, ଏବଂ କ୍ଲୋନ ଧ୍ୱନିକୁ ଶୁଣିବା ପାଇଁ ସୃଷ୍ଟି କରନ୍ତୁ

ଧ୍ୱନିକୁ କ୍ଲୋନ କରୁଅଛି ଏବଂ ଭାଷଣ ସୃଷ୍ଟି କରୁଅଛି...

ଆପଣଙ୍କର ସଂରକ୍ଷିତ ଧ୍ୱନିଗୁଡ଼ିକ

ସଦସ୍ୟତା ନିଅନ୍ତୁ ପରବର୍ତ୍ତୀ ବ୍ୟବହାର ପାଇଁ କ୍ଲୋନ କରାଯାଇଥିବା ଧ୍ୱନିଗୁଡ଼ିକୁ ସଂରକ୍ଷଣ କରିବା ପାଇଁ ।

ସ୍ୱର କ୍ଲୋନିଂ କିପରି କାମ କରେName

1. ଉଲ୍ଲେଖ ଧ୍ୱନିକୁ ଆହରଣ କରନ୍ତୁ

ଆପଣ କ୍ଲୋନ କରିବାକୁ ଚାହୁଁଥିବା ଧ୍ୱନିରୁ 10-30 ସେକଣ୍ଡର ସ୍ୱଚ୍ଛ ବକ୍ତବ୍ୟ ପ୍ରଦାନ କରନ୍ତୁ। ଧ୍ୱନି ଯେତେ ସ୍ୱଚ୍ଛ ହେବ, ଫଳାଫଳ ସେତେ ଭଲ ହେବ।

2. ଗୋଟିଏ ଆକାର ବାଛନ୍ତୁ

OpenVoice, Chatterbox, CosyVoice2ଅଥବା GPT-SoVITS ଭଳି କ୍ଲୋନ ମଡେଲଗୁଡ଼ିକରୁ ଚୟନ କରନ୍ତୁ। ପ୍ରତ୍ୟେକଟି ଭିନ୍ନ ଭିନ୍ନ ଭାଷା ଏବଂ ଶୈଳୀଗୁଡ଼ିକ ପାଇଁ ଭିନ୍ନ ଭିନ୍ନ ଶକ୍ତି ଅଟେ।

3. ପାଠ୍ୟ ଭରଣ କରନ୍ତୁ ଏବଂ ସୃଷ୍ଟି କରନ୍ତୁ

ଆପଣ କ୍ଲୋନ କରାଯାଇଥିବା ସ୍ୱରରେ କହିବାକୁ ଚାହୁଁଥିବା ପାଠ୍ୟକୁ ଟାଇପ କରନ୍ତୁ ଏବଂ ସୃଷ୍ଟି କରନ୍ତୁ ବଟନକୁ ଦବାନ୍ତୁ। ଭବିଷ୍ୟତ ବ୍ୟବହାର ପାଇଁ ସ୍ୱରକୁ ଆହରଣ କରନ୍ତୁ କିମ୍ବା ସଂରକ୍ଷଣ କରନ୍ତୁ।

ବ୍ୟବହାର ବିଧି

ପ୍ରତ୍ୟେକ ସୃଜନଶୀଳ ଏବଂ ପେସାଦାର ଆବଶ୍ୟକତା ପାଇଁ ଧ୍ୱନି କ୍ଲୋନିଂ

ବିଷୟବସ୍ତୁ ସୃଷ୍ଟି

ପୁନଃରେକର୍ଡିଂ ବିନା ଆପଣଙ୍କର ସ୍ୱର ସହିତ ନିରନ୍ତର ଭାଷା ନିର୍ମାଣ କରନ୍ତୁ। ତ୍ରୁଟିଗୁଡ଼ିକୁ ସୁଧାରନ୍ତୁ, ନୂତନ ଅଂଶଗୁଡ଼ିକୁ ଯୋଗ କରନ୍ତୁ, କିମ୍ବା ମାଇକରୁ ଦୂରରେ ଥିବା ସମୟରେ ଆପଣଙ୍କର ସ୍ୱରରେ ବିଷୟବସ୍ତୁକୁ ନିର୍ମାଣ କରନ୍ତୁ।

ବହୁଭାଷୀ ଦୂଷଣ

ଆପଣ ଜାଣିନଥିବା ଭାଷାରେ କଥାବାର୍ତ୍ତା କରନ୍ତୁ ଏବଂ ଆପଣଙ୍କର ସ୍ୱର ପରିଚୟକୁ ବଜାୟ ରଖନ୍ତୁ। CosyVoice2ପରି କ୍ରସ-ଭାଷା ମଡେଲଗୁଡ଼ିକ ବିଷୟବସ୍ତୁକୁ 8ଟି ଭାଷାରେ ଡବଲ କରିବାରେ ସକ୍ଷମ କରନ୍ତି।

ଖେଳ ଅକ୍ଷରଗୁଡ଼ିକName

ଖେଳ, ଜୀବନାୟନ ଏବଂ ଅନ୍ତରାପୃଷ୍ଠୀ ମିଡିଆ ପାଇଁ ଭିନ୍ନ ଭିନ୍ନ ଅକ୍ଷର ଧ୍ୱନି ନିର୍ମାଣ କରନ୍ତୁ। ସଂଦେଷଣ ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ ଏବଂ ଅସୀମିତ ସଂଳାପ ରେଖା ନିର୍ମାଣ କରନ୍ତୁ।

ଧ୍ୱନି ପୁସ୍ତକଗୁଡ଼ିକ

ସମଗ୍ର ପୁସ୍ତକଗୁଡ଼ିକୁ ଏକ ନିରନ୍ତର ସ୍ୱରରେ ବର୍ଣ୍ଣନା କରନ୍ତୁ। ଶବ୍ଦ ପୁସ୍ତକଗୁଡ଼ିକୁ ଶକ୍ତିଶୀଳ ଭାବରେ ଉତ୍ପାଦନ କରିବା ପାଇଁ ଆପଣଙ୍କର କ୍ଲୋନ ସ୍ୱରକୁ ଷ୍ଟୁଡିଓରେ ଘଣ୍ଟା ଘଣ୍ଟା ଧରି ରେକର୍ଡିଂ ନକରି ବ୍ୟବହାର କରନ୍ତୁ।

ସୁଗମତା

ପୂର୍ବରେ ରେକର୍ଡ କରାଯାଇଥିବା ନମୁନାକୁ ବ୍ୟବହାର କରି ସେମାନଙ୍କର ସ୍ୱର ହରାଇଥିବା ଲୋକମାନଙ୍କୁ ପୁଣିଥରେ କଥାବାର୍ତ୍ତା କରିବା ପାଇଁ ସହାୟତା କରନ୍ତୁ। ବ୍ୟକ୍ତିଗତ ଏବଂ ମେଡିକାଲ ବ୍ୟବହାର ପାଇଁ ସ୍ୱର ପରିଚୟକୁ ସଂରକ୍ଷଣ କରନ୍ତୁ।

ବ୍ରାଣ୍ଡ ଧ୍ୱନି

ସମସ୍ତ ଧ୍ୱନି ବିଷୟବସ୍ତୁ ଉପରେ ଏକ ନିରନ୍ତର ବ୍ରାଣ୍ଡ ସ୍ୱରକୁ ବଜାୟ ରଖନ୍ତୁ। ଆପଣଙ୍କର ବ୍ରାଣ୍ଡ ମୁଖପାତ୍ରକୁ କ୍ଲୋନ କରନ୍ତୁ ଏବଂ ବିକ୍ରୟ ଧ୍ୱନି, IVR ପ୍ରୋମୋଟ ଏବଂ ଘୋଷଣା ସୃଷ୍ଟି କରନ୍ତୁ।

ଉତ୍ତମ ଫଳାଫଳ ପାଇଁ ପରାମର୍ଶ

ସୋମ

  • ସଫା, ଶବ୍ଦମୁକ୍ତ ରେକର୍ଡିଂଗୁଡ଼ିକୁ ବ୍ୟବହାର କରନ୍ତୁ
  • ଲମ୍ବା ନମୁନା = ଭଲ କ୍ଲୋନ (ନିମ୍ନରେ ଥିବା ପଥପ୍ରଦର୍ଶକକୁ ଦେଖନ୍ତୁ)
  • ଗୋଟିଏ ସ୍ଵରକ ବ୍ୟବହାର କରନ୍ତୁ
  • ନିରବ ପରିବେଶରେ ରେକର୍ଡ କରନ୍ତୁ
  • ପ୍ରାକୃତିକ ବଚନ ଗତି ବ୍ୟବହାର କରନ୍ତୁ
  • WAV କିମ୍ବା ଉଚ୍ଚ-ବିଟରେଟ MP3 ପସନ୍ଦ ହୋଇଥାଏ

ବନ୍ଦ କରନ୍ତୁ

  • ପୃଷ୍ଠଭୂମି ଧ୍ୱନି କିମ୍ବା ସଂଗୀତ
  • ସଂଯୋଗରେ ଏକାଧିକ ବକ୍ତାName
  • ବହୁତ ସଂକ୍ଷିପ୍ତ କ୍ଲିପଗୁଡ଼ିକ (3 ସେକଣ୍ଡରୁ କମ)
  • ଅତ୍ୟଧିକ ସଙ୍କୋଚିତ ଧ୍ୱନି
  • ଫୁସଫୁସ କରିବା କିମ୍ବା କାନ୍ଦିବା
  • ରେକର୍ଡିଂରେ ପ୍ରତିଧ୍ୱନି କିମ୍ବା ପ୍ରତିଧ୍ୱନି

ନମୁନା ଲମ୍ବ କିପରି ଗୁଣବତ୍ତାକୁ ପ୍ରଭାବିତ କରେ

ଆପଣଙ୍କର ଅନୁସରଣ ଧ୍ୱନି ଯେତେ ଲମ୍ବା ଏବଂ ସ୍ୱଚ୍ଛ, କ୍ଲୋନ ସେତେ ଭଲ। ଏଠାରେ

ନମୁନା ଲମ୍ବ କ୍ଲୋନ ଗୁଣଧର୍ମ ପାଇଁ ଉତ୍ତମ ଅଭିଗମ୍ୟତା
5–10s ମୂଳ ଦ୍ରୁତ ପରୀକ୍ଷା - ସାଧାରଣ ଧ୍ୱନିକୁ ଗ୍ରହଣ କରିଥାଏ କିନ୍ତୁ ଭିନ୍ନତାକୁ ଭୁଲିଯାଇପାରେ ମୁକ୍ତ
30–60s ଭଲ ଅଧିକାଂଶ ବ୍ୟବହାର ମାମଲା ପାଇଁ ସଠିକ କ୍ଲୋନ - ଧ୍ୱନି, ବେଗ ଏବଂ ଉଚ୍ଚାରଣକୁ ଗ୍ରହଣ କରିଥାଏ ମୁକ୍ତ
2–5 min ମହାନ ଉଚ୍ଚ-ସତ୍ୟତା କ୍ଲୋନ - ପ୍ରାକୃତିକ ଅନୁବର୍ତ୍ତନ, ନିର୍ଗମଗୁଡ଼ିକରେ ନିରନ୍ତର ଗୁଣବତ୍ତା ମୁକ୍ତ ଖାତା
10+ min ଉତ୍ତମ ପାଖାପାଖି-ସମ୍ପୂର୍ଣ୍ଣ ପୁନଃପ୍ରସାରଣ - ଧ୍ୱନି ପୁସ୍ତକ, ପୋଡକାଷ୍ଟ, ପେସାଦାର ବ୍ୟବହାର ପାଇଁ ଆଦର୍ଶ ମୁକ୍ତ ଖାତା
1–2+ hrs ଷ୍ଟୁଡିଓ ସ୍ତର ଆପଣଙ୍କର ସ୍ୱରରେ ଗୋଟିଏ ଇଚ୍ଛାରୂପୀ ନମୂନାକୁ ସୁସଜ୍ଜିତ କରନ୍ତୁ - ପ୍ରକୃତରୁ ଅଲଗା ହୋଇନଥାଏ ପ୍ରୋ ପ୍ଳାନ

ଉତ୍ତମ ଫଳାଫଳ ପାଇଁ, ଗୋଟିଏ ସ୍ପିକର ସହିତ ସ୍ୱଚ୍ଛ ଧ୍ୱନି ବ୍ୟବହାର କରନ୍ତୁ, କୌଣସି ପୃଷ୍ଠଭୂମି ସଂଗୀତ ନାହିଁ, ଏବଂ ପ୍ରାକୃତିକ ଭାଷଣ। WAV କିମ୍ବା FLAC ଶୈଳୀ ସବୁଠାରୁ ଅଧିକ ବିବରଣୀକୁ ସଂରକ୍ଷଣ କରିଥାଏ।

ଧ୍ୱନି କ୍ଲୋନିଙ୍ଗ ଯୋଜନାଗୁଡ଼ିକName

ମୁକ୍ତ ଭାବରେ ଆରମ୍ଭ କରନ୍ତୁ, ଅଧିକ ଆବଶ୍ୟକ ହେଲେ ଅଗ୍ରଗତି କରନ୍ତୁ

ମୁକ୍ତ
  • 5-60 ସେକଣ୍ଡ ସଂରକ୍ଷଣ ଧ୍ୱନି
  • ମୂଳ କ୍ଲୋନ ଗୁଣଧର୍ମ
  • ଚାଟରବକ୍ସ ଆକାର
  • MP3 ନିର୍ଗମ
ସବୁଠାରୁ ଲୋକପ୍ରିୟ
ମୁକ୍ତ ଖାତା
  • 10-ମିନିଟ ସଂରକ୍ଷଣ ଧ୍ୱନି + 15,000 ଅକ୍ଷର
  • ସମସ୍ତ କ୍ଲୋନ ନମୂନା
  • HD ଗୁଣବତ୍ତା ଅବସ୍ଥା
  • କ୍ଲୋନ ହୋଇଥିବା ଧ୍ୱନିଗୁଡ଼ିକୁ ସଂରକ୍ଷଣ କରନ୍ତୁ
  • କ୍ରସ-ଭାଷା କ୍ଲୋନିଂ
  • ସମସ୍ତ ନିର୍ଗମ ଶୈଳୀଗୁଡିକ
ମୁକ୍ତ ଭାବରେ ପଞ୍ଜୀକୃତ ହୁଅନ୍ତୁ
ପ୍ରୋ
  • 2-ଘଣ୍ଟା+ ସଂଦେଷ ଧ୍ୱନି
  • ଷ୍ଟୁଡିଓ-ସ୍ତରୀୟ କ୍ଲୋନ ଗୁଣବତ୍ତା
  • ଇଚ୍ଛାରୂପୀ ନମୁନା ସଜାଗତା
  • ବ୍ୟାଚ ନିର୍ମାଣ
  • API ଅଭିଗମ୍ୟତା
  • ଅଗ୍ରତା ପ୍ରକ୍ରିୟାକରଣ
ଅଦ୍ୟତନ କରନ୍ତୁ

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

AI ଧ୍ୱନି କ୍ଲୋନିଂ ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାରୁ ଜଣେ ବ୍ୟକ୍ତିଙ୍କ ଧ୍ୱନିକୁ ନକଲ କରିବା ପାଇଁ ଗଭୀର ଶିକ୍ଷାଦାନକୁ ବ୍ୟବହାର କରିଥାଏ। ଏକଥର କ୍ଲୋନ କରାଗଲେ, ଆପଣ ନୂତନ ବକ୍ତବ୍ୟ ସୃଷ୍ଟି କରିପାରିବେ ଯାହାକି ପ୍ରକୃତ ବକ୍ତା ପରି ଶୁଭେ। ଆଧୁନିକ ମଡେଲଗୁଡ଼ିକୁ5ସେକେଣ୍ଡର ସଂଯୋଗ ଧ୍ୱନି ଆବଶ୍ୟକ ହୋଇଥାଏ।

ଚାଟରବକ୍ସ ଉତ୍ତମ ଶୂନ୍ୟ-ଶଟ କ୍ଲୋନିଂକୁ ଅନୁଭୂତି ନିୟନ୍ତ୍ରଣ ସହିତ ପ୍ରଦାନ କରେ। CosyVoice2ବହୁଭାଷା କ୍ଲୋନିଂ ପାଇଁ ଉତ୍ତମ (8 ଭାଷା)। GPT-SoVITS କେବଳ5ସେକେଣ୍ଡ ଧ୍ୱନି ସହିତ ଉତ୍ତମ। OpenVoice ଗ୍ରେନିଆଲ ଶୈଳୀ ନିୟନ୍ତ୍ରଣ ପ୍ରଦାନ କରେ।

ଅଧିକାଂଶ ମଡେଲ 5-30 ସେକଣ୍ଡର ସ୍ୱଚ୍ଛ ଧ୍ୱନି ସହିତ କାମ କରେ। ଦୀର୍ଘ ନମୁନା (60 ସେକଣ୍ଡ ପର୍ଯ୍ୟନ୍ତ) ସାଧାରଣତଃ ଭଲ ଫଳାଫଳ ପ୍ରଦାନ କରିଥାଏ। ଧ୍ୱନିଟି ସ୍ୱଚ୍ଛ ହେବା ଉଚିତ, ଗୋଟିଏ ସ୍ଵରକ, ପୃଷ୍ଠଭୂମି ସଂଗୀତ କିମ୍ବା ଧ୍ୱନି ବିନା।

ଆପଣ କେବଳ ସେହି ଧ୍ୱନିଗୁଡ଼ିକୁ କ୍ଲୋନ କରିବା ଉଚିତ ଯାହାକୁ ଆପଣ ବ୍ୟବହାର କରିବାକୁ ଅନୁମତି ଦେଇଛନ୍ତି। ଏଥିରେ ଆପଣଙ୍କର ନିଜ ଧ୍ୱନି, ଅନୁମତି ଦେଇଥିବା ବ୍ୟକ୍ତିମାନଙ୍କରୁ ଧ୍ୱନି, କିମ୍ବା ଠିକ ଭାବରେ ଲାଇସେନ୍ସିତ ଉତ୍ସରୁ ଧ୍ୱନି ସାମିଲ ଅଛି। ଅସଂମତିପ୍ରାପ୍ତ ଧ୍ୱନି କ୍ଲୋନ କରିବା ଆପଣଙ୍କର ଆୟୋଗରେ ନିୟମ ଉଲ୍ଲଂଘନ କରିପାରେ।

ହଁ! CosyVoice2ଅଥବା GPT-SoVITS ଭଳି କ୍ରସ-ଭାଷା ସ୍ୱର କ୍ଲୋନ ମଡେଲଗୁଡ଼ିକ କ୍ଲୋନ କରାଯାଇଥିବା ସ୍ୱର ପରିଚୟକୁ ବଜାୟ ରଖିବା ସମୟରେ ଭିନ୍ନ ଭିନ୍ନ ଭାଷାରେ ଭାଷଣ ଉତ୍ପାଦନ କରିପାରିବେ। ଏହା ଡବିଂ ଏବଂ ସ୍ଥାନୀୟକରଣ ପାଇଁ ଉପଯୋଗୀ।

ଗୋଟିଏ ସ୍ପିକର ସହିତ ଗୋଟିଏ ସ୍ୱଚ୍ଛ ରେକର୍ଡକୁ ବ୍ୟବହାର କରନ୍ତୁ, କୌଣସି ପୃଷ୍ଠଭୂମି ସଂଗୀତ କିମ୍ବା ଧ୍ୱନି ନାହିଁ, ଏବଂ ଏକ ନିରନ୍ତର ଧ୍ୱନି ପରିମାଣରେ ପ୍ରାକୃତିକ ଭାଷାକୁ ବ୍ୟବହାର କରନ୍ତୁ। ହସିବା, କାନ୍ଦିବା, କିମ୍ବା ଅଧିକ ପ୍ରକ୍ରିୟାକୃତ ଧ୍ୱନିକୁ ବନ୍ଦ କରନ୍ତୁ। WAV କିମ୍ବା FLAC ଶୈଳୀ 16kHz କିମ୍ବା ଅଧିକରେ ଶ୍ରେଷ୍ଠ ଫଳାଫଳ ପ୍ରଦାନ କରିଥାଏ।

ଧ୍ୱନି କ୍ଲୋନ କରିବା ନିୟମିତ ଯେତେବେଳେ ଆପଣଙ୍କୁ ଧ୍ୱନି ମାଲିକ ଠାରୁ ଅନୁମତି ମିଳିଥାଏ କିମ୍ବା ଆପଣ ନିଜ ଧ୍ୱନିକୁ ବ୍ୟବହାର କରନ୍ତି। ଅଧିକାଂଶ ଶାସନ କ୍ଷେତ୍ରରେ ଧ୍ୱନି ସମାନତା ଅଧିକାରକୁ ସୁରକ୍ଷିତ ରଖିବା ପାଇଁ ନିୟମ ରହିଛି। ଅନ୍ୟମାନଙ୍କୁ ପରିଚୟ ଦେବା ପାଇଁ କଦାପି ଧ୍ୱନି କ୍ଲୋନ କରନ୍ତୁ ନାହିଁ, deepfakes ନିର୍ମାଣ କରନ୍ତୁ, କିମ୍ବା ଭ୍ରଷ୍ଟାଚାର କରନ୍ତୁ। ଅନ୍ୟ କାହାର ଧ୍ୱନିକୁ କ୍ଲୋନ କରିବା ପୂର୍ବରୁ ସର୍ବଦା ଉପଯୁକ୍ତ ଅନୁମତି ନିଅନ୍ତୁ।

ହଁ, ଆପଣ କ୍ଲୋନ ଧ୍ୱନିକୁ ବାଣିଜ୍ୟିକ ଭାବେ ବ୍ୟବହାର କରିପାରିବେ ଯେତେବେଳ ପର୍ଯ୍ୟନ୍ତ ଆପଣଙ୍କ ପାଖରେ ସଂଯୋଗ ଧ୍ୱନି ପାଇଁ ଅଧିକାର ଅଛି। ଏଥିରେ ଆପଣଙ୍କର ନିଜ ଧ୍ୱନି, ନିଯୁକ୍ତି ଦିଆଯାଇଥିବା ଧ୍ୱନି ଅଭିନେତାମାନେ ଯିଏକି ରାଜି ହୋଇଛନ୍ତି, କିମ୍ବା ଠିକ ଭାବରେ ଲାଇସେନ୍ସିତ ଧ୍ୱନି ନମୁନା ଅନ୍ତର୍ଭୁକ୍ତ। ଉତ୍ପାଦ, ଭିଡିଓ ଏବଂ ପ୍ରୟୋଗଗୁଡ଼ିକରେ ଉତ୍ପାଦିତ ଧ୍ୱନିକୁ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ହଁ, ପଞ୍ଜୀକୃତ ଚାଳକମାନେ ସେମାନଙ୍କର ଖାତାରେ କ୍ଲୋନ କରାଯାଇଥିବା ଧ୍ୱନି ରୂପରେଖକୁ ସଂରକ୍ଷଣ କରିପାରିବେ। ଗୋଟିଏ ଥର ସଂରକ୍ଷିତ ହେବା ପରେ, ଆପଣ କ୍ଲୋନ କରାଯାଇଥିବା ଧ୍ୱନିକୁ ଭବିଷ୍ୟତ ପିଢ଼ିଗୁଡ଼ିକ ପାଇଁ ସଂଯୋଗ ଧ୍ୱନିକୁ ପୁନଃଅପଲୋଡ ନକରି ପୁନଃବ୍ୟବହାର କରିପାରିବେ। ଏହା ଆପଣଙ୍କ ଖାତାର "ମୋ ଧ୍ୱନି" ଅଂଶ ଅନ୍ତର୍ଗତ ଉପଲବ୍ଧ।

ଚାଟରବକ୍ସ ଭଳି ନମୂନାଗୁଡ଼ିକ କ୍ଲୋନ ଧ୍ୱନି ସହିତ ସ୍ପଷ୍ଟଭାବେ ଭାବନା ନିୟନ୍ତ୍ରଣ ପ୍ରଦାନ କରିଥାଏ (ଖୁସି, ଦୁଃଖୀ, ରାଗୀ, ଇତ୍ୟାଦି)। ଅନ୍ୟାନ୍ୟ ନମୂନାଗୁଡ଼ିକ ଆପଣଙ୍କର ସଂଯୋଗ ଧ୍ୱନିରୁ ସାଧାରଣ ଧ୍ୱନି ଏବଂ ଶୈଳୀକୁ ଗ୍ରହଣ କରିଥାଏ। ଶ୍ରେଷ୍ଠ ଭାବନା ସ୍ଥାନାନ୍ତରଣ ପାଇଁ, ଆପଣଙ୍କର ସଂଯୋଗ ନମୁନାରେ ଅଭିବ୍ୟକ୍ତିଗତ ଭାଷାକୁ ଅନ୍ତର୍ଭୁକ୍ତ କରନ୍ତୁ।

ଧ୍ୱନି କ୍ଲୋନିଂ ସାଧାରଣତଃ 3-10 ସେକେଣ୍ଡ ସମୟ ନିଏ ଯାହାକି ମଡେଲ ଏବଂ ପାଠ୍ୟ ଲମ୍ବ ଉପରେ ନିର୍ଭର କରିଥାଏ। ଚାଟରବକ୍ସ ଏବଂ GPT-SoVITS ଦ୍ରୁତ କ୍ଲୋନିଂ ପାଇଁ ଅନୁକୂଳିତ ହୋଇଥାଏ। ପ୍ରଥମ ପିଢ଼ି ଅଳ୍ପ ଅଧିକ ସମୟ ନିଏ କାରଣ ମଡେଲ ସଂଯୋଗ ଧ୍ୱନିକୁ ପ୍ରକ୍ରିୟା କରିଥାଏ।

ଧ୍ୱନି କ୍ଲୋନିଂ ଚାଟରବକ୍ସ ଏବଂ ଟର୍ଟୋଇଜ ପରି ମଡେଲଗୁଡ଼ିକ ପାଇଁ 4x ଅକ୍ଷରଗୁଡ଼ିକରେ ପ୍ରିମିଆ-ସ୍ତର ମୂଲ୍ୟ ନିର୍ଦ୍ଧାରଣକୁ ବ୍ୟବହାର କରିଥାଏ। ମୁକ୍ତ ଖାତାଗୁଡ଼ିକ ସଦସ୍ୟତା ସମୟରେ 15,000 ଅକ୍ଷର ଗ୍ରହଣ କରିଥାଏ। CosyVoice2ପରି ମାନକ-ସ୍ତର କ୍ଲୋନିଂ ମଡେଲଗୁଡ଼ିକ 2x ଅକ୍ଷରଗୁଡ଼ିକୁ ବ୍ୟବହାର କରିଥାଏ।
5.0/5 (2)

ଆମେ କଣ ସୁଧାରିପାରିବା? ଆପଣଙ୍କର ପ୍ରତିକ୍ରିୟା ଆମକୁ ସମସ୍ୟାର ସମାଧାନ କରିବାରେ ସହାୟକ ହୋଇଥାଏ ।

AI ସହିତ ଯେକୌଣସି ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଏବଂ ଯେକୌଣସି ଧ୍ୱନିରେ ଭାଷଣ ସୃଷ୍ଟି କରିବା ଆରମ୍ଭ କରନ୍ତୁ। ଆରମ୍ଭ କରିବା ପାଇଁ ମୁକ୍ତ ଭାବରେ ଲଗଇନ କରନ୍ତୁ।