ବାକ୍ୟରୁ ବାକ୍ୟName

ବଚନ ଧ୍ୱନିକୁ ପରିବର୍ତ୍ତନ କରନ୍ତୁ - ସ୍ୱର, ଅନୁଭୂତି, ଭାଷା ଏବଂ ଶୈଳୀକୁ ପରିବର୍ତ୍ତନ କରନ୍ତୁ ଏବଂ ପ୍ରକୃତ ବିଷୟବସ୍ତୁକୁ ସଂରକ୍ଷଣ କରନ୍ତୁ।

ଆପଣଙ୍କ ଭାଷାରେ ଆମ ପାଖରେ ବର୍ତ୍ତମାନ TTS ଧ୍ୱନି ନାହିଁ । ଆମକୁ ଆପଣଙ୍କର ଯୋଗ କରିବାରେ ସହାୟତା କରନ୍ତୁ! ଆପଣଙ୍କର ସ୍ୱର ବିକ୍ରି କରନ୍ତୁ

ଧ୍ୱନି ଉତ୍ସ

ଆପଣଙ୍କର ଫାଇଲକୁ ଏଠାରେ ଟାଣି ନିଅନ୍ତୁ ଏବଂ ଛାଡିଦିଅନ୍ତୁ, କିମ୍ବା ବ୍ରାଉଜ କରନ୍ତୁ

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

file.mp3

0 MB
— କିମ୍ବା ଆପଣଙ୍କର ସ୍ୱରକୁ ରେକର୍ଡ କରନ୍ତୁ —
00:00

ପରିବର୍ତ୍ତନ ବିନ୍ୟାସଗୁଡ଼ିକ

ଆପଣଙ୍କର ଫାଇଲକୁ ଏଠାରେ ଟାଣି ନିଅନ୍ତୁ ଏବଂ ଛାଡିଦିଅନ୍ତୁ, କିମ୍ବା ବ୍ରାଉଜ କରନ୍ତୁ

Upload a reference of the target voice. 10-30 sec recommended.

file.mp3

0 MB

ଫଳାଫଳ

ବକ୍ତବ୍ୟ ଧ୍ୱନିକୁ ଅଦ୍ୟତନ କରନ୍ତୁ, ଆପଣଙ୍କର ରୂପାନ୍ତରଣକୁ ବାଛନ୍ତୁ, ଏବଂ ଆରମ୍ଭ କରିବା ପାଇଁ ରୂପାନ୍ତରିତ କରନ୍ତୁ କ୍ଲିକ କରନ୍ତୁ

ଭାଷଣକୁ ପରିବର୍ତ୍ତନ କରୁଅଛି... ଏହା କିଛି ସମୟ ନେବ ।

ପ୍ରାରମ୍ଭିକ

ପରିବର୍ତ୍ତିତ

ଏହା କିପରି କାମ କରେ

1. ବକ୍ତବ୍ୟକୁ ଅପଲୋଡ କରନ୍ତୁ

ଆପଣ ପରିବର୍ତ୍ତନ କରିବାକୁ ଚାହୁଁଥିବା ଧ୍ୱନିକୁ ରେକର୍ଡ କରନ୍ତୁ କିମ୍ବା ଅଦ୍ୟତନ କରନ୍ତୁ

ପରିବର୍ତ୍ତନ କରନ୍ତୁ

ସ୍ୱର ପରିବର୍ତ୍ତନ, ଶୈଳୀ ସ୍ଥାନାନ୍ତରଣ, କିମ୍ବା ଭାଷା ପରିବର୍ତ୍ତନକୁ ବାଛନ୍ତୁ

3. ଏଆଇ ପରିବର୍ତ୍ତନ

AI ପ୍ରକ୍ରିୟା ଧ୍ୱନି ବିଷୟବସ୍ତୁକୁ ସଂରକ୍ଷଣ କରି ଶେଷରୁ ଶେଷ ପର୍ଯ୍ୟନ୍ତ ସଂରକ୍ଷଣ କରିଥାଏ

ଆହରଣ କରନ୍ତୁ

ଫଳାଫଳକୁ ଶୁଣନ୍ତୁ ଏବଂ ଆପଣଙ୍କର ପରିବର୍ତ୍ତିତ ଧ୍ୱନିକୁ ଆହରଣ କରନ୍ତୁ

ବ୍ୟବହାର ବିଧି

ବିଷୟବସ୍ତୁ, ସୁଗମତା ଏବଂ ସୃଜନଶୀଳ ପ୍ରକଳ୍ପଗୁଡ଼ିକ ପାଇଁ ଭାଷାରୁ ଭାଷାକୁ

ଭିଡିଓ ଦୂଷଣ

ପ୍ରକୃତ ବକ୍ତାଙ୍କ ସ୍ୱର ଗୁଣଧର୍ମକୁ ସଂରକ୍ଷଣ କରି ଅନ୍ୟ ଭାଷାରେ ଭିଡିଓକୁ ଡବ କରନ୍ତୁ।

ଇମୋସନ ସଂରଚନା

ରେକର୍ଡିଂର ଭାବପ୍ରବଣ ଶବ୍ଦକୁ ପରିବର୍ତ୍ତନ କରନ୍ତୁ - ଶାନ୍ତ ଭାଷଣକୁ ଉତ୍ସାହିତ କରନ୍ତୁ, କିମ୍ବା ନିରପେକ୍ଷ ଭାଷଣକୁ ଉଷ୍ମ ଏବଂ ବନ୍ଧୁତ୍ୱପୂର୍ଣ୍ଣ କରନ୍ତୁ।

ସ୍ୱର ଉତ୍ପାଦନName

ଭିନ୍ନ ଭିନ୍ନ ଧ୍ୱନି ଏବଂ ଶୈଳୀ ସହିତ କଠିନ ଧ୍ୱନି ରେକର୍ଡିଙ୍ଗକୁ ପଲିସ ଡାଇସୋଭରେ ପରିବର୍ତ୍ତନ କରନ୍ତୁ।

ଧ୍ୱନି ଅଜ୍ଞାତକରଣ

ପ୍ରତ୍ୟେକ ଶବ୍ଦକୁ ସଂରକ୍ଷଣ କରିବା ସମୟରେ ଜଣେ ବକ୍ତାଙ୍କ ପରିଚୟକୁ ଲୁଚାଇ ରଖନ୍ତୁ, whistleblowing କିମ୍ବା ଗୋପନୀୟତା ସୁରକ୍ଷା ପାଇଁ।

ବାକ୍ୟରୁ ବାକ୍ୟ ଆକାରName

OpenVoice

ଦ୍ରୁତ ସ୍ୱର ପରିବର୍ତ୍ତନ ଗୁଡିକ ଗ୍ରେନାଲ ଶୈଳୀ ନିୟନ୍ତ୍ରଣ ସହିତ। ସ୍ୱର ପରିଚୟ, ବେଗ, ଏବଂ ଭାବନାକୁ ସେକଣ୍ଡଗୁଡ଼ିକରେ ପରିବର୍ତ୍ତନ କରନ୍ତୁ।

  • ଶୀଘ୍ର ପ୍ରକ୍ରିୟାକରଣ
  • ଶୈଳୀ ସ୍ଥାନାନ୍ତରଣ
  • କ୍ରସ-ଭାଷାName

Chatterbox

Resemble AI ରୁ Fine-grained emotion ନିୟନ୍ତ୍ରଣ ସହିତ Zero-shot ସ୍ୱର କ୍ଲୋନିଂ।

  • ଅନୁଭୂତି ନିୟନ୍ତ୍ରଣ
  • ଶୂନ୍ୟ-ଶଟ କ୍ଲୋନିଂ
  • ଉଚ୍ଚ ଦୃଢତା

CosyVoice 2

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଷ୍ଟ୍ରିମିଂ ସମର୍ଥନ ସହିତ ୮ଟି ଭାଷାରେ କ୍ରସ-ଭାଷା ଧ୍ୱନି କ୍ଲୋନିଂName

  • ଭାଷାName
  • ଧ୍ୱନି କ୍ଲୋନିଂ
  • ପ୍ରବାହ

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

Speech to speech (STS) AI ଗୋଟିଏ ବକ୍ତବ୍ୟ ଧ୍ୱନି ରେକର୍ଡକୁ ଭିନ୍ନ ଭିନ୍ନ ବକ୍ତବ୍ୟ ନିର୍ଗମକୁ ପରିବର୍ତ୍ତନ କରେ - ସ୍ୱର, ଶୈଳୀ, ଅନୁଭୂତି, କିମ୍ବା ଭାଷାକୁ ପରିବର୍ତ୍ତନ କରି ପ୍ରାରମ୍ଭିକ ଶବ୍ଦ ଏବଂ ସମୟକୁ ସଂରକ୍ଷଣ କରିଥାଏ। ଏହା ବକ୍ତବ୍ୟ ପରିଚୟ, ପ୍ରକ୍ରିୟାକରଣ, ଏବଂ ସଂଶ୍ଲେଷଣକୁ ଗୋଟିଏ ପାଇପଲାଇନରେ ସଂଯୋଜିତ କରିଥାଏ।

ପାଠ୍ୟରୁ ବାକ୍ୟ ଲିଖିତ ପାଠ୍ୟକୁ ଧ୍ୱନିରେ ପରିବର୍ତ୍ତନ କରିଥାଏ। ବାକ୍ୟରୁ ବାକ୍ୟ ବର୍ତ୍ତମାନ ଥିବା ଧ୍ୱନିକୁ ନିବେଶ ଭାବରେ ଗ୍ରହଣ କରିଥାଏ ଏବଂ ଏହାକୁ ସିଧାସଳଖ ନୂତନ ଧ୍ୱନିରେ ପରିବର୍ତ୍ତନ କରିଥାଏ - ପ୍ରାକୃତିକ ରୀଦମ, ବିରାମ, ଗୁରୁତ୍ୱ ଏବଂ ପ୍ରକୃତ ରେକର୍ଡର ଭାବନାକୁ ସଂରକ୍ଷଣ କରିଥାଏ, ବଦଳରେ ପାଠ୍ୟରୁ ବାକ୍ୟ ସୃଷ୍ଟି କରିବା ପରିବର୍ତ୍ତେ।

ସାଧାରଣ ବ୍ୟବହାରଗୁଡ଼ିକ ମଧ୍ୟରେ ଅନ୍ୟ ଭାଷାରେ ଭିଡିଓକୁ ଡବଲ କରିବା, ଗୋଟିଏ ରେକର୍ଡରେ ବକ୍ତାଙ୍କ ସ୍ୱରକୁ ପରିବର୍ତ୍ତନ କରିବା, ଅନୁଭୂତି କିମ୍ବା ଅବସ୍ଥିତ ଧ୍ୱନିର ଧ୍ୱନିକୁ ସଜାଇବା, ଅଧା ରେକର୍ଡରୁ ସ୍ୱର ନିର୍ମାଣ କରିବା ଏବଂ ବିଷୟବସ୍ତୁକୁ ରଖିବା ସମୟରେ ସ୍ୱର ରେକର୍ଡକୁ ନାମହୀନ କରିବା ସାମିଲ ଅଛି।

OpenVoice ଏବଂ RVC ଭଳି ସ୍ୱର ପରିବର୍ତ୍ତନ ନମୂନା ସ୍ୱର-ରୁ-ସ୍ୱର ପରିବର୍ତ୍ତନକୁ ନିୟନ୍ତ୍ରଣ କରିଥାଏ। କ୍ରସ-ଭାଷା ବାକ୍ୟରୁ ବାକ୍ୟ ପାଇଁ, CosyVoice2ଏବଂ GPT-SoVITS ଭିନ୍ନ ଭାଷାରେ କ୍ଲୋନ ଏବଂ ପୁନଃସଂଯୋଜନ କରିପାରିବେ। Chatterbox ମଧ୍ୟ ସଂଯୋଗ-ଧ୍ୱନି ଆଧାରିତ ସଂଯୋଜନକୁ ସମର୍ଥନ କରିଥାଏ।

ହଁ। ସ୍ୱର କ୍ଲୋନିଂ ନମୂନା ବ୍ୟବହାର କରି, ଆପଣ ଆପଣଙ୍କର ସ୍ୱର ଗୁଣଧର୍ମକୁ ସଂରକ୍ଷଣ କରି ଆପଣଙ୍କର ଭାଷାକୁ ଅନ୍ୟ ଏକ ଭାଷାରେ ପରିବର୍ତ୍ତନ କରିପାରିବେ। AI ଆପଣଙ୍କର ସ୍ୱର ପରିଚୟକୁ ବାହାର କରିଥାଏ ଏବଂ ଲକ୍ଷ୍ୟ ଭାଷା କିମ୍ବା ଶୈଳୀରେ ଧ୍ୱନିକୁ ପୁନଃସଂଯୋଜିତ କରିଥାଏ।

ପାଇପଲାଇନ ପ୍ରଥମେ ଆପଣଙ୍କର ବକ୍ତବ୍ୟକୁ ଅନୁବାଦ କରେ, ପାଠ୍ୟକୁ ଲକ୍ଷ୍ୟ ଭାଷାକୁ ଅନୁବାଦ କରେ, ତା'ପରେ ଆପଣଙ୍କର ପ୍ରକୃତ ଭାଷାରେ ଅନୁବାଦ ପାଠ୍ୟକୁ ସଂଶ୍ଳୋଧନ କରିବା ପାଇଁ ଭାଷା କ୍ଲୋନିଂକୁ ବ୍ୟବହାର କରେ। CosyVoice2ପରି ନମୂନାଗୁଡ଼ିକ କ୍ରସ-ଭାଷା ସଂଶ୍ଳୋଧନ ପାଇଁ ୮ଟି ଭାଷାକୁ ସମର୍ଥନ କରିଥାଏ।

ଶ୍ରେଷ୍ଠ ଫଳାଫଳ ପାଇଁ, ସର୍ବନିମ୍ନ ପୃଷ୍ଠଭୂମି ଶବ୍ଦ ସହିତ ସ୍ୱଚ୍ଛ ଧ୍ୱନିକୁ ଅପଲୋଡ କରନ୍ତୁ। WAV କିମ୍ବା FLAC 16kHz କିମ୍ବା ଉଚ୍ଚରେ ସବୁଠୁ ଭଲ ଭାବରେ କାମ କରେ। MP3, OGG, M4A, ଏବଂ WEBM କୁ ମଧ୍ୟ ଗ୍ରହଣ କରାଯାଏ। ସ୍ୱଚ୍ଛ ଭାଷା ସର୍ବାଧିକ ସଠିକ ରୂପାନ୍ତରଣ ସୃଷ୍ଟି କରେ।

ପାଖାପାଖି-ସତ୍ୟକାଳୀନ ପ୍ରକ୍ରିୟାକରଣ ଆମର API ମାଧ୍ୟମରେ ଉପଲବ୍ଧ ଅଛି, ଯାହାକି ସଂଶ୍ଲେଷଣ ପାଇଁ Kokoro ଏବଂ ପରିଚୟ ପାଇଁ Faster Whisper ପରି ଶୀଘ୍ର ନମୁନା ବ୍ୟବହାର କରିଥାଏ। ଲାଟେନସି ନମୁନା ଏବଂ ଧ୍ୱନି ଲମ୍ବ ଉପରେ ନିର୍ଭର କରିଥାଏ, କିନ୍ତୁ ସବ-3-ସେକେଣ୍ଡ ତରଙ୍ଗଗୁଡିକ ସଂକ୍ଷିପ୍ତ ଉଚ୍ଚାରଣଗୁଡ଼ିକ ପାଇଁ ଉପଲବ୍ଧ ହୋଇଥାଏ।

ହଁ। Chatterbox, Spark TTS, ଏବଂ IndexTTS-2 ଭଳି ନମୂନାମାନେ ଅନୁଭୂତି ଏବଂ ଶୈଳୀ ନିୟନ୍ତ୍ରଣକୁ ସମର୍ଥନ କରିଥାଏ। ଆପଣ ଶାନ୍ତ ଭାଷଣକୁ ଉତ୍ସାହିତରେ ପରିବର୍ତ୍ତନ କରିପାରିବେ, ଦୁଃଖକୁ ଖୁସିରେ, କିମ୍ବା ତୃଣମୂଳକୁ ନାଟକୀୟରେ ସମାନ ଶବ୍ଦ ଏବଂ ବକ୍ତା ପରିଚୟ ରଖିବା ସହିତ।

ବାକ୍ୟରୁ ବାକ୍ୟକୁ ପରିବର୍ତ୍ତନ କରିବା ପାଇଁ ପରିଚୟ ଏବଂ ସଂଶ୍ଳୋଧନ କ୍ରେଡିଟକୁ ସଂଯୋଜିତ କରନ୍ତୁ। ଗୋଟିଏ ସାଧାରଣ 1-ମିନିଟ ପରିବର୍ତ୍ତନ ବଚ୍ଛିତ ମଡେଲ ଉପରେ ନିର୍ଭର କରି 3-8 କ୍ରେଡିଟ ବ୍ୟବହାର କରିଥାଏ। Kokoro ଭଳି ମୁକ୍ତ-ସ୍ତର ମଡେଲଗୁଡ଼ିକୁ ଶୂନ୍ଯ ଖର୍ଚ୍ଚରେ ସଂଶ୍ଳୋଧନ ପର୍ଯ୍ୟାୟ ପାଇଁ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ମୁକ୍ତ ଚାଳକମାନେ 1 ମିନିଟ ପର୍ଯ୍ୟନ୍ତ ଧ୍ୱନି ପ୍ରକ୍ରିୟାକରଣ କରିପାରିବେ। ପୈଠିତ ଯୋଜନାଗୁଡ଼ିକ 10 ମିନିଟ ପର୍ଯ୍ୟନ୍ତ ଫାଇଲଗୁଡ଼ିକୁ ସମର୍ଥନ କରିଥାଏ। ଦୀର୍ଘ ରେକର୍ଡିଂଗୁଡ଼ିକ ପାଇଁ, ଧ୍ୱନିକୁ ଅଂଶଗୁଡ଼ିକରେ ବିଭକ୍ତ କରନ୍ତୁ କିମ୍ବା କୌଣସି ଲମ୍ବ ସୀମା ବିନା ବ୍ୟାଚ ପ୍ରକ୍ରିୟାକରଣ ପାଇଁ ଆମର API କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ହଁ, ସମସ୍ତ ଅଦ୍ୟତିତ ଧ୍ୱନି ଆମର ସୁରକ୍ଷିତ GPU ସର୍ଭରଗୁଡ଼ିକରେ ପ୍ରକ୍ରିୟାକୃତ ହୋଇଥାଏ ଏବଂ 24 ଘଣ୍ଟା ମଧ୍ୟରେ ସ୍ୱୟଂଚାଳିତ ଭାବରେ ଅପସାରଣ ହୋଇଥାଏ। ଆମେ ଆପଣଙ୍କର ଧ୍ୱନିକୁ ମଡେଲଗୁଡ଼ିକୁ ପ୍ରଶିକ୍ଷଣ ଦେବା ପାଇଁ କେବେବି ବ୍ୟବହାର କରୁନୁ। ସମସ୍ତ ସ୍ଥାନାନ୍ତରଣଗୁଡ଼ିକ ସଂଗୁପ୍ତ ସଂଯୋଗଗୁଡ଼ିକୁ ବ୍ୟବହାର କରିଥାଏ ଏବଂ ସର୍ଭର-ରୁ-ସର୍ଭର ସଂଚାର ପ୍ରମାଣିତ ହୋଇଥାଏ।
5.0/5 (1)

ଆମେ କଣ ସୁଧାରିପାରିବା? ଆପଣଙ୍କର ପ୍ରତିକ୍ରିୟା ଆମକୁ ସମସ୍ୟାର ସମାଧାନ କରିବାରେ ସହାୟକ ହୋଇଥାଏ ।

AI ସହିତ ଯେକୌଣସି ଭାଷଣକୁ ପରିବର୍ତ୍ତନ କରନ୍ତୁName

ଧ୍ୱନି, ଅନୁଭୂତି, ଭାଷା ଏବଂ ଶୈଳୀ ପରିବର୍ତ୍ତନ କରନ୍ତୁ। ମୁକ୍ତ ଭାବରେ ଯୋଗଦାନ କରନ୍ତୁ ଏବଂ ଆରମ୍ଭ କରିବା ପାଇଁ 50 କ୍ରିଡ଼େଟ ପାଇବେ।