Emoticons ସହିତ ପାଠ୍ୟରୁ ବାକ୍ୟName

ପ୍ରକୃତ ଭାବପ୍ରବଣ ଅଭିବ୍ୟକ୍ତି ସହିତ ଭାଷା ସୃଷ୍ଟି କରନ୍ତୁ - ଖୁସି, ଦୁଃଖୀ, କ୍ରୋଧିତ, ଉତ୍ସାହିତ, ଫୁସଫୁସ କରିବା, ଏବଂ ଅଧିକ। ଆମର AI ମଡେଲ ଫ୍ଲାଟ ନୃତ୍ୟକୁ ଅତିକ୍ରମ କରି ପ୍ରକୃତ ଅନୁଭୂତି ପ୍ରଦାନ କରୁଥିବା ଭାଷା ପ୍ରଦାନ କରିଥାଏ। କାହାଣୀ ବର୍ଣ୍ଣନା, ଗେମ୍ ଡାଇଲଗ, ବିକ୍ରୟ ବିଷୟବସ୍ତୁ, ଏବଂ ଯେକୌଣସି ପ୍ରକଳ୍ପ ଯେଉଁଠାରେ ଶବ୍ଦ ଭଳି ଶବ୍ଦ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ।

ଖୁସି ସୋମ କ୍ରୋଧିତ ଉତ୍ସାହିତ ହସଖୁସି

ବର୍ତ୍ତମାନ ଚେଷ୍ଟାକରନ୍ତୁ

Kokoro, Piper, VITS, MeloTTS ସହିତ ମୁକ୍ତ
ଆପଣଙ୍କର ନିର୍ମିତ ଧ୍ୱନି ଏଠାରେ ଦର୍ଶାଯିବ
ସୃଷ୍ଟିକର୍ତ୍ତା
ଆହରଣ କରନ୍ତୁ
TTS.ai କୁ ଭଲପାଆନ୍ତି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ଭାବପ୍ରବଣ TTS ବିଶେଷତାଗୁଡ଼ିକ

ପ୍ରକୃତ ଅନୁଭୂତି ଏବଂ ଭାବନାକୁ ବ୍ୟକ୍ତ କରୁଥିବା AI ଧ୍ୱନି

ଏକାଧିକ Emoticons

ଭିନ୍ନ ଭିନ୍ନ ଭାବପ୍ରବଣ ଶବ୍ଦ ସହିତ ଭାଷା ସୃଷ୍ଟି କରନ୍ତୁ - ଖୁସି, ଦୁଃଖୀ, ରାଗ, ଭୟ, ଆଶ୍ଚର୍ଯ୍ୟ, ବିରକ୍ତ ଏବଂ ନିରପେକ୍ଷ। ପ୍ରତ୍ୟେକ ଭାବପ୍ରବଣତା ତାଳ, ବେଗ ଏବଂ ଶବ୍ଦକୁ ପରିବର୍ତ୍ତନ କରିଥାଏ।

ତୀବ୍ରତା ନିୟନ୍ତ୍ରଣ

ଭାବପ୍ରବଣତା ତୀବ୍ରତାକୁ ସନ୍ତୁଳନ କରନ୍ତୁ, ଅତି ସୀମିତରୁ ନୃତ୍ୟମୂଳକ ପର୍ଯ୍ୟନ୍ତ। ସ୍ୱରରେ ଏକ ସୀମିତ ହସ କିମ୍ବା ସମ୍ପୂର୍ଣ୍ଣ ଆନନ୍ଦମୟ ଉତ୍ସାହ - ଆପଣଙ୍କର ବିଷୟବସ୍ତୁ ସହିତ ମେଳ ଖାଉଥିବାରୁ ଭାବପ୍ରବଣ ଅଭିବ୍ୟକ୍ତିକୁ ସୁସଂଯୋଜିତ କରନ୍ତୁ।

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି

ଭାବନାଗୁଡ଼ିକ ସମ୍ପୂର୍ଣ୍ଣ ଭାଷାର ଢାଞ୍ଚାକୁ ପ୍ରଭାବିତ କରିଥାଏ, କେବଳ ଶବ୍ଦଗୁଡ଼ିକ ନୁହେଁ । ଦୁଃଖୀ ଭାଷାର ଶବ୍ଦଗୁଡ଼ିକ ହ୍ରାସ ପାଇବା ସହିତ ଧିରେ ହୋଇଥାଏ । ଉତ୍ସାହିତ ଭାଷାର ଶବ୍ଦଗୁଡ଼ିକ ବୃଦ୍ଧି ପାଇବା ସହିତ ଦ୍ରୁତ ହୋଇଥାଏ । ପ୍ରୋସୋଡି ପ୍ରାକୃତିକ ଭାବରେ ଅନୁଭବ ହୋଇଥାଏ ।

ଚିତ୍କାର ଏବଂ ଡାକିବାName

ମାନଦଣ୍ଡ ଅନୁଯାୟୀ ଭାବନାକୁ ଅତିକ୍ରମ କରି, ଆତ୍ମୀୟ କିମ୍ବା ଏଏସଏମଆର ବିଷୟବସ୍ତୁ ପାଇଁ ସ୍ପଷ୍ଟ ଭାଷା ସୃଷ୍ଟି କରନ୍ତୁ ଏବଂ ନାଟକୀୟ ମୁହୂର୍ତ୍ତ ଏବଂ ଘୋଷଣା ପାଇଁ ଦୃଢ଼ତାର ସହ ପ୍ରଦାନ କରନ୍ତୁ ।

ସାକ୍ଷାତକାର-ସଚେତନ ଅଭିବ୍ୟକ୍ତି

କିଛି ନମୂନା ସ୍ୱୟଂଚାଳିତ ଭାବରେ ପାଠ୍ୟରୁ ଭାବଗତ ପ୍ରସଙ୍ଗକୁ ଚିହ୍ନଟ କରିଥାଏ । ପ୍ରଶ୍ନଗୁଡ଼ିକ ଉଚ୍ଚାରଣକୁ ବୃଦ୍ଧି କରିଥାଏ, ଉଚ୍ଚାରଣଗୁଡ଼ିକ ଗୁରୁତ୍ୱପ୍ରଦାନ କରିଥାଏ, ଏବଂ ତାଲିକାଗୁଡ଼ିକ ମଧ୍ୟ ଗତିକୁ ବୃଦ୍ଧି କରିଥାଏ ।

ସରଳ- ଗ୍ରହଣୀୟ ନିୟନ୍ତ୍ରଣ

ଉନ୍ନତ ପରିମାପକଗୁଡ଼ିକ ଆପଣଙ୍କୁ ସ୍ୱତନ୍ତ୍ର ଭାବରେ ଇଚ୍ଛାରୂପୀ ଭାବପ୍ରବଣ ରୂପରେଖଗୁଡ଼ିକ ପାଇଁ ପିଚ ରେଞ୍ଜ, କଥାବାର୍ତ୍ତା ହାର, ଶକ୍ତି ସ୍ତର, ଏବଂ breathinessକୁ ନିୟନ୍ତ୍ରଣ କରିବା ପାଇଁ ଅନୁମତି ଦେଇଥାଏ।

ଭାବପ୍ରବଣ ଭାଷଣ ପାଇଁ ଶ୍ରେଷ୍ଠ ମଡେଲଗୁଡ଼ିକName

ଭାବନା ଓ ଅଭିବ୍ୟକ୍ତିକୁ ପ୍ରସାରିତ କରିବାରେ ଉତ୍କର୍ଷତା ହାସଲ କରିଥିବା ନମୁନା

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 ଧ୍ୱନି କ୍ଲୋନିଂName

ଏହା ପାଇଁ ଉତ୍ତମ: ଶ୍ରେଷ୍ଠ ଭାବନା ନିୟନ୍ତ୍ରଣ - ସ୍ୱର କ୍ଲୋନିଂ ସହିତ ସଜଡ଼ା ଭାବନା ତୀବ୍ରତା

ଚେଷ୍ଟାକରନ୍ତୁ Chatterbox

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

ଏହା ପାଇଁ ଉତ୍ତମ: ପ୍ରାକୃତିକ ହସ, ଚିତ୍କାର, କାନ୍ଦିବା, ଏବଂ ଅବାକ୍ୟ ଭାବପ୍ରବଣ ଶବ୍ଦଗୁଡ଼ିକ

ଚେଷ୍ଟାକରନ୍ତୁ Bark

OrpheusOrpheus

Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Medium 5/5

ଏହା ପାଇଁ ଉତ୍ତମ: 100K ଘଣ୍ଟା ଅଭିବ୍ୟକ୍ତିଶୀଳ ଭାଷଣରେ ପ୍ରଶିକ୍ଷିତ ମାନବ-ସ୍ତରୀୟ ଭାବପ୍ରବଣ ପରିସର

ଚେଷ୍ଟାକରନ୍ତୁ Orpheus

Dia TTSDia TTS

Standard

Multi-speaker dialog generation model that creates natural conversations between speakers.

Medium 5/5

ଏହା ପାଇଁ ଉତ୍ତମ: ପ୍ରାକୃତିକ ପର୍ଯ୍ୟାୟ ନେବା ସହିତ ଅକ୍ଷରଗୁଡ଼ିକ ମଧ୍ୟରେ ଭାବପ୍ରବଣ ସଂଳାପ

ଚେଷ୍ଟାକରନ୍ତୁ Dia TTS

Parler TTSParler TTS

Standard

Describe the voice you want in natural language and Parler generates matching speech.

Medium 4/5

ଏହା ପାଇଁ ଉତ୍ତମ: ସରଳ ଇଂରାଜୀରେ ଅନୁଭୂତିଗତ ନିୟନ୍ତ୍ରଣ ପାଇଁ ଭାବପ୍ରବଣ ପ୍ରଦାନକୁ ବର୍ଣ୍ଣନା କରନ୍ତୁ

ଚେଷ୍ଟାକରନ୍ତୁ Parler TTS

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 ଧ୍ୱନି କ୍ଲୋନିଂName

ଏହା ପାଇଁ ଉତ୍ତମ: ରିୟଲ-ଟାଇମ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ପ୍ରବାହ ସହିତ ଫାଇନ-ଗ୍ରେନ ଇମୋସନ ନିୟନ୍ତ୍ରଣName

ଚେଷ୍ଟାକରନ୍ତୁ CosyVoice 2

ଭାବପ୍ରବଣ ବକ୍ତବ୍ୟ କିପରି ସୃଷ୍ଟି କରିବେName

ସେକଣ୍ଡଗୁଡ଼ିକରେ AI ଭାଷଣକୁ ଅନୁଭୂତି ଯୋଗକରନ୍ତୁ

1

ଆପଣଙ୍କର ପାଠ୍ୟ ଲେଖନ୍ତୁ

ପାଠ୍ୟ ଭରଣ କରନ୍ତୁ ଯାହାକୁ ଆପଣ ଭାବପ୍ରବଣ ଭାବରେ କହିବାକୁ ଚାହୁଁଛନ୍ତି । ବିଷୟବସ୍ତୁ ନିଜେ ଭାବପ୍ରବଣ ପ୍ରଦାନକୁ ପ୍ରଭାବିତ କରିପାରେ - ଉଚ୍ଚାରଣ, ପ୍ରଶ୍ନ, ଏବଂ ନାଟକୀୟ ପାଠ୍ୟ ସ୍ୱଭାବିକ ଭାବରେ ଅଭିବ୍ୟକ୍ତିକୁ ପଥ ପ୍ରଦର୍ଶନ କରିଥାଏ ।

2

ଗୋଟିଏ Emoticon ବାଛନ୍ତୁ

ଖୁସି, ଦୁଃଖୀ, କ୍ରୋଧିତ, ଭୟଭୀତ, ଉତ୍ସାହିତ, ହସୁଥିବା କିମ୍ବା ନିରପେକ୍ଷରୁ ବାଛନ୍ତୁ। କିଛି ମଡେଲ ଅତିରିକ୍ତ ଅନୁଭୂତିଗୁଡ଼ିକୁ ପ୍ରଦାନ କରିଥାଏ ଯେପରିକି ହସଖୁସି, ନରମ, କିମ୍ବା ଆଧିକାରୀକ।

3

ତୀବ୍ରତା ସଜାଡନ୍ତୁ

ଭାବନାକୁ କେତେ ଦୃଢ଼ ଭାବରେ ବ୍ୟକ୍ତ କରାଯାଇଛି ତାହାକୁ ସୁସଜ୍ଜିତ କରନ୍ତୁ। ନିମ୍ନ ତୀବ୍ରତା ସଫା ରଙ୍ଗ ଯୋଗକରେ। ଉଚ୍ଚ ତୀବ୍ରତା ନାଟକୀୟ, ଅବିଶ୍ବାସନୀୟ ଭାବନାଗତ ପ୍ରଦାନକୁ ଉତ୍ପାଦନ କରେ।

4

ସୃଷ୍ଟି କରନ୍ତୁ ଏବଂ ସଂଶୋଧନ କରନ୍ତୁ

ଭାଷା ସୃଷ୍ଟି କରନ୍ତୁ ଏବଂ ଶୁଣନ୍ତୁ। ଆବେଗ ପ୍ରକାର, ତୀବ୍ରତା, କିମ୍ବା ଆକାରକୁ ସଜାଇଦିଅନ୍ତୁ ଯେପର୍ଯ୍ୟନ୍ତ ପ୍ରଦାନ ଆପଣଙ୍କର ଦୃଷ୍ଟିଭଙ୍ଗୀ ସହିତ ମେଳ ଖାଉନାହିଁ। MP3 କିମ୍ବା WAVରେ ଅନ୍ତିମ ଧ୍ୱନିକୁ ଆହରଣ କରନ୍ତୁ।

ଭାବପ୍ରବଣ TTS ନମୁନା କ୍ଷମତାName

ଭିନ୍ନ ଭିନ୍ନ ମଡେଲ ଭାବପ୍ରବଣ ଅଭିବ୍ୟକ୍ତିକୁ କିପରି ପରିଚାଳନା କରେ

Bark - ଅଭିବ୍ୟକ୍ତିମୂଳକ ଏବଂ ଧ୍ୱନି ପ୍ରଭାବName

ବାର୍କ ବକ୍ତବ୍ୟ ସହିତ ଅବାକ୍ୟ ଶବ୍ଦ ସୃଷ୍ଟି କରିବାରେ ଅଲଗା ଅଲଗା ଭାବରେ ସକ୍ଷମ। ଭାବପ୍ରବଣ ପ୍ରତିକ୍ରିୟା ସୃଷ୍ଟି କରିବା ପାଇଁ ଆପଣଙ୍କର ପାଠ୍ୟରେ [ହସିଲା], [ହସିଲା], [ହସିଲା], କିମ୍ବା [ଗଳା ଖୋଲିଲା] ଭଳି ପାଠ୍ୟ ପ୍ରେରଣା ବ୍ୟବହାର କରନ୍ତୁ। ବାର୍କ ଗୀତ ମଧ୍ୟ ଗାଇ ପାରିବ, ଫୁସଫୁସ କରି ପାରିବ, ଏବଂ ଶକ୍ତ ଭାବପ୍ରବଣ ବିବର୍ତ୍ତନ ସହିତ ବକ୍ତବ୍ୟ ସୃଷ୍ଟି କରି ପାରିବ।

  • ହସ: \
  • ଦୁଃଖ: \
  • ଆଶ୍ଚର୍ଯ୍ୟ: \
  • ଗୀତ ଗାଇବା: ସଙ୍ଗୀତୀୟ ଧ୍ୱନି ଏବଂ ମେଲୋଡି

Orpheus - Emoticons ସୂଚକଗୁଡ଼ିକ

Orpheus (Llama 3.2 ଉପରେ ନିର୍ମିତ) ସୂଚକଗୁଡ଼ିକ ମାଧ୍ୟମରେ ସ୍ପଷ୍ଟଭାବରେ ଅନୁଭୂତି ନିୟନ୍ତ୍ରଣକୁ ସମର୍ଥନ କରେ। ପାଠ୍ୟକୁ ଅନୁଭୂତି ସୂଚକଗୁଡ଼ିକରେ ନିୟନ୍ତ୍ରଣ କରିବା ପାଇଁ ଲଗାଇଦିଅନ୍ତୁ: , , , , । ଗତିଶୀଳ, ପରିବର୍ତ୍ତନଶୀଳ ଧ୍ୱନି ପାଇଁ ଗୋଟିଏ ପିଢ଼ି ମଧ୍ୟରେ ଅନୁଭୂତିଗୁଡ଼ିକୁ ମିଶାଇଦିଅନ୍ତୁ।

  • ଖୁସି, ଉନ୍ନତ ପ୍ରଦାନ ପାଇଁ
  • ମଳମଳ, ଶୋକର ସ୍ୱର ପାଇଁ
  • ଶକ୍ତିଶାଳୀ, ତୀବ୍ର ବକ୍ତବ୍ୟ ପାଇଁ
  • ଶୋକପ୍ରବଣ, ଆଶ୍ଚର୍ଯ୍ୟପ୍ରବଣ ପ୍ରତିକ୍ରିୟା ପାଇଁ

Dia - ବହୁ-ବକ୍ତା ସଂଳାପ

Dia ଦୁଇ ଜଣ ବକ୍ତାଙ୍କ ସହିତ କଥାବାର୍ତ୍ତା ଭାଷଣରେ ବିଶେଷଜ୍ଞ। ଏହା ସ୍ୱଭାବିକ ଭାବରେ ବଦଳ-ଗ୍ରହଣ, ବିଘ୍ନ ଏବଂ ପ୍ରକୃତ କଥାବାର୍ତ୍ତାର ଭାବଗତ ଗତିକୁ ପରିଚାଳନା କରିଥାଏ। କଥାବାର୍ତ୍ତା ଦୃଶ୍ୟ, ସାକ୍ଷାତକାର କିମ୍ବା ପୋଡକାଷ୍ଟ-ଶୈଳୀ ବିଷୟବସ୍ତୁ ସୃଷ୍ଟି କରିବା ପାଇଁ ଭଲ ଯେଉଁଠାରେ ଭାବଗତ ଆନ୍ତଃକ୍ରିୟା ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ।

  • ପ୍ରାକୃତିକ ବାର୍ତ୍ତାଳାପ ଗତି
  • ଭିନ୍ନ ଭିନ୍ନ ଧ୍ୱନି ସହିତ ଦୁଇ-ବକ୍ତା ସଂଳାପName
  • ବକ୍ତାଙ୍କ ମଧ୍ୟରେ ଭାବପ୍ରବଣ ପ୍ରତିକ୍ରିୟା
  • ମୂଖ୍ୟହୀନ ଶବ୍ଦଗୁଡ଼ିକ (ହସିବା, ଡରିବା)

Sesame CSM - କଥାବାର୍ତ୍ତା ପ୍ରସଙ୍ଗ

Sesame CSM (Conversational Speech Model) କୁ ସ୍ୱଭାବିକ କଥାବାର୍ତ୍ତା ପରି ଶୁଣାଯାଉଥିବା କଥାବାର୍ତ୍ତା ଉତ୍ପାଦନ କରିବା ପାଇଁ ନିର୍ମାଣ କରାଯାଇଛି, ଉଚ୍ଚ ସ୍ୱରରେ ପଢି ନଥାଏ । ଏହା ପ୍ରକୃତ କଥାବାର୍ତ୍ତାର ସୌନ୍ଦର୍ଯ୍ୟପୂର୍ଣ୍ଣ ଭାବନାତ୍ମକ ଚିହ୍ନଗୁଡ଼ିକୁ ପରିଚାଳନା କରିଥାଏ - ଚିନ୍ତା କରିବା ପାଇଁ ବିରାମ, ମୁଖ୍ୟ ଶବ୍ଦଗୁଡ଼ିକ ଉପରେ ଗୁରୁତ୍ୱାରୋପ, ପ୍ରଶ୍ନଗୁଡ଼ିକ ପାଇଁ ଉଚ୍ଚାରଣ, ଏବଂ ବନ୍ଧୁଗତ ପରିବେଶରେ ଉଷ୍ମତା ।

  • ପ୍ରସଙ୍ଗ-ସଚେତନ ଭାବପ୍ରବଣ ପ୍ରଦାନ
  • ପ୍ରାକୃତିକ କଥାବାର୍ତ୍ତା ଗତି
  • ଉପଯୁକ୍ତ ଗୁରୁତ୍ବ ଏବଂ ଗତି
  • ଉଷ୍ମ, ମାନବ-ସଦୃଶ ଗୁଣବତ୍ତା

ଯେତେବେଳେ ଭାବନା ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ

ଯେଉଁଠାରେ ଭାବପ୍ରବଣ TTS ଗୋଟିଏ ପ୍ରକୃତ ପରିବର୍ତ୍ତନ କରିଥାଏ ସେଠାରେ ମାମଲାଗୁଡ଼ିକୁ ବ୍ୟବହାର କରନ୍ତୁ

ଖେଳ ସଂଳାପ

ଏକ NPC ଯାହା ପ୍ରକୃତରେ ଭୟଭୀତ, ଏକ ଭୟଙ୍କର ବିପଦ ସହିତ ଏକ ବିପଦ, ଏକ ଉଷ୍ମତା ସହିତ ଏକ ସହଯୋଗୀ । ଭାବପ୍ରବଣ TTS ଖେଳର ଚରିତ୍ରମାନଙ୍କୁ ବିଶ୍ୱାସଯୋଗ୍ୟ ଏବଂ ନିବିଡ଼ କରିଥାଏ ।

ଧ୍ୱନି ପୁସ୍ତକ ବର୍ଣ୍ଣନା

ଗୋଟିଏ ବର୍ଣ୍ଣନାକାରୀ ଯିଏକି ଉତ୍ତେଜନାପୂର୍ଣ୍ଣ ମୁହୂର୍ତ୍ତଗୁଡ଼ିକରେ ଫୁସଫୁସ କରେ, କାର୍ଯ୍ୟ ସମୟରେ କାନ୍ଦେ, ଏବଂ ରୋମାଣ୍ଟିକ ଦୃଶ୍ୟଗୁଡ଼ିକରେ ଶାନ୍ତ ଭାବରେ କଥା ହୁଏ। ଭାବପ୍ରବଣ ପରିସର ପାଠ୍ୟକୁ ଆକର୍ଷଣୀୟ ଧ୍ୱନି କାହାଣୀଗୁଡ଼ିକରେ ପରିବର୍ତ୍ତନ କରିଥାଏ।

ବିକ୍ରୟ ଏବଂ ବିଜ୍ଞାପନName

ଉତ୍ପାଦ ଉନ୍ମୋଚନ ପାଇଁ ଉତ୍ସାହିତ ସ୍ୱର, ସାକ୍ଷାତକାର ପାଇଁ ଉଷ୍ମ ସ୍ୱର, ସୀମିତ ସମୟର ପ୍ରସ୍ତାବ ପାଇଁ ଜରୁରୀ ସ୍ୱର – ସଠିକ ଭାବନା ଯୋଗଦାନ ଏବଂ ପରିବର୍ତ୍ତନକୁ ଆଗକୁ ବଢ଼ାଇଥାଏ ।

API ମାଧ୍ୟମରେ ଭାବପ୍ରବଣ ବକ୍ତବ୍ୟName

ନିର୍ଦ୍ଦିଷ୍ଟ ଅନୁଭୂତି ନିୟନ୍ତ୍ରଣ ସହିତ ଭାଷଣ ସୃଷ୍ଟି କରନ୍ତୁName

Python - ବାର୍କ ସହିତ ଭାବପ୍ରବଣ TTSName REST API
import requests

# Bark supports inline emotion cues
emotions = {
    "happy": "This is absolutely wonderful! [laughs] I love it!",
    "sad": "[sighs] I wish things could have been different...",
    "angry": "I told you not to do that! This is unacceptable!",
    "whisper": "[whispers] Can you keep a secret?",
    "excited": "Oh my gosh! [gasps] We won! We actually won!"
}

for emotion, text in emotions.items():
    response = requests.post("https://api.tts.ai/v1/tts", json={
        "text": text,
        "model": "bark",
        "voice": "v2/en_speaker_6",
        "format": "wav"
    }, headers={"Authorization": "Bearer YOUR_API_KEY"})

    with open(f"emotion_{emotion}.wav", "wb") as f:
        f.write(response.content)

ପ୍ରତ୍ୟେକ ସ୍ତରରେ ଭାବପ୍ରବଣ ସ୍ୱର

କୋକୋରୋ ଭଳି ମୁକ୍ତ ମଡେଲ ମଧ୍ୟ ବିରାମ ଚିହ୍ନ ଏବଂ ପରିସରଭୁକ୍ତ ଭାବନାକୁ ପ୍ରାକୃତିକ ଭାବେ ପ୍ରଦାନ କରିଥାଏ ।

ମୁକ୍ତ ସ୍ତର

$0

15,000 ଅକ୍ଷର

  • ସାଂଗଠନିକ-ସଚେତନ ଇମୋସନକୁ ନକଲ କରନ୍ତୁ
  • ବିରାମ ଚିହ୍ନରୁ ପ୍ରାକୃତିକ ପ୍ରୋସୋଡିKCharselect unicode block name
  • ପ୍ରଶ୍ନ ଏବଂ ଉଚ୍ଚାରଣ ଚିହ୍ନ ପରିଚାଳନା

ଆରମ୍ଭକର୍ତ୍ତା

$9

500 ଋଣ/ମାସ

  • ଧ୍ୱନି ପ୍ରଭାବ ଏବଂ ହସ ସହିତ ବାର୍କ୍Name
  • Orpheus ଅନୁଭୂତି ସୂଚକଗୁଡ଼ିକ
  • କୌଣସି କଥାବାର୍ତ୍ତାଭାବ ନାହିଁ

ପ୍ରୋ

$29

2000 ଋଣ/ମାସ

  • Sesame CSM କଥାବାର୍ତ୍ତାName
  • ସମସ୍ତ ଅଭିବ୍ୟକ୍ତି ମଡେଲଗୁଡ଼ିକ
  • ଭାବପ୍ରବଣତା ସହିତ ଧ୍ୱନି କ୍ଲୋନିଂ
ସମ୍ପୂର୍ଣ୍ଣ ମୂଲ୍ୟାଙ୍କନ ଦେଖନ୍ତୁ

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

ଭାବପ୍ରବଣ ପାଠ୍ୟରୁ ଭାଷଣ ବିଷୟରେ ସାଧାରଣ ପ୍ରଶ୍ନଗୁଡ଼ିକ

Chatterbox, Bark, Orpheus, Dia, Parler, CosyVoice2, ଏବଂ IndexTTS-2 ସମସ୍ତେ ଭାବପ୍ରବଣ ଅଭିବ୍ୟକ୍ତିକୁ ସମର୍ଥନ କରନ୍ତି। Chatterbox ସବୁଠୁ ସରଳ ତୀବ୍ରତା ନିୟନ୍ତ୍ରଣ ପ୍ରଦାନ କରେ। Bark ସବୁଠୁ ପ୍ରାକୃତିକ ଅବାକ୍ୟ ଶବ୍ଦଗୁଡ଼ିକୁ ଉତ୍ପାଦନ କରେ ଯେପରିକି ହସିବା ଏବଂ କାନ୍ଦିବା।

ନମୂନାଗୁଡ଼ିକ ଉତ୍ପନ୍ନ ଭାଷାକୁ ପରିବର୍ତ୍ତନ କରିବା ପାଇଁ ଭାବନା ସନ୍ଦେଶଗୁଡ଼ିକୁ ବ୍ୟବହାର କରିଥାଏ। ଏହା ପୀଚ କଣ୍ଟ୍ରୋଲ୍, ଭାଷାର ବେଗ, ଶକ୍ତି ସ୍ତର ଏବଂ ଭାଷା ଗୁଣବତ୍ତାକୁ ପ୍ରଭାବିତ କରିଥାଏ। ଫଳାଫଳଟି ହେଉଛି ଭାଷା ଯାହାକି କେବଳ ପାଠ୍ୟକୁ ପଢିବା ପରିବର୍ତ୍ତେ ସ୍ୱଭାବିକ ଭାବରେ ନିର୍ଦ୍ଦିଷ୍ଟ ଭାବନାକୁ ପ୍ରଦାନ କରିଥାଏ।

ହଁ। Bark ଏବଂ Chatterbox whisperingକୁ ସମର୍ଥନ କରିଥାଏ। Bark ନିବେଶରେ "[whispers]" ପରି ପାଠ୍ୟ ସୂଚକଗୁଡ଼ିକରୁ whispered ଭାଷଣ ସୃଷ୍ଟି କରିଥାଏ। Chatterbox ଏହାର ଭାବପ୍ରବଣ ପରିମାପକଗୁଡ଼ିକ ମାଧ୍ୟମରେ ସିଧାସଳଖ whisper ନିୟନ୍ତ୍ରଣକୁ ଅନୁମତି ଦେଇଥାଏ। whispered ନିର୍ଗମ ପ୍ରାକୃତିକ ଏବଂ ଅନ୍ତରଙ୍ଗ ଶବ୍ଦ କରିଥାଏ।

ହଁ। ବାର୍କ ଅବାକ୍ୟ ସ୍ୱରକରଣ ପାଇଁ ଶ୍ରେଷ୍ଠ ମଡେଲ ଅଟେ। ଏହା ପାଠ୍ୟରେ ସୂଚକଗୁଡ଼ିକୁ ଅନ୍ତର୍ଭୁକ୍ତ କରି ପ୍ରାକୃତିକ ସ୍ୱରକରଣ ହସ, କାନ୍ଦ, ନିଃଶ୍ୱାସ ଓ ଅନ୍ୟାନ୍ୟ ଶବ୍ଦଗୁଡ଼ିକୁ ସୃଷ୍ଟି କରିପାରେ। ଏହି ଶବ୍ଦଗୁଡ଼ିକ ବଚନ ଶବ୍ଦଗୁଡ଼ିକ ସହିତ ସୁସଂଯୋଜିତ ହୋଇଥାଏ।

ଠିକ ମଡେଲ ସହିତ ବହୁତ ପ୍ରାକୃତିକ। Orpheus କୁ 100K ଘଣ୍ଟା ଅଭିବ୍ୟକ୍ତିଶୀଳ ଭାଷାରେ ପ୍ରଶିକ୍ଷଣ ଦିଆଯାଇଥିଲା ଏବଂ ଏହା ମାନବ-ସ୍ତରୀୟ ଭାବପ୍ରବଣ ଅଭିବ୍ୟକ୍ତିକୁ ହାସଲ କରିଥାଏ। ଚାଟରବକ୍ସ ବିଶ୍ୱାସଯୋଗ୍ୟ ଭାବପ୍ରବଣ ପ୍ରଦାନକୁ ଉତ୍ପାଦନ କରେ ଯାହାକି ଶ୍ରୋତାମାନେ ସାଧାରଣତଃ ମାନବୀୟ ରେକର୍ଡରୁ ଭିନ୍ନ କରିପାରିବେ ନାହିଁ।

ହଁ। ଚାଟରବକ୍ସ ଏବଂ କୋସିଭାୟସ ୨ ନିରନ୍ତର ତୀବ୍ରତା ସ୍ଲାଇଡର ପ୍ରଦାନ କରିଥାଏ। ସରଳ ରଙ୍ଗ ପାଇଁ 20% କିମ୍ବା ନାଟକୀୟ ଅଭିବ୍ୟକ୍ତି ପାଇଁ 100% ପାଇଁ ଭାବନାକୁ ସେଟ କରନ୍ତୁ। ଏହି ଗ୍ରେନାଲିଟି ଆପଣଙ୍କୁ ଆପଣଙ୍କର ବିଷୟବସ୍ତୁ ଆବଶ୍ୟକ କରୁଥିବା ସଠିକ ଭାବନାଗତ ଟୋନକୁ ମେଳକ କରିବା ପାଇଁ ଅନୁମତି ଦେଇଥାଏ।

ମାନକ ଭାବପ୍ରବଣତାଗୁଡ଼ିକ ମଧ୍ୟରେ ଖୁସି, ଦୁଃଖ, କ୍ରୋଧ, ଭୟ, ଆଶ୍ଚର୍ଯ୍ୟ, ବିରକ୍ତ, ଏବଂ ତୃଣମୂଳ ଅଟେ। କିଛି ନମୂନା ଗୁଣୁଗୁଣୁ କରିବା, କାନ୍ଦିବା, ସରଳ, ସରଳ, ଆଧିକାରୀକ, ଏବଂ ଉତ୍ସାହିତକୁ ଯୋଗ କରିଥାଏ। ପାର୍ଲର ଆପଣଙ୍କୁ ପ୍ରାକୃତିକ ଭାଷାରେ ଯେକୌଣସି ଭାବପ୍ରବଣତା ଗୁଣବତ୍ତା ବର୍ଣ୍ଣନା କରିବାକୁ ଅନୁମତି ଦେଇଥାଏ।

ହଁ। ଦୁଇ-ଅକ୍ଷର ଭାବପ୍ରବଣ ବାର୍ତ୍ତାଳାପ ପାଇଁ Dia TTS ବ୍ୟବହାର କରନ୍ତୁ, କିମ୍ବା ଭିନ୍ନ ଭିନ୍ନ ଭାବପ୍ରବଣ ବିନ୍ୟାସ ସହିତ ପ୍ରତ୍ୟେକ ଅକ୍ଷରକୁ ବିଭିନ୍ନ ଭାବରେ ସୃଷ୍ଟି କରନ୍ତୁ। ଏକ ଅକ୍ଷରକୁ ଆନନ୍ଦ ଏବଂ ଅନ୍ୟଟିକୁ ବିରକ୍ତିକୁ ନାଟକୀୟ ଭାବେ ସମୃଦ୍ଧ ବାର୍ତ୍ତାଳାପ ପାଇଁ ନିର୍ଦ୍ଧାରଣ କରନ୍ତୁ।

ନିଶ୍ଚିତ । ଭାବପ୍ରବଣ TTS ସରଳ ବର୍ଣ୍ଣନାକୁ ଆକର୍ଷଣୀୟ କାହାଣୀରେ ପରିଣତ କରିଥାଏ । ଭାବପ୍ରବଣତାକୁ ଦୃଶ୍ୟର ପରିପ୍ରେକ୍ଷୀରେ ମିଶାଇଥାଏ — ତୀବ୍ର ପାଦଗୁଡ଼ିକ ଭୟଙ୍କର ପ୍ରଦାନ ପାଇଥାଏ, ଖୁସି ସମାପ୍ତି ଉତ୍ତମ ଆନନ୍ଦ ପାଇଥାଏ, ନାଟକୀୟ ମୁହୂର୍ତ୍ତଗୁଡ଼ିକ ତୀବ୍ରତା ପାଇଥାଏ । ଏହା ଶୁଣକମାନଙ୍କ ଆଗ୍ରହକୁ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ଭାବେ ବୃଦ୍ଧି କରିଥାଏ ।

ହଁ. CosyVoice2ଅଥବା Sesame CSMକୁ ଉପଯୁକ୍ତ ଭାବପ୍ରବଣ ପ୍ରତିକ୍ରିୟା ସହିତ କଥାବାର୍ତ୍ତା AI ପାଇଁ ଡିଜାଇନ କରାଯାଇଛି। ଗୋଟିଏ ସ୍ୱର ସହାୟକ ଯାହା ବ୍ୟବହାରକାରୀଙ୍କ ଅସନ୍ତୋଷକୁ ସହାନୁଭୂତିପୂର୍ଣ୍ଣ ଭାବରେ ବା ଭଲ ଖବରକୁ ଉତ୍ସାହିତ ଭାବରେ ପ୍ରତିକ୍ରିୟା ଦେଇଥାଏ, ତାହା ଉତ୍ତମ ବ୍ୟବହାରକାରୀ ଅନୁଭୂତି ସୃଷ୍ଟି କରିଥାଏ।

ହଁ । ଭାବନାଗୁଡ଼ିକ ପ୍ରାକୃତିକ ଭାବରେ ବହୁବିଧ ଭାଷା ପରିମାପକୁ ପରିବର୍ତ୍ତନ କରିଥାଏ । ଖୁସି ଭାଷା ଉଚ୍ଚ ପୀଚ ସହିତ ଦ୍ରୁତ ହୋଇଥାଏ । ଦୁଃଖୀ ଭାଷା ନିମ୍ନ ପୀଚ ସହିତ ଧିରେ ହୋଇଥାଏ । କ୍ରୋଧିତ ଭାଷାର ଶକ୍ତି ଏବଂ ତୀବ୍ରତା ବୃଦ୍ଧି ପାଇଥାଏ । ଏହି ପରିବର୍ତ୍ତନଗୁଡ଼ିକ ପ୍ରକୃତରେ ମନୁଷ୍ୟମାନେ ଭାବନାଗୁଡ଼ିକୁ କିପରି ବ୍ୟକ୍ତ କରନ୍ତି ତାହା ପ୍ରତିଫଳିତ କରିଥାଏ ।

ଅଧିକାଂଶ ନମୂନା ପ୍ରତି ପିଢ଼ିରେ ଗୋଟିଏ ଭାବନା ପ୍ରୟୋଗ କରିଥାଏ। ମିଶ୍ରିତ ଭାବନା ପାଇଁ, ଭିନ୍ନ ଭିନ୍ନ ଭାବନାଗତ ବିନ୍ୟାସ ସହିତ ଅଂଶଗୁଡ଼ିକୁ ବିଭିନ୍ନ ଭାବରେ ସୃଷ୍ଟି କରନ୍ତୁ ଏବଂ ସେମାନଙ୍କୁ ସଂଲଗ୍ନ କରନ୍ତୁ। ଉଦାହରଣ ସ୍ୱରୂପ, ଗୋଟିଏ ବାକ୍ୟକୁ ତୃଣମୂଳ ଭାବରେ ଆରମ୍ଭ କରନ୍ତୁ ଏବଂ ଦୁଇଟି ପିଢ଼ିରେ ବିଭାଜିତ କରି ଏହାକୁ କ୍ରୋଧିତ ଭାବରେ ସମାପ୍ତ କରନ୍ତୁ।
5.0/5 (1)

ଆମେ କଣ ସୁଧାରିପାରିବା? ଆପଣଙ୍କର ପ୍ରତିକ୍ରିୟା ଆମକୁ ସମସ୍ୟାର ସମାଧାନ କରିବାରେ ସହାୟକ ହୋଇଥାଏ ।

ଆପଣଙ୍କର AI ସ୍ୱରକୁ ପ୍ରକୃତ ଭାବନା ଦିଅନ୍ତୁ

ଖୁସି, ଦୁଃଖୀ, ରାଗ, ହସୁଥିବା - ବାକ୍ୟ ସୃଷ୍ଟି କରନ୍ତୁ ଯାହାକି ପ୍ରକୃତରେ ଅନୁଭବକୁ ପ୍ରଦାନ କରେ। ଭାବପ୍ରବଣ TTS ନମୂନାକୁ ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ।