ସକ୍ରିୟ ପ୍ରବାହ ପାଇଁ AI ଧ୍ୱନି ଉତ୍ପାଦକ

AI-ଶକ୍ତିଯୁକ୍ତ ସ୍ୱର ସହିତ ଆପଣଙ୍କର Twitch, YouTube, ଏବଂ Kick ପ୍ରବାହକୁ ସ୍ତର କରନ୍ତୁ। ଇଚ୍ଛାରୂପୀ TTS ଅନୁଦାନ ସଚେତନତା, AI ସହ-ସଂଯୋଜକମାନଙ୍କୁ ସୃଷ୍ଟି କରନ୍ତୁ ଯାହାକି ଚାଟ ସହିତ ଅନ୍ତରାପୃଷ୍ଠ, ରିୟଲ-ଟାଇମ ଚାଟ-ତୁ-ସ୍ୱର, ଏବଂ ଗତିଶୀଳ ବର୍ଣ୍ଣନା ସହିତ ବୃତ୍ତିଗତ ପ୍ରବାହ ଓଭରଲେସକୁ ଗ୍ରହଣ କରିଥାଏ।

ଟ୍ଭିଚ TTS ୟୁଟ୍ୟୁବ ଲିଭ୍Name ଧ୍ୱନିକୁ ଚାଟ କରନ୍ତୁ ସକ୍ରିୟ ସଚେତନତା AI ସହ- ହୋଷ୍ଟ

ବର୍ତ୍ତମାନ ଚେଷ୍ଟାକରନ୍ତୁ

Kokoro, Piper, VITS, MeloTTS ସହିତ ମୁକ୍ତ
ଆପଣଙ୍କର ନିର୍ମିତ ଧ୍ୱନି ଏଠାରେ ଦର୍ଶାଯିବ
ସୃଷ୍ଟିକର୍ତ୍ତା
ଆହରଣ କରନ୍ତୁ
TTS.ai କୁ ଭଲପାଆନ୍ତି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ଷ୍ଟ୍ରିମରଗୁଡ଼ିକ ପାଇଁ AI ଧ୍ୱନି ବିଶେଷତାଗୁଡ଼ିକName

ସକ୍ରିୟ ପ୍ରବାହ କାର୍ଯ୍ଯପ୍ରବାହ ପାଇଁ ନିର୍ମିତ ସାଧନଗୁଡ଼ିକName

ଇଚ୍ଛାରୂପଣ ଅନୁଦାନ ସଚେତନକName

ପ୍ରାକୃତିକ AI ଧ୍ୱନିଗୁଡ଼ିକ ଯୋଗଦାନ ବିଜ୍ଞପ୍ତିଗୁଡ଼ିକ ପାଇଁ ରୋବୋଟିକ୍ TTSକୁ ବଦଳାନ୍ତି। ପ୍ରୀମିୟମ ପ୍ରଦର୍ଶକ ଅନୁଭୂତି ପାଇଁ ଭିନ୍ନ ଭିନ୍ନ ସ୍ତରରେ ଭିନ୍ନ ଭିନ୍ନ ଧ୍ୱନିଗୁଡ଼ିକୁ ନିର୍ଦ୍ଧାରଣ କରନ୍ତୁ।

ବାକ୍ୟ-ରୁ-ବାକ୍ୟ ଚାଟName

AI ସ୍ୱର ସହିତ ପ୍ରବାହରେ ଚାଟ ସନ୍ଦେଶଗୁଡ଼ିକୁ ଉଚ୍ଚାରଣ କରନ୍ତୁ। ପ୍ରତି ପ୍ରଦର୍ଶକ ପାଇଁ ଭିନ୍ନ ଭିନ୍ନ ସ୍ୱର, କେବଳ ଉପଭୋକ୍ତା-ପ୍ରୀମିୟମ ସ୍ୱର, ଅଶ୍ଳୀଳତା ଛାଣକ।

AI ସହ- ହୋଷ୍ଟ

ଗୋଟିଏ AI ବ୍ୟକ୍ତିତ୍ୱ ନିର୍ମାଣ କରନ୍ତୁ ଯାହାକି ଆପଣଙ୍କର ପ୍ରବାହକୁ ସହ-ସଂଯୋଜନ କରିଥାଏ। ଚାଟକୁ ଉତ୍ତର ଦିଅ, ଖେଳ ଘଟଣାଗୁଡ଼ିକୁ ପ୍ରତିକ୍ରିୟା ଦିଅନ୍ତୁ, ଏବଂ ଇଚ୍ଛାରୂପଣ ସ୍ୱର ସହିତ ଆପଣଙ୍କର ଦର୍ଶକମାନଙ୍କୁ ନିୟୋଜିତ କରନ୍ତୁ।

କମ ଲାଟେନ୍ସି

ଦ୍ରୁତ ନମୂନାଗୁଡ଼ିକ2ସେକେଣ୍ଡରୁ କମ ସମୟ ମଧ୍ୟରେ ଧ୍ୱନି ଉତ୍ପାଦନ କରିଥାଏ। Kokoro ଏବଂ MeloTTS ଗୁଡିକ ରିୟଲ-ଟାଇମ ଷ୍ଟ୍ରୀମ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଅନୁକୂଳିତ।

ବହୁଭାଷା ବିଜ୍ଞପ୍ତିଗୁଡ଼ିକName

30+ ଭାଷାରେ ସଚେତନତା ସହିତ ଅନ୍ତର୍ଜାତୀୟ ଦର୍ଶକମାନଙ୍କୁ ସମର୍ଥନ କରନ୍ତୁ। କ୍ରସ-ଭାଷା ସ୍ୱର କ୍ଲୋନିଂ ପ୍ରତ୍ୟେକ ଭାଷାରେ ଆପଣଙ୍କର ବ୍ରାଣ୍ଡ ସ୍ୱରକୁ ବଜାୟ ରଖିଥାଏ।

ହାରାହାରି ସୀମା ଏବଂ ଛାଣକ

ସୁରକ୍ଷିତ ପ୍ରବାହ ଏକୀକରଣ ପାଇଁ ସ୍ଥାପନ କରାଯାଇଥିବା ହାର ସୀମା ଏବଂ ବିଷୟବସ୍ତୁ ଛାଣକ। ସ୍ୱୟଂଚାଳିତ ଭାବରେ ସ୍ପାମ ଏବଂ ଅଯୋଗ୍ୟ ବିଷୟବସ୍ତୁକୁ ବନ୍ଦ କରନ୍ତୁ।

ଷ୍ଟ୍ରିମିଂ ପାଇଁ ଶ୍ରେଷ୍ଠ AI ଧ୍ୱନି ନମୂନାଗୁଡ଼ିକName

ଦ୍ରୁତ, ପ୍ରାକୃତିକ-ସଙ୍ଗୀତ ମଡେଲଗୁଡ଼ିକ ସକ୍ରିୟ ବିଷୟବସ୍ତୁ ପାଇଁ ସମ୍ପୂର୍ଣ୍ଣ

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

ଏହା ପାଇଁ ଉତ୍ତମ: ପ୍ରବାହ ପାଇଁ ସର୍ବାଧିକ ଉତ୍ତମ - ଶୀଘ୍ର, ଉଚ୍ଚ ଗୁଣବତ୍ତା, ଏକାଧିକ ଧ୍ୱନି

ଚେଷ୍ଟାକରନ୍ତୁ Kokoro

MeloTTSMeloTTS

Free

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Fast 4/5

ଏହା ପାଇଁ ଉତ୍ତମ: ବଜେଟ ପ୍ରବାହ ସଂରଚନା ପାଇଁ ମୁକ୍ତ, ବହୁଭାଷୀ, CPU- ସହଜ

ଚେଷ୍ଟାକରନ୍ତୁ MeloTTS

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

ଏହା ପାଇଁ ଉତ୍ତମ: ବିଳମ୍ବ ବିନା ଉଚ୍ଚ-ବ୍ଯସ୍ତତା ଚାଟ TTS ପାଇଁ ମୁକ୍ତ, ଅତ୍ୟଧିକ-ଶୀଘ୍ର

ଚେଷ୍ଟାକରନ୍ତୁ Piper

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 ଧ୍ୱନି କ୍ଲୋନିଂName

ଏହା ପାଇଁ ଉତ୍ତମ: ସ୍ୱର କ୍ଲୋନିଂ ଏବଂ ଭାବନା ନିୟନ୍ତ୍ରଣ ସହିତ ପ୍ରୀମିୟମ ସଚେତନତାName

ଚେଷ୍ଟାକରନ୍ତୁ CosyVoice 2

Sesame CSMSesame CSM

Premium

Conversational speech model generating natural dialogue with appropriate timing and emotion.

Slow 5/5

ଏହା ପାଇଁ ଉତ୍ତମ: AI ସହ-ସଂଯୋଜକ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ପ୍ରାକୃତିକ କଥାବାର୍ତ୍ତା ଭାଷାName

ଚେଷ୍ଟାକରନ୍ତୁ Sesame CSM

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

ଏହା ପାଇଁ ଉତ୍ତମ: ମନୋରଞ୍ଜନ ପାଇଁ ମଜାଦାର ଧ୍ୱନି ପ୍ରଭାବ, ହସ ଏବଂ ଭାବପ୍ରବଣ ଅଭିବ୍ୟକ୍ତି

ଚେଷ୍ଟାକରନ୍ତୁ Bark

ଆପଣଙ୍କର ପ୍ରବାହ ପାଇଁ AI ଧ୍ୱନିକୁ କିପରି ବିନ୍ୟାସ କରିବେ

ପଞ୍ଜୀକରଣରୁ5ମିନିଟରେ ଜୀବନଯାପନ

1

ଗୋଟିଏ API କି ନିର୍ମାଣ କରନ୍ତୁ

ଲଗଇନ କରନ୍ତୁ ଏବଂ ଆପଣଙ୍କର ଖାତା ଡେସ୍କଟପରୁ ଗୋଟିଏ API କି ନିର୍ମାଣ କରନ୍ତୁ। ମୁକ୍ତ ସ୍ତରରେ 15 କ୍ରେଡିଟ ଅନ୍ତର୍ଭୁକ୍ତ ଅଛି।

2

ଆପଣଙ୍କର ପ୍ରବାହ ବଟକୁ ସଂଯୋଗ କରନ୍ତୁ

ଆପଣଙ୍କର ପ୍ରଚଳିତ ବଟ (tmi.js, Python) ସହିତ ଏକୀକୃତ କରନ୍ତୁ କିମ୍ବା ଶୀଘ୍ର ବିନ୍ୟାସ ପାଇଁ ଆମର କୋଡ ଉଦାହରଣଗୁଡ଼ିକୁ ବ୍ୟବହାର କରନ୍ତୁ।

3

ଧ୍ୱନି ଏବଂ ତ୍ରୁଟି ନିବାରକଗୁଡ଼ିକୁ ବିନ୍ୟାସ କରନ୍ତୁName

ଦାନ ସ୍ତର, ଚାଟ ନିର୍ଦ୍ଦେଶ, କିମ୍ବା ନିର୍ଦ୍ଦିଷ୍ଟ ପ୍ରଦର୍ଶକମାନଙ୍କୁ ଧ୍ୱନିଗୁଡ଼ିକୁ ନିର୍ଦ୍ଧାରଣ କରନ୍ତୁ। ହାର ସୀମା ଏବଂ ଛାଣକକୁ ସେଟ କରନ୍ତୁ।

4

ଜୀବନ୍ତ ଯାଆନ୍ତୁ

AI ଧ୍ୱନି ପୃଷ୍ଠଭୂମିରେ ଚାଲିଥାଏ। ଦାନ ସଚେତନତା ଏବଂ ଚାଟ ସନ୍ଦେଶଗୁଡ଼ିକ ସ୍ୱୟଂଚାଳିତ ଭାବରେ ଆପଣଙ୍କର ଧ୍ୱନି ପ୍ରବାହ ମାଧ୍ୟମରେ ଚାଲନ୍ତି।

ଷ୍ଟ୍ରିମରମାନେ AI ସ୍ୱରକୁ କିପରି ବ୍ୟବହାର କରୁଛନ୍ତି

TTS.ai ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ ପ୍ରକୃତ-ବିଶ୍ୱ ପ୍ରବାହ ସଂରଚନା

ଇଚ୍ଛାରୂପଣ ଯୋଗଦାନ ସଚେତନତା ଧ୍ୱନିଗୁଡ଼ିକName

ପ୍ରାକୃତିକ AI ଧ୍ୱନି ସହିତ ରେବୋଟିକ୍ ପୂର୍ବନିର୍ଦ୍ଧାରିତ TTS ଅନୁଦାନ ସଚେତନତାକୁ ବଦଳାନ୍ତୁ। ଭିନ୍ନ ଭିନ୍ନ ଅନୁଦାନ ସ୍ତରକୁ ଭିନ୍ନ ଭିନ୍ନ ଧ୍ୱନିକୁ ନିର୍ଦ୍ଧାରଣ କରନ୍ତୁ - ଛୋଟ ଟିପ୍ପଣୀ ପାଇଁ ଏକ ଖୁସି ଧ୍ୱନି, ବଡ଼ ଅନୁଦାନ ପାଇଁ ଏକ ଐତିହାସିକ ବର୍ଣ୍ଣନାକାରୀ, କିମ୍ବା 100+ ଧ୍ୱନିରୁ ଅନୁଦାନକାରୀମାନଙ୍କୁ ଚୟନ କରିବାକୁ ଦିଅନ୍ତୁ। StreamElements, Streamlabs ସହିତ ଏକୀକୃତ କରନ୍ତୁ, କିମ୍ବା ଆମ API ମାଧ୍ୟମରେ ଇଚ୍ଛାରୂପୀ ସଚେତନତା ନିର୍ମାଣ କରନ୍ତୁ।

  • 30+ ଭାଷାରେ 100+ ଧ୍ୱନିName
  • ପ୍ରତି ଦାନ ସ୍ତରରେ ଇଚ୍ଛାରୂପୀ ଧ୍ୱନି
  • StreamElements ଏବଂ Streamlabs ସହିତ ସୁସଂଗତName
  • କମ- ବିଳମ୍ବ ସୃଷ୍ଟିକର୍ତ୍ତା (୨ ସେକଣ୍ଡ ତଳେ)

ଚାଟ-ରୁ-ବାକ୍ସ ତନ୍ତ୍ରName

ଆପଣଙ୍କର ଚାଟ ସନ୍ଦେଶଗୁଡ଼ିକୁ ବଚନ ସ୍ୱର ସହିତ ଜୀବନଦାନ କରନ୍ତୁ। ଚାଟରେ ପ୍ରଦର୍ଶକମାନେ ଟାଇପ କରନ୍ତୁ, ଏବଂ ଗୋଟିଏ AI ସ୍ୱର ସେମାନଙ୍କର ସନ୍ଦେଶଗୁଡ଼ିକୁ ପ୍ରବାହରେ ଉଚ୍ଚ ସ୍ୱରରେ ପଢ଼ନ୍ତୁ। ଭିନ୍ନ ଭିନ୍ନ ପ୍ରଦର୍ଶକମାନଙ୍କ ପାଇଁ ଭିନ୍ନ ଭିନ୍ନ ସ୍ୱର ବ୍ୟବହାର କରନ୍ତୁ, ପ୍ରୀମିୟମ ସ୍ୱର ସହିତ ଉପଭୋକ୍ତା ସନ୍ଦେଶଗୁଡ଼ିକୁ ଉଲ୍ଲେଖ କରନ୍ତୁ, କିମ୍ବା ନିର୍ଦ୍ଦିଷ୍ଟ ଚାଟ ନିର୍ଦ୍ଦେଶଗୁଡ଼ିକ ପାଇଁ ଅକ୍ଷର ସ୍ୱର ନିର୍ମାଣ କରନ୍ତୁ।

  • ରିୟଲ-ଟାଇମ ଚାଟ-ରୁ-ବାକ୍ୟ ପାଇପଲାଇନ
  • ପ୍ରଦର୍ଶକ- ନିର୍ଦ୍ଦିଷ୍ଟ ଭାଷା ବଣ୍ଟନଗୁଡ଼ିକ
  • ଅଶୃଙ୍ଖଳିତ ଛାଣକ ଏବଂ ହାର ସୀମା
  • ପ୍ରୀମିୟମ ଧ୍ୱନି ସହିତ କେବଳ ଉପ-ଧ୍ୱନି ଅବସ୍ଥା

AI ସହ- ହୋଷ୍ଟ ଏବଂ ଚାଟ ବଟName

ଗୋଟିଏ AI ବ୍ୟକ୍ତିତ୍ୱ ନିର୍ମାଣ କରନ୍ତୁ ଯାହାକି ଆପଣଙ୍କର ପ୍ରବାହକୁ ସହ-ହୋଷ୍ଟ କରିଥାଏ। ଗୋଟିଏ ଚାଟ ବଟ ନିର୍ମାଣ କରିବା ପାଇଁ ଗୋଟିଏ ଭାଷା ମଡେଲ ସହିତ ଆମର TTS APIକୁ ସଂଯୋଗ କରନ୍ତୁ ଯାହାକି ଆପଣଙ୍କର ପ୍ରବାହକୁ ଶୁଣେ, ସରଳ ଟିପ୍ପଣୀ ସହିତ ଉତ୍ତର ଦେଇଥାଏ, ଖେଳ ଘଟଣାଗୁଡ଼ିକୁ ପ୍ରତିକ୍ରିୟା ଦେଇଥାଏ, ଏବଂ ଇଚ୍ଛାରୂପୀ AI ଧ୍ୱନି ବ୍ୟବହାର କରି ଆପଣଙ୍କର ଦର୍ଶକମାନଙ୍କ ସହିତ ସଂପର୍କ ସ୍ଥାପନ କରିଥାଏ। ପ୍ରାକୃତିକ ବାକ୍ୟବଚନ ପାଇଁ Sesame CSM କିମ୍ବା Dia TTS ବ୍ୟବହାର କରନ୍ତୁ।

  • ପ୍ରାକୃତିକ ସମୟ ସହିତ କଥାବାର୍ତ୍ତା AI
  • ଇଚ୍ଛାରୂପୀ AI ବ୍ୟକ୍ତିତ୍ୱ ଏବଂ ଧ୍ୱନି
  • ଖେଳ ଘଟଣା ପ୍ରତିକ୍ରିୟା ଏବଂ ଟିପ୍ପଣୀ
  • ଶ୍ରୋତାମାନଙ୍କ ସହ ଆଲୋଚନା ଏବଂ ପ୍ରଶ୍ନ ଓ ଉତ୍ତର

ବହୁଭାଷୀ ପ୍ରବାହ ବିଷୟବସ୍ତୁName

30+ ଭାଷାରେ ପ୍ରବାହ ସଚେତନତା ଏବଂ ବର୍ଣ୍ଣନା ସୃଷ୍ଟି କରି ଅନ୍ତର୍ଜାତୀୟ ଦର୍ଶକମାନଙ୍କୁ ପହଞ୍ଚାନ୍ତୁ। ସ୍ୱୟଂ-ବର୍ଣ୍ଣନା କରିବା ପାଇଁ ଭାଷା ଅନୁବାଦ ବ୍ୟବହାର କରନ୍ତୁ ଏବଂ ବିଶ୍ୱବ୍ୟାପୀ ଦର୍ଶକମାନଙ୍କ ପାଇଁ ଆପଣଙ୍କର ବିଷୟବସ୍ତୁକୁ ଭାଷାରେ କହିବା ପାଇଁ। କ୍ରସ-ଭାଷା ଭାଷା କ୍ଲୋନିଂ ଆପଣଙ୍କୁ କୌଣସି ଭାଷାରେ କଥାବାର୍ତ୍ତା କରୁଥିବା ସମୟରେ ଆପଣଙ୍କର ଭାଷା ପରିଚୟକୁ ବଜାୟ ରଖିବାକୁ ଅନୁମତି ଦେଇଥାଏ।

  • 30+ ଭାଷା ସମର୍ଥନ
  • ଭାଷା-ସଂରକ୍ଷିତ ଅନୁବାଦ
  • ପ୍ରଦର୍ଶକ କ୍ଷେତ୍ର ଅନୁଯାୟୀ ସ୍ଥାନୀୟ ସଚେତନତା
  • ବହୁଭାଷୀ AI ସହ-ଅତିଥି ଉତ୍ତରଗୁଡ଼ିକ

ସକ୍ରିୟ ପ୍ରବାହ ପାଇଁ କମ ଲାଟେନସି

ସକ୍ରିୟ ଷ୍ଟ୍ରିମିଂ ସମୟରେ ବେଗ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ। ଏଠାରେ ଆମର ମଡେଲଗୁଡ଼ିକର ତୁଳନା କରାଯାଇଛି।

ଆକାର ବେଗ ଗୁଣବତ୍ତା ଏଥିପାଇଁ ଉତ୍ତମ
Kokoro ସ୍ଥିର 5/5 ପ୍ରବାହ ପାଇଁ ସର୍ବାଧିକ ଉତ୍ତମ
MeloTTS ସ୍ଥିର 4/5 ମୁକ୍ତ, ବହୁଭାଷୀ ସଚେତନକName
Piper ସ୍ଥିର 3/5 ମୁକ୍ତ, ଉଚ୍ଚ-ସଂଖ୍ୟକ ଚାଟ TTS
CosyVoice 2 ମାଧ୍ୟମ 5/5 କ୍ଲୋନିଂ ସହିତ ପ୍ରୀମିୟମ୍ ସଚେତନତା
Bark ଧୀରେ ଧୀରେ 4/5 ମଜାଦାର ଧ୍ୱନି ପ୍ରଭାବ ଏବଂ ଅନୁଭୂତିName

ଦ୍ରୁତ API ସମନ୍ୱୟName

ମିନିଟଗୁଡ଼ିକରେ ଆପଣଙ୍କର ପ୍ରବାହ ବଟକୁ AI TTS ଯୋଗ କରନ୍ତୁ

JavaScript (Node.js ପ୍ରବାହ ବାଟ) REST API
// Twitch chat handler with AI TTS
const tmi = require('tmi.js');
const fetch = require('node-fetch');

client.on('message', async (channel, tags, message) => {
  if (tags['msg-id'] === 'highlighted-message') {
    const response = await fetch('https://api.tts.ai/v1/tts', {
      method: 'POST',
      headers: {
        'Authorization': 'Bearer YOUR_API_KEY',
        'Content-Type': 'application/json'
      },
      body: JSON.stringify({
        text: message,
        model: 'kokoro',
        voice: 'af_heart',
        format: 'mp3'
      })
    });
    // Play audio through OBS/stream audio
    playAudioOnStream(await response.buffer());
  }
});

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

ସକ୍ରିୟ ପ୍ରବାହ ପାଇଁ AI ସ୍ୱର ବିଷୟରେ ସାଧାରଣ ପ୍ରଶ୍ନଗୁଡ଼ିକ

Kokoro ସାମାନ୍ୟ ଅନୁଦାନ ସନ୍ଦେଶଗୁଡ଼ିକ ପାଇଁ 1 ସେକେଣ୍ଡ ତଳେ ଧ୍ୱନି ସୃଷ୍ଟି କରିଥାଏ। MeloTTS ଏବଂ Piper ଅଧିକ ଦ୍ରୁତ। ଘଟଣାରୁ ଧ୍ୱନି ଚାଳନାକୁ ସମୁଦାୟ ଲାଟେନସି ସାଧାରଣତଃ ମଡେଲ ଏବଂ ସନ୍ଦେଶ ଲମ୍ବ ଉପରେ ନିର୍ଭର କରି 1-3 ସେକେଣ୍ଡ ହୋଇଥାଏ।

ହଁ। ଆପଣ ଚାଟ ନିର୍ଦ୍ଦେଶଗୁଡ଼ିକ ସହିତ ପ୍ରଦର୍ଶକମାନଙ୍କୁ ଧ୍ୱନିଗୁଡ଼ିକୁ ଚୟନ କରିବାକୁ ଅନୁମତି ଦେବା ପାଇଁ ଆପଣଙ୍କର ପ୍ରବାହ ବଟକୁ ବିନ୍ୟାସ କରିପାରିବେ (ଉଦାହରଣ ସ୍ୱରୂପ, "!voice deep" କିମ୍ବା "!voice female")। ଆମର API ସମସ୍ତ ମଡେଲଗୁଡ଼ିକରେ 100+ ଧ୍ୱନିଗୁଡ଼ିକୁ ସମର୍ଥନ କରିଥାଏ, ତେଣୁ ପ୍ରଦର୍ଶକମାନଙ୍କ ପାଖରେ ଅନେକ ବିକଳ୍ପ ଅଛି।

ଆମର API ଯେକୌଣସି ସ୍ରୋତ ସଫ୍ଟୱେର ସହିତ କାମ କରେ ଯାହାକି ଇଚ୍ଛାରୂପୀ ସଚେତନତା କିମ୍ବା JavaScript ଓଭରଲେସକୁ ସମର୍ଥନ କରେ। ଆପଣ ଗୋଟିଏ ଇଚ୍ଛାରୂପୀ ବଟ ମାଧ୍ୟମରେ ଏକତ୍ରିତ କରିପାରିବେ ଯାହାକି ଆମର API କୁ ଡାକନ୍ତି ଏବଂ ଆପଣଙ୍କର ସ୍ରୋତ ଧ୍ୱନି ଉତ୍ସକୁ ଧ୍ୱନି ନିର୍ଗମ କରେ। ସିଧାସଳଖ ପ୍ଲଗଇନ ଏକତ୍ରିତକରଣଗୁଡ଼ିକ ବ୍ରାଉଜର ଉତ୍ସ ମାଧ୍ୟମରେ ମଧ୍ୟ ସମ୍ଭବ।

ମଧ୍ଯମ ଚାଟ ସକ୍ରିୟତା ସହିତ ଏକ4ଘଣ୍ଟା ପ୍ରବାହ (100-200 TTS ସନ୍ଦେଶ) ପାଖାପାଖି 50-100 କ୍ରେଡିଟ ବ୍ୟବହାର କରେ। ମୁକ୍ତ ମଡେଲ (Piper, MeloTTS) ଶୂନ୍ଯ କ୍ରେଡିଟ ବ୍ୟବହାର କରେ। ଆରମ୍ଭକର୍ତ୍ତା ଯୋଜନା ($9/ମାସ, 500 କ୍ରେଡିଟ) ଅଧିକାଂଶ ପ୍ରବାହକୁ ସୁବିଧାରେ ଆବରଣ କରିଥାଏ।

ହଁ। 5-30 ସେକଣ୍ଡ ଧ୍ୱନି ନମୁନାରୁ ଯେକୌଣସି ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ ଏବଂ ଏହାକୁ ଆପଣଙ୍କର ସମସ୍ତ ଷ୍ଟ୍ରିମ TTS ପାଇଁ ବ୍ୟବହାର କରନ୍ତୁ। ଚାଟରବକ୍ସ ଏବଂ GPT-SoVITS ଶ୍ରେଷ୍ଠ କ୍ଲୋନ ଗୁଣବତ୍ତା ପ୍ରଦାନ କରିଥାଏ। ଏହା ଏକ ହସ୍ତାକ୍ଷର ଷ୍ଟ୍ରିମ ଅକ୍ଷର ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ ବହୁତ ଭଲ।

API କୁ ପାଠ୍ୟ ପଠାଇବା ପୂର୍ବରୁ ଆପଣ ଆପଣଙ୍କର ସ୍ଟ୍ରୀମ ବଟରେ ବିଷୟବସ୍ତୁ ଛାଣକକୁ କାର୍ଯ୍ୟକାରୀ କରିବା ଉଚିତ। ସାଧାରଣ ପଦ୍ଧତିଗୁଡ଼ିକରେ ଶବ୍ଦ ବନ୍ଦ ତାଲିକା, regex ଛାଣକ, ଏବଂ ଉପଭୋକ୍ତା-ମାତ୍ର TTS ଅବସ୍ଥା ସାମିଲ ଅଛି। ଆମର API ହାର ସୀମା ମଧ୍ୟ ସ୍ପାମକୁ ବନ୍ଦ କରିବାରେ ସହାୟତା କରିଥାଏ।

ହଁ। ପ୍ରଦର୍ଶକ ଭୂମିକାଗୁଡ଼ିକୁ ଯାଞ୍ଚ କରିବା ପାଇଁ ଆପଣଙ୍କର ପ୍ରବାହ ବାଟକୁ ବିନ୍ୟାସ କରନ୍ତୁ (ସଦସ୍ୟ, VIP, ପରିଚାଳକ) ଏବଂ ଅନୁଯାୟୀ ଭିନ୍ନ ଭିନ୍ନ ନମୂନା କିମ୍ବା ଧ୍ୱନିଗୁଡ଼ିକୁ ଅନୁରୋଧଗୁଡ଼ିକୁ ପଠାନ୍ତୁ। ଉଦାହରଣ ସ୍ୱରୂପ, ମୁକ୍ତ ପ୍ରଦର୍ଶକମାନେ Piper ପାଇବେ ଯେତେବେଳେ ଉପଭୋକ୍ତାମାନେ Kokoro କିମ୍ବା Orpheus ପାଇବେ।

ଆପଣଙ୍କର ପ୍ରବାହ ବଟ API ମାଧ୍ୟମରେ ଧ୍ୱନି ସୃଷ୍ଟି କରିଥାଏ ଏବଂ ଏହାକୁ ଅସ୍ଥାୟୀ ଫାଇଲ ଭାବରେ ସଂରକ୍ଷଣ କରିଥାଏ କିମ୍ବା ଏହାକୁ ଗୋଟିଏ ଆଭାସୀ ଧ୍ୱନି ଉପକରଣକୁ ପ୍ରବାହ କରିଥାଏ। OBS ରେ, ସେହି ଧ୍ୱନି ଉତ୍ସକୁ ଗ୍ରହଣ କରନ୍ତୁ। ବୈକଳ୍ପିକ ଭାବରେ, JavaScript ସହିତ ଗୋଟିଏ ବ୍ରାଉଜର ଉତ୍ସକୁ ବ୍ୟବହାର କରନ୍ତୁ ଯାହାକି ଆପଣଙ୍କର ଦୃଶ୍ୟରେ ଧ୍ୱନିକୁ ସିଧାସଳଖ ଚାଲାଇଥାଏ।

ହଁ। ଆମର API ପ୍ଲାଟଫର୍ମ-ଅଭିଜ୍ଞ। ଯେକୌଣସି ଷ୍ଟ୍ରିମିଂ ପ୍ଲାଟଫର୍ମ ଯାହା ଇଚ୍ଛାରୂପୀ ବାଟ କିମ୍ବା ବ୍ରାଉଜର ଉତ୍ସ ଓଭରଲେସକୁ ଅନୁମତି ଦେଇଥାଏ ତାହା TTSକୁ ଏକୀକୃତ କରିପାରେ। ସମାନ ବାଟ କୋଡ Twitch, YouTube Live, Kick, ଏବଂ ଅନ୍ୟାନ୍ୟ ପ୍ଲାଟଫର୍ମରେ କ୍ଷୁଦ୍ର ଘଟଣା ପରିଚାଳନା ପରିବର୍ତ୍ତନ ସହିତ କାର୍ଯ୍ୟ କରିଥାଏ।

ହଁ। LLM ସହିତ ଆମର TTS APIକୁ ସଂଯୋଗ କରନ୍ତୁ (ଯେପରିକି ChatGPT କିମ୍ବା Claude) ଗୋଟିଏ AI ସହ-ହୋଷ୍ଟ ନିର୍ମାଣ କରିବା ପାଇଁ ଯାହାକି ବାର୍ତ୍ତାଳାପ ସନ୍ଦେଶଗୁଡ଼ିକୁ ବୁଦ୍ଧିମାନ ଭାବରେ ଉତ୍ତର ଦେଇଥାଏ। ପ୍ରାକୃତିକ ବାର୍ତ୍ତାଳାପ ଭାଷା ପାଇଁ Sesame CSM ବ୍ୟବହାର କରନ୍ତୁ କିମ୍ବା ଆପଣଙ୍କର AI ଅକ୍ଷର ପାଇଁ ଗୋଟିଏ ନିର୍ଦ୍ଦିଷ୍ଟ ଭାଷାକୁ କ୍ଲୋନ କରନ୍ତୁ।

ଆମେ ଆପଣଙ୍କର ବଟରେ ଗୋଟିଏ ଫାଲବ୍ୟାକ କାର୍ଯ୍ୟକାରୀ କରିବା ପାଇଁ ପରାମର୍ଶ ଦେଉଛୁ, ଯେପରିକି ଗୋଟିଏ ସ୍ଥାନୀୟ TTS ଯନ୍ତ୍ର କିମ୍ବା ଗୋଟିଏ ଧାଡ଼ି ଯାହା ବିଫଳ ଅନୁରୋଧଗୁଡ଼ିକୁ ପୁନଃପ୍ରୟାସ କରେ। ଆମର APIର ଉଚ୍ଚ ଉପସ୍ଥାନ ସମୟ ଅଛି, କିନ୍ତୁ ମିଶନ-କରିଟିକାଲ ପ୍ରବାହଗୁଡ଼ିକ ପାଇଁ, ଗୋଟିଏ ନକଲ ରଖିବା ନିଶ୍ଚିତ ଭାବରେ ଅବିଚ୍ଛିନ୍ନ ପ୍ରଦର୍ଶକ ଅନୁଭୂତିକୁ ସୁନିଶ୍ଚିତ କରିଥାଏ।

ଆପଣଙ୍କର ବଟ ଗୋଟିଏ ଧାଡ଼ି ତନ୍ତ୍ରକୁ କାର୍ଯ୍ୟକାରୀ କରିବା ଉଚିତ ଯାହାକି TTS ଅନୁରୋଧଗୁଡ଼ିକୁ ଅଲଗା ଅଲଗା ଧ୍ୱନିକୁ ବନ୍ଦ କରିବା ପାଇଁ କ୍ରମାଗତ ଭାବରେ ପ୍ରକ୍ରିୟା କରିଥାଏ। ଅଧିକାଂଶ ଷ୍ଟ୍ରୀମ ବଟମାନେ ଏହାକୁ ସ୍ଥାନୀୟ ଭାବରେ ପରିଚାଳନା କରିଥାନ୍ତି। ସନ୍ଦେଶଗୁଡ଼ିକ ମଧ୍ୟରେ ଏକ ଶୀତଳତା ଅବଧି (ଉଦାହରଣ ସ୍ୱରୂପ, 3-5 ସେକଣ୍ଡ) ନିର୍ଦ୍ଧାରଣ କରନ୍ତୁ ଯାହାକି ପ୍ରବାହକୁ ପରିଚାଳିତ କରିଥାଏ।
5.0/5 (1)

ଆମେ କଣ ସୁଧାରିପାରିବା? ଆପଣଙ୍କର ପ୍ରତିକ୍ରିୟା ଆମକୁ ସମସ୍ୟାର ସମାଧାନ କରିବାରେ ସହାୟକ ହୋଇଥାଏ ।

ଆପଣଙ୍କର ପ୍ରବାହକୁ ସ୍ତର ବୃଦ୍ଧି କରିବା ପାଇଁ ପ୍ରସ୍ତୁତ କି?

AI ସ୍ୱର ବ୍ୟବହାର କରି ହଜାର ହଜାର ଷ୍ଟ୍ରିମର ସହିତ ଯୋଗ ଦିଅନ୍ତୁ। ମୁକ୍ତ ସ୍ତର ଉପଲବ୍ଧ, କୌଣସି କ୍ରେଡିଟ କାର୍ଡ ଆବଶ୍ୟକ ନାହିଁ।