Report Bug / Feature Request

AI ଭାଷା ପ୍ରତିନିଧି - ଆଲୋଚନା AI ସହାୟକ ନିର୍ମାଣ କରନ୍ତୁ

ଇଚ୍ଛାରୂପୀ ବ୍ୟକ୍ତିତ୍ୱ ସହିତ ବୁଦ୍ଧିମାନ ସ୍ୱର ପ୍ରତିନିଧି ନିର୍ମାଣ କରନ୍ତୁ। ଗ୍ରାହକ ସମର୍ଥନ, ଗ୍ରହଣ, ଶିକ୍ଷାଦାନ ଏବଂ ଅଧିକ ପାଇଁ ବିସ୍ତାର କରନ୍ତୁ।

ଆପଣଙ୍କ ଭାଷାରେ ଆମ ପାଖରେ ବର୍ତ୍ତମାନ TTS ଧ୍ୱନି ନାହିଁ । ଆମକୁ ଆପଣଙ୍କର ଯୋଗ କରିବାରେ ସହାୟତା କରନ୍ତୁ! ଆପଣଙ୍କର ସ୍ୱର ବିକ୍ରି କରନ୍ତୁ

ପ୍ରତିନିଧି ନିର୍ମାତା

ଏଜେଣ୍ଟର ଭୂମିକା, ବ୍ୟକ୍ତିତ୍ୱ, ଜ୍ଞାନ କ୍ଷେତ୍ର, ଏବଂ କଥାବାର୍ତ୍ତା ନିୟମକୁ ବର୍ଣ୍ଣନା କରନ୍ତୁ।

ବିନ୍ୟାସଗୁଡ଼ିକ

ଧ୍ୱନି ପ୍ରତିନିଧିମାନେ କିପରି କାର୍ଯ୍ୟ କରନ୍ତି

1. ଆପଣ କହୁଛନ୍ତି

ଆପଣଙ୍କର ପ୍ରତିନିଧି ସହିତ ସ୍ୱାଭାବିକ ଭାବରେ କଥାବାର୍ତ୍ତା କରନ୍ତୁ। ଆପଣଙ୍କର ଭାଷଣକୁ ଗ୍ରହଣ କରାଯାଏ ଏବଂ ପ୍ରକୃତ ସମୟରେ ପ୍ରବାହିତ କରାଯାଏ।

2. STT ଅନୁବାଦ

Whisper ଆପଣଙ୍କର ବକ୍ତବ୍ୟକୁ 99ଟି ଭାଷାରେ ସଠିକ ଭାବରେ ପାଠ୍ୟରେ ପରିବର୍ତ୍ତନ କରିଥାଏ।

3. ଏଲଏଲଏମ ପ୍ରକ୍ରିୟା

ଏଜେଣ୍ଟର LLM ମସ୍ତିଷ୍କ ଆପଣଙ୍କର ନିବେଶକୁ ଏହାର ବ୍ୟକ୍ତି ଏବଂ ତନ୍ତ୍ର ପ୍ରୋମୋଟ ବ୍ୟବହାର କରି ପ୍ରକ୍ରିୟା କରିଥାଏ।

4. TTS ଉତ୍ତର

ଆପଣଙ୍କର ବଚ୍ଛିତ ଧ୍ୱନି ଏବଂ ମଡେଲକୁ ବ୍ୟବହାର କରି ଉତ୍ତରଟି ପ୍ରାକୃତିକ ଭାଷାରେ ପରିବର୍ତ୍ତିତ ହୋଇଥାଏ।

ପ୍ରତିନିଧି ପ୍ରକାରଗୁଡ଼ିକ

ପ୍ରତ୍ୟେକ ଉଦ୍ୟୋଗ ଏବଂ ବ୍ୟବହାର ମାମଲା ପାଇଁ ପୂର୍ବ ନିର୍ମିତ ପ୍ରତିନିଧି ନମୂନାଗୁଡ଼ିକ

ଗ୍ରାହକ-ମୁଖ୍ୟ

ଶିକ୍ଷା ଏବଂ ପ୍ରଶିକ୍ଷଣ

ସୃଜନଶୀଳ ଏବଂ ମନୋରଞ୍ଜନName

ବ୍ୟବସାୟିକ ଏବଂ ଆଭ୍ୟନ୍ତରୀଣName

ବ୍ୟକ୍ତିଗତ

ଭଏସ ଏଜେଂଟ କାହିଁକି?

AI-ଶକ୍ତି ସମ୍ପନ୍ନ ଭାଷା ପ୍ରତିନିଧିମାନେ ଆପଣଙ୍କର ଆବଶ୍ୟକତା ସହିତ ମାପନ୍ତି

24/7 ଉପଲବ୍ଧତା

ଧ୍ୱନି ପ୍ରତିନିଧିମାନେ କେବେ ବି ଶୋଇନଥାନ୍ତି। କର୍ମଚାରୀ ଅଭାବ ବିନା ଘଣ୍ଟା ଘଣ୍ଟା ଧରି କଲ ଏବଂ ବାର୍ତ୍ତାଳାପକୁ ନିୟନ୍ତ୍ରଣ କରନ୍ତୁ।

ବହୁଭାଷୀName

ପ୍ରାକୃତିକ ସ୍ୱର ସହିତ 30+ ଭାଷାରେ ଗ୍ରାହକମାନଙ୍କୁ ସମର୍ଥନ କରନ୍ତୁ । ବହୁଭାଷୀ କର୍ମଚାରୀଙ୍କ ଆବଶ୍ୟକତା ନାହିଁ ।

ଇଚ୍ଛାରୂପଣ ବ୍ୟକ୍ତି

ଆପଣଙ୍କର ପ୍ରତିନିଧିର ବ୍ୟକ୍ତିତ୍ୱ, ଢଙ୍ଗ ଏବଂ ବିଶେଷଜ୍ଞତାକୁ ବର୍ଣ୍ଣନା କରନ୍ତୁ। ପ୍ରତ୍ୟେକ ପ୍ରତିନିଧି ଅଲଗା ଏବଂ ବ୍ରାଣ୍ଡରେ ଅନୁଭବ କରନ୍ତି।

କମ ଲାଟେନ୍ସି

ସମର୍ପିତ GPUs ଉପରେ ଅନୁକୂଳିତ STT, LLM, ଏବଂ TTS ପାଇପଲାଇନ ଦ୍ଵାରା ସବ-ସେକେଣ୍ଡ ଉତ୍ତର ସମୟକୁ ଶକ୍ତି ପ୍ରଦାନ କରାଯାଏ।

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

AI ସ୍ୱର ପ୍ରତିନିଧିମାନେ କଥାବାର୍ତ୍ତା AI ପ୍ରଣାଳୀ ଯାହା ବାକ୍ୟ ପରିଚୟ (STT), ଏକ ଭାଷା ମଡେଲ (LLM), ଏବଂ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ (TTS)କୁ ପ୍ରାକୃତିକ ସ୍ୱର କଥାବାର୍ତ୍ତା ରଖିବା ପାଇଁ ସଂଯୋଜିତ କରିଥାଏ । ସେମାନେ ପ୍ରଶ୍ନର ଉତ୍ତର ଦେଇପାରିବେ, ନିର୍ଦ୍ଦେଶଗୁଡ଼ିକୁ ଅନୁସରଣ କରିପାରିବେ ଏବଂ ସ୍ୱୟଂଚାଳିତ ଭାବରେ କାର୍ଯ୍ୟ ସମ୍ପୂର୍ଣ୍ଣ କରିପାରିବେ — ଗୋଟିଏ ଭାର୍ଚୁଆଲ ରିସିଭର କିମ୍ବା ସମର୍ଥନ ପ୍ରତିନିଧି ଭଳି ।

ଧ୍ୱନି ଚାଟ ଏକ ସାଧାରଣ-ଉଦ୍ଦେଶ୍ୟ 1:1 AI ସହିତ କଥାବାର୍ତ୍ତା। ପ୍ରତିନିଧିମାନେ ନିର୍ଦ୍ଦିଷ୍ଟ କାର୍ଯ୍ୟଗୁଡ଼ିକ ପାଇଁ ଉଦ୍ଦେଶ୍ୟ-ନିର୍ମାଣିତ - ସେମାନଙ୍କର ଗୋଟିଏ ନିର୍ଦ୍ଧାରିତ ବ୍ୟକ୍ତିତ୍ୱ, ଜ୍ଞାନ ଆଧାର, ଏବଂ କାର୍ଯ୍ୟ ପ୍ରବାହ ଅଛି। ଜଣେ ପ୍ରତିନିଧି ଜଣେ କଷ୍ଟମର ସେବା ବଟ ହୋଇପାରେ ଯାହାକି ଆପଣଙ୍କର FAQକୁ ଅନୁସରଣ କରିଥାଏ, ଯେତେବେଳେ ଧ୍ୱନି ଚାଟ ଖୋଲା-ଅନ୍ତର କଥାବାର୍ତ୍ତା।

ଗ୍ରାହକ ସେବା ବଟ, ଫୋନ ଆଇଭିଆର ବ୍ୟବସ୍ଥା, ଭର୍ଚୁଆଲ ରିସିଭର, ଟ୍ୟୁଟରିଂ ସହାୟକ, ବିକ୍ରୟ ଯୋଗ୍ୟତା ବଟ, ନିଯୁକ୍ତି ସମୟସୀମା, ଆଲୋଚନା ମାଧ୍ୟମରେ କାହାଣୀ କହିବା, ଚିକିତ୍ସା ସହଯୋଗୀ, ଭାଷା ପ୍ରୟାସ ସହଯୋଗୀ ଆଦି ।

କମ-ବିଳମ୍ବିତ ବାର୍ତ୍ତାଳାପକାରୀ ପ୍ରତିନିଧିମାନଙ୍କ ପାଇଁ, Kokoro ଆଦର୍ଶ - ଏହା ପ୍ରକୃତ ସମୟ ଅପେକ୍ଷା ପ୍ରାୟ 100x ଦ୍ରୁତ ଭାଷା ସୃଷ୍ଟି କରେ। ଅଧିକ ପ୍ରାକୃତିକ ବାର୍ତ୍ତାଳାପ ପାଇଁ, Dia TTS ବହୁ-ଭାଷକ ବାର୍ତ୍ତାଳାପକୁ ସମର୍ଥନ କରେ। ଭାଷା କ୍ଲୋନିଂ ପାଇଁ (ବ୍ରଣ୍ଡ ଭାଷା ସହିତ ମେଳ ଖାଉଛି), Chatterbox କିମ୍ବା GPT-SoVITS ବ୍ୟବହାର କରନ୍ତୁ।

ହଁ। STT ପାଇପଲାଇନ (Faster Whisper) ବୁଝାମଣା ପାଇଁ 99ଟି ଭାଷାକୁ ସମର୍ଥନ କରେ, ଏବଂ CosyVoice2ଅଥବା GPT-SoVITS ଭଳି TTS ନମୂନାଗୁଡ଼ିକ ଉତ୍ତର ଦେବା ପାଇଁ 8+ ଭାଷାକୁ ସମର୍ଥନ କରେ। ଆପଣ ବହୁଭାଷୀ ପ୍ରତିନିଧିମାନଙ୍କୁ ନିର୍ମାଣ କରିପାରିବେ ଯାହା କଲକାରୀଙ୍କ ଭାଷାରେ ଅନୁସନ୍ଧାନ ଏବଂ ଉତ୍ତର ଦେଇଥାଏ।

ଏଣ୍ଡ-ଟୁ-ଏଣ୍ଡ ଲାଟେନସି (ଭାଷା ଭିତରକୁ → ଭାଷା ବାହାରକୁ) ସାଧାରଣତଃ TTS ପାଇଁ Kokoro ଏବଂ STT ପାଇଁ Faster Whisper ବ୍ୟବହାର କରି 1-3 ସେକେଣ୍ଡ ହୋଇଥାଏ । ଏଥିରେ STT ଅନୁବାଦ (~200ms), LLM ଉତ୍ତର (~500ms-1s), ଏବଂ TTS ସଂଶ୍ଲେଷଣ (~200ms) ସାମିଲ ଅଛି ।

ହଁ। ପ୍ରତ୍ୟେକ ପ୍ରତିନିଧିର ଗୋଟିଏ ତନ୍ତ୍ର ପ୍ରୋମୋଟ ଅଛି ଯାହାକି ଏହାର ବ୍ୟକ୍ତିତ୍ୱ, ଜ୍ଞାନ, ଧ୍ୱନି, ଏବଂ ଆଚରଣ ନିୟମକୁ ବର୍ଣ୍ଣନା କରେ। ଆପଣ ଏହାକୁ ଆନୁଷ୍ଠାନିକ କିମ୍ବା ଅନୌପଚାରିକ କରିପାରିବେ, ପ୍ରସଙ୍ଗ ସୀମାକୁ ସେଟ କରିପାରିବେ, ଉନ୍ନତି ନିୟମକୁ ବର୍ଣ୍ଣନା କରିପାରିବେ, ଏବଂ ଅଜଣା ପ୍ରଶ୍ନଗୁଡ଼ିକୁ ନିୟନ୍ତ୍ରଣ କରିପାରିବେ।

ହଁ । ଭାଷା ପରିଚୟ ପାଇଁ ଆମର STT API, ବୁଦ୍ଧି ପାଇଁ କୌଣସି LLM API ଏବଂ ଭାଷା ନିର୍ଗମ ପାଇଁ ଆମର TTS API ବ୍ୟବହାର କରନ୍ତୁ । ଆମର OpenAI-ସଂଗଠିତ ଶେଷ ବିନ୍ଦୁଗୁଡ଼ିକ ଏକୀକରଣକୁ ସହଜ କରିଥାଏ । ପ୍ରୋ ଏବଂ ଏଣ୍ଟରପ୍ରାଇଜ ପ୍ଲାନଗୁଡ଼ିକରେ API ପ୍ରବେଶଯୋଗ୍ୟତା ଅନ୍ତର୍ଭୁକ୍ତ ।

ହଁ, ଫୋନ ଆଧାରିତ ଆଇଭିଆର ବ୍ୟବସ୍ଥା, ଆଉଟବାଉଣ୍ଡ କଲ ବୋଟ ଏବଂ 24/7 କଲ ପରିଚାଳନା ପାଇଁ ୱାର୍ଲ୍ଡ ୱାୟସ ଏଜେଣ୍ଟ ଆଇପିଆଇକୁ ଟ୍ୱିଲିଓ, ଭୋନାଜ କିମ୍ବା ପଲିଭୋ ଭଳି ଟେଲିକମ ପ୍ଲାଟଫର୍ମ ସହିତ ସଂଯୋଗ କରନ୍ତୁ ।

ଏଜେଣ୍ଟ ମୂଲ୍ୟ ବ୍ୟବହାର ହେଉଥିବା ମଡେଲ ଉପରେ ନିର୍ଭର କରେ। ମୁକ୍ତ-ସ୍ତର ମଡେଲ (Kokoro, Piper) TTS ପାଇଁ0ଅକ୍ଷର ମୂଲ୍ୟ କରେ। STT ପ୍ରତି ମିନିଟରେ 1,000 ଅକ୍ଷର। LLM ମୂଲ୍ୟ ଆପଣଙ୍କ ପ୍ରଦାତା ଉପରେ ନିର୍ଭର କରେ। ଆରମ୍ଭକାରୀ ଯୋଜନା ($9/ମାସ) 500,000 ଅକ୍ଷର ଅନ୍ତର୍ଭୁକ୍ତ କରେ, ଶତାଧିକ ଏଜେଣ୍ଟର ଆଦାନପ୍ରଦାନ ପାଇଁ ପ୍ରମାଣିତ।

ହଁ। ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାରୁ ଗୋଟିଏ ଇଚ୍ଛାରୂପୀ ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ ଆମର ଧ୍ୱନି କ୍ଲୋନିଂ ବିଶେଷତ୍ୱକୁ ବ୍ୟବହାର କରନ୍ତୁ (5 ସେକେଣ୍ଡରୁ କମ)। Chatterbox ଏବଂ GPT-SoVITS ଭଳି ନମୂନାଗୁଡ଼ିକ ଆପଣଙ୍କର ଧ୍ୱନି କିମ୍ବା କୌଣସି ବ୍ରାଣ୍ଡ ଧ୍ୱନିକୁ ଏକ ନିରନ୍ତର ପ୍ରତିନିଧି ଅନୁଭୂତି ପାଇଁ କ୍ଲୋନ କରିପାରିବେ।

ହଁ। ସମସ୍ତ ପ୍ରକ୍ରିୟାକରଣ ଆମର ସମର୍ପିତ GPU ସର୍ଭରଗୁଡ଼ିକରେ ହୋଇଥାଏ। ପ୍ରକ୍ରିୟାକରଣ ପରେ ଆମେ କଥାବାର୍ତ୍ତା ଟ୍ରାନସ୍କ୍ରିପ୍ଟ କିମ୍ବା ଧ୍ୱନିକୁ ସଂରକ୍ଷଣ କରୁନାହିଁ। କୌଣସି ତଥ୍ୟ ତୃତୀୟ ପକ୍ଷମାନଙ୍କ ସହିତ ବା ପ୍ରଶିକ୍ଷଣ ପାଇଁ ବ୍ୟବହୃତ ହୁଏ ନାହିଁ। କମ୍ପାନୀ ପ୍ଳାନଗୁଡ଼ିକ ଅତିରିକ୍ତ ତଥ୍ୟ ବିଚ୍ଛେଦ ବିକଳ୍ପଗୁଡ଼ିକୁ ପ୍ରଦାନ କରିଥାଏ।
5.0/5 (1)

ଆମେ କଣ ସୁଧାରିପାରିବା? ଆପଣଙ୍କର ପ୍ରତିକ୍ରିୟା ଆମକୁ ସମସ୍ୟାର ସମାଧାନ କରିବାରେ ସହାୟକ ହୋଇଥାଏ ।

ଆପଣଙ୍କର ପ୍ରଥମ ଭାଷା ପ୍ରତିନିଧିକୁ ନିର୍ମାଣ କରନ୍ତୁ

ମିନିଟଗୁଡ଼ିକରେ ବୌଦ୍ଧିକ ଭାଷା ପ୍ରତିନିଧିମାନଙ୍କୁ ନିର୍ମାଣ କରନ୍ତୁ। ମୁକ୍ତ ଭାବରେ ଯୋଗଦାନ କରନ୍ତୁ ଏବଂ ନିର୍ମାଣ ଆରମ୍ଭ କରିବା ପାଇଁ 50 କ୍ରେଡିଟ ପାଇବେ।