ରିଅଲଟାଇମ TTS
ଉପ-ସେକଣ୍ଡ ପ୍ରଥମ-ଧ୍ୱନି ଲାଟେନସି ସହିତ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟକୁ ପ୍ରବାହ କରନ୍ତୁ। ଧ୍ୱନି ପ୍ରତିନିଧି ଏବଂ ସକ୍ରିୟ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ନିର୍ମିତ।
ଷ୍ଟ୍ରିମିଂ TTS କିପରି କାମ କରେ
1. ପାଠ୍ୟ ପଠାନ୍ତୁ
/v1/tts/stream/ କୁ POST ପାଠ୍ୟକୁ ସର୍ଭର-ପ୍ରେରିତ ଘଟଣା ଅନୁରୋଧ ଭାବରେ।
2. ନମୂନା ସୃଷ୍ଟିକରୁଅଛି
Kokoro ପାଠ୍ୟକୁ ଛୋଟ ଛୋଟ କରିଥାଏ ଏବଂ GPU ଉପରେ ଧ୍ୱନି ନମୁନା-ଦ୍ୱାରା-ନମୁନା ସୃଷ୍ଟି କରିଥାଏ।
3. ପ୍ରବାହ ଚୁକ୍ସ
Base64-ସଂକେତିତ WAV ଚୁକ୍ SSE ରେ ପହଞ୍ଚିଥାଏ ଏବଂ ତୁରନ୍ତ ଚାଲାଇବା ଆରମ୍ଭ କରିଥାଏ।
4. ଜୀବନ୍ତ ଶୁଣନ୍ତୁ
ଚାଳକ ଗୋଟିଏ ସେକେଣ୍ଡରୁ କମ ସମୟ ମଧ୍ୟରେ ବାକ୍ୟ ଆରମ୍ଭ ଶୁଣେ, ଏପରିକି ଲମ୍ବା ନିବେଶ ଉପରେ ମଧ୍ୟ।
ବ୍ୟବହାର ବିଧି
ଯେଉଁଠାରେ ଉପ-ସେକେଣ୍ଡ ଲାଟେନସି ନୂତନ ଅନୁଭୂତିକୁ ଖୋଲିଥାଏ ।
ଭାଷା ପ୍ରତିନିଧିName
କଥାବାର୍ତ୍ତା ବାଟଗୁଡ଼ିକ ଯେପରି ଜଣେ ମାନବ ଭଳି ଦ୍ରୁତ ଭାବରେ ଉତ୍ତର ଦେଇଥାଏ।
ଜୀବନ୍ତ ଦୂଷଣ
ବଫର ବିରତି ବିନା ପ୍ରକୃତ ସମୟରେ ଗୋଟିଏ ପ୍ରବାହକୁ ଅନୁବାଦ କରନ୍ତୁ ଏବଂ ଡବଲ କରନ୍ତୁ।
ଖେଳName
NPC ସଂଳାପ ଯାହାକି ଖେଳାଳିଙ୍କ ଚୟନକୁ ତୁରନ୍ତ ପ୍ରତିକ୍ରିୟା କରେ, କୌଣସି ପୂର୍ବ ନିର୍ଦ୍ଧାରିତ VO ନାହିଁ।
ସୁଗମତା
ପରଦା ପାଠକ ଏବଂ ସହାୟତା ସାଧନଗୁଡ଼ିକ ଯାହାକି ଚାଳକ କ୍ଲିକ କରିବା ସମୟରେ କହିବା ଆରମ୍ଭ କରିଥାଏ।
ରିଅଲଟାଇମ TTS ଯୋଜନାଗୁଡ଼ିକ
ମୁକ୍ତ ଭାବରେ ଆରମ୍ଭ କରନ୍ତୁ, ଅଧିକ ଆବଶ୍ୟକ ହେଲେ ଅଗ୍ରଗତି କରନ୍ତୁ
- Kokoro ପ୍ରବାହ (ମୁକ୍ତ ଆକାର)
- ପ୍ରତି ଉତ୍ପତ୍ତିରେ 500 ଅକ୍ଷର
- ପ୍ରତି ଅଜ୍ଞାତ ଚାଳକ ପ୍ରତି 10 ମୁକ୍ତ ପ୍ରବାହ/ଦିନ
- ଉପ-ସେକଣ୍ଡ ପ୍ରଥମ-ଧ୍ୱନି ଲାଟେନସି
- HTTPS ଉପରେ SSE ପ୍ରବାହ
- ରେଜିଷ୍ଟ୍ରେସନ ସମୟରେ 15,000 ଅକ୍ଷର
- ପ୍ରତି ପ୍ରବାହରେ 5,000 ଅକ୍ଷର
- ପ୍ରଗ୍ରାମାଗତ ସୁଗମତା ପାଇଁ API କି
- ଉତ୍ପନ୍ନ ଇତିହାସ
- ଦିନିକିଆ ପ୍ରବାହ ସୀମା ନାହିଁ
- MOSS-TTS-ସତ୍ୟକାଳୀନ (ସଂପୂର୍ଣ୍ଣ ସମୟରେ)
- ପ୍ରତି ପ୍ରବାହରେ 100,000 ଅକ୍ଷର
- ଅଗ୍ରତା GPU ଧାଡ଼ି
- ଭାଷା ପ୍ରତିନିଧି + Twilio ଏକୀକରଣ
- ଉଚ୍ଚ ହାର ସୀମା
ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName
ଆମେ କଣ ସୁଧାରିପାରିବା? ଆପଣଙ୍କର ପ୍ରତିକ୍ରିୟା ଆମକୁ ସମସ୍ୟାର ସମାଧାନ କରିବାରେ ସହାୟକ ହୋଇଥାଏ ।
ରିୟଲ-ଟାଇମରେ ଭାଷଣକୁ ପ୍ରବାହିତ କରନ୍ତୁName
ଦିନକୁ ପ୍ରଥମ 10ଟି ପିଢ଼ି ପାଇଁ ମୁକ୍ତ। ସମ୍ପୂର୍ଣ୍ଣ ଅକ୍ଷର ଅନୁମତି ଏବଂ API ସୁବିଧାକୁ ଖୋଲିବା ପାଇଁ ସଦସ୍ୟତା ନିଅନ୍ତୁ।