Pocket TTS

Cosette

ମୁକ୍ତ ଇଂରାଜୀName Female Pocket TTS

Cosette ଗୋଟିଏ ମହିଳା AI ଧ୍ୱନି ଯାହାକି Pocket TTS ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ମୁକ୍ତ-ସ୍ତର ଧ୍ୱନି ଇଂରାଜୀName କୁ କହୁଛି ଏବଂ ଉଚ୍ଚ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ପାଖାପାଖି-ତତ୍କାଳ ଉତ୍ପାଦନ ଗତି ଏବଂ 4/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, Cosette lightweight deployment, cpu-only environments, quick voice cloning ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। Pocket TTS ଯନ୍ତ୍ରଟି Kyutai under the MIT license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। ମୁଖ୍ୟ କ୍ଷମତାଗୁଡ଼ିକ ମଧ୍ୟରେ ରହିଛି: {ବିଶେଷତାଗୁଡ଼ିକ}। Pocket TTS ନମୁନାଟି ମଧ୍ୟ ସ୍ୱର କ୍ଲୋନିଂକୁ ସମର୍ଥନ କରେ - ଗୋଟିଏ ଇଚ୍ଛାରୂପୀ ସ୍ୱର ନିର୍ମାଣ କରିବା ପାଇଁ ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଯାହାକି ସମାନ ଗୁଣବତ୍ତା ଗୁଣଧର୍ମକୁ ଧାରଣ କରିଥାଏ।

ବର୍ତ୍ତମାନ କୌଣସି ଆକଳନ ନାହିଁ

Pocket TTSଆକାର ସୂଚନାName

ଆକାର Pocket TTS
ବିକାଶକାରୀ Kyutai
ଗୁଣବତ୍ତା
ବେଗ ସ୍ଥିର
ଅନୁମତିପତ୍ର MIT
କ୍ଲୋନ କରୁଅଛି ସମର୍ଥିତ
ଅକ୍ଟୋବର ମୁକ୍ତ (କୌଣସି ଅକ୍ଷର ବ୍ୟବହାର ହୋଇନାହିଁ)
ପ୍ରାଚଳଗୁଡ଼ିକ 100M
ବାସ୍ତୁଶାସ୍ତ୍ର Transformer + Mimi Codec
ତାଲିମ ତଥ୍ୟName 50000 ଘଣ୍ଟାunit-format
ବର୍ଷ 2025

ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା Cosette

ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ

ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ Cosette କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ଭିଡିଓ ଭାଷା

YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।

ପ୍ରୟୋଗଗୁଡ଼ିକ ଏବଂ ସୁଗମତାName

ଦ୍ରୁତ ଉତ୍ପାଦନ ଏହି ଧ୍ୱନିକୁ ରିୟଲ-ଟାଇମ ପ୍ରୟୋଗ, ପରଦା ପାଠକ, ଏବଂ ସୁଗମତା ସାଧନଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ।

ଇଚ୍ଛାରୂପଣ ବ୍ରାଣ୍ଡ ଧ୍ୱନି

ଗୋଟିଏ ଭିନ୍ନ ଭିନ୍ନ ବ୍ରାଣ୍ଡ TTS ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ ଏହି ଧ୍ୱନି ଶୈଳୀକୁ ଆପଣଙ୍କର ନିଜ ଧ୍ୱନି ସହିତ କ୍ଲୋନ କରନ୍ତୁ।

ଅଧିକ Pocket TTS ଧ୍ୱନିName

ସମାନ TTS ନମୂନାରୁ ଅନ୍ୟାନ୍ୟ ଧ୍ୱନିଗୁଡ଼ିକ

Alba

ଇଂରାଜୀName Female

Azelma

ଇଂରାଜୀName Female

Eponine

ଇଂରାଜୀName Female

Fantine

ଇଂରାଜୀName Female

Javert

ଇଂରାଜୀName Male

Jean

ଇଂରାଜୀName Male

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

Kyutai (Moshi ର ନିର୍ମାତା) ଦ୍ୱାରା ପକେଟ TTS ଏକ ସଂକଳ୍ପ 100M ପରିମାପ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ମଡେଲ ଯାହାକି ଏହାର ଓଜନଠାରୁ ଅଧିକ ଭଲ ଭାବରେ ସ୍ପର୍ଶ କରିଥାଏ। ଏହା CPU ଉପରେ ଦକ୍ଷତା ସହିତ ଚାଲୁଛି, ଗୋଟିଏ ସ୍ୱର ନମୁନାରୁ ଶୂନ୍ୟ-ଶଟ ସ୍ୱର କ୍ଲୋନକୁ ସମର୍ଥନ କରେ, ଏବଂ ପ୍ରାକୃତିକ-ସ୍ୱର ଭାଷା ଉତ୍ପାଦନ କରେ। ଛୋଟ ମଡେଲ ଆକାର ଏହାକୁ ଅଂଶ ବିସ୍ତାର ଏବଂ କମ୍-ସମ୍ପଦ ପରିବେଶଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ।

ପକେଟ TTS କୁ କୁଟାଇ ଦ୍ୱାରା ବିକଶିତ କରାଯାଇଛି ଏବଂ ଏହାକୁ MIT ଲାଇସେନ୍ସ ଅନ୍ତର୍ଗତ ମୁକ୍ତ କରାଯାଇଛି, ଯାହାକି ଉତ୍ପାଦିତ ଧ୍ୱନିର ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ ।

ପ୍ୟାକେଟ TTS2ଭାଷାକୁ ସମର୍ଥନ କରେ: ଇଂରାଜୀ, ଫ୍ରେଞ୍ଚ।

Pocket TTS ମୁକ୍ତ ସ୍ତରରେ ଅଛି - ମୁକ୍ତ - କୌଣସି କ୍ରେଡିଟ ଆବଶ୍ୟକ ନାହିଁ। ଆପଣ ସମ୍ପୂର୍ଣ୍ଣ ଧ୍ୱନି ସୃଷ୍ଟି କରିବା ପୂର୍ବରୁ ଯେକୌଣସି Pocket TTS ଧ୍ୱନିକୁ ମୁକ୍ତରେ ପ୍ରାକଦର୍ଶନ କରିପାରିବେ।

ପ୍ୟାକେଟ TTS ରେ ବହୁତ ଦ୍ରୁତ ଉତ୍ପାଦନ ବେଗ ଅଛି। ଏହା ପାଖାପାଖି ରିୟଲ-ଟାଇମରେ ଚାଲୁଛି, ଏହାକୁ ଷ୍ଟ୍ରିମିଂ ଏବଂ ଅନ୍ତରକ୍ରିୟା ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଉପଯୁକ୍ତ କରିଥାଏ।

ପକେଟ TTS କୁ TTS.ai ରେ ଧ୍ୱନି ଗୁଣବତ୍ତା ପାଇଁ 4/5 ରୂପେ ମାନ ଦିଆଯାଇଛି। ଏହା ଉଚ୍ଚ ଗୁଣବତ୍ତା, ପ୍ରାକୃତିକ-ସଙ୍ଗୀତ ବାକ୍ୟ ଉତ୍ପାଦନ କରେ।

ହଁ, Pocket TTS ଶୂନ୍ଯ-ଶଟ ଧ୍ୱନି କ୍ଲୋନକୁ ସମର୍ଥନ କରେ। ଗୋଟିଏ ଇଚ୍ଛାରୂପଣ ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ 5-30 ସେକଣ୍ଡର ସଂଯୋଗ ଧ୍ୱନିକୁ ଅଦ୍ୟତନ କରନ୍ତୁ।

ହଁ, ପକେଟ TTSକୁ ହାଲୁକା ବିସ୍ତରଣ, କେବଳ cpu ପରିବେଶ, ଦ୍ରୁତ ଭାଷା କ୍ଲୋନିଂ ପାଇଁ ବିଶେଷ ଭାବରେ ପରାମର୍ଶ ଦିଆଯାଏ। ଏହାର 100m ମାପଦଣ୍ଡ, cpu ଅନୁମାନ, ଭାଷା କ୍ଲୋନିଂ କ୍ଷମତା ଏହାକୁ ଏହି ବ୍ୟବହାର ମାମଲା ପାଇଁ ଏକ ଉତ୍ତମ ଚୟନ କରିଥାଏ।

ହଁ, Pocket TTS MIT ଅନ୍ତର୍ଗତ ଲାଇସେନ୍ସିତ, ଯାହା ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ। Pocket TTS ଧ୍ୱନି ସହିତ ଉତ୍ପନ୍ନ ଧ୍ୱନିକୁ ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରକଳ୍ପରେ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ହଁ, TTS.ai ରେ ସମସ୍ତ ଧ୍ୱନି ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (MIT, Apache 2.0) ବ୍ୟବହାର କରିଥାଏ। ନିର୍ଗତ ଧ୍ୱନିଟି ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରୟୋଗରେ ବ୍ୟବହାର ପାଇଁ ଆପଣଙ୍କର ଅଟେ।

/api/v1/tts/କୁ ଆକାର ନାମ ଏବଂ ଭାଷା ID ସହିତ ଗୋଟିଏ POST ଅନୁରୋଧ ପଠାନ୍ତୁ। Python, JavaScript, Go, ଏବଂ cURL ରେ କୋଡ ଉଦାହରଣ ପାଇଁ ଆମର API ଦଲିଲିକରଣ ପୃଷ୍ଠାକୁ ଦେଖନ୍ତୁ।

ହଁ, ଗୋଟିଏ ନମୁନା ଶୁଣିବା ପାଇଁ ଏହି ପୃଷ୍ଠାରେ ଚାଲାଇବା ବଟନକୁ କ୍ଲିକ କରନ୍ତୁ। ଆପଣ ପାଠ୍ୟରୁ ଭାଷଣ ପୃଷ୍ଠାରେ ଇଚ୍ଛାରୂପୀ ପାଠ୍ୟ ଟାଇପ କରିପାରିବେ ଏବଂ କୌଣସି ଭାଷା ସହିତ ମୁକ୍ତ ପ୍ରାକଦର୍ଶନ ସୃଷ୍ଟି କରିପାରିବେ।

ଚେଷ୍ଟାକରନ୍ତୁ Cosette ବର୍ତ୍ତମାନ

ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ Cosette. ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ କୌଣସି ଅକ୍ଷର ଆବଶ୍ୟକ ନାହିଁ.