Sesame CSM

Speaker 1

ପ୍ରୀମିୟମ ଇଂରାଜୀName Neutral Sesame CSM

Speaker 1 ଗୋଟିଏ neutral AI ଧ୍ୱନି ଯାହାକି Sesame CSM ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ପ୍ରୀମିୟମ-ସ୍ତର ଧ୍ୱନି ଇଂରାଜୀName କୁ କହୁଛି ଏବଂ ଷ୍ଟୁଡିଓ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ଧୀରେ ଧୀରେ କିନ୍ତୁ ଉଚ୍ଚ-ସତ୍ୟତା ଉତ୍ପାଦନ ଗତି ଏବଂ 5/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, Speaker 1 ai assistants, chatbots, conversational ai applications ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। Sesame CSM ଯନ୍ତ୍ରଟି Sesame under the Apache 2.0 license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। ମୁଖ୍ୟ କ୍ଷମତାଗୁଡ଼ିକ ମଧ୍ୟରେ ରହିଛି: {ବିଶେଷତାଗୁଡ଼ିକ}।

ବର୍ତ୍ତମାନ କୌଣସି ଆକଳନ ନାହିଁ

Sesame CSMଆକାର ସୂଚନାName

ଆକାର Sesame CSM
ବିକାଶକାରୀ Sesame
ଗୁଣବତ୍ତା
ବେଗ ଧୀରେ ଧୀରେ
ଅନୁମତିପତ୍ର Apache 2.0
କ୍ଲୋନ କରୁଅଛି ଉପଲବ୍ଧ ନାହିଁ
ଅକ୍ଟୋବର ପ୍ରୀମିୟମ (4 କ୍ରେଡିଟ/1K ଅକ୍ଷର)
ପ୍ରାଚଳଗୁଡ଼ିକ 1B
ବାସ୍ତୁଶାସ୍ତ୍ର Llama Backbone + Audio Codec
ବର୍ଷ 2025

ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା Speaker 1

ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ

ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ Speaker 1 କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ଭିଡିଓ ଭାଷା

YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।

ପଡକଡ଼ଗୁଡ଼ିକ ଏବଂ ପ୍ରସାରଣName

ପଡକଡ଼, ରେଡିଓ ଏବଂ ବ୍ଯବସାୟିକ ପ୍ରସାରଣ ପାଇଁ ଉପଯୁକ୍ତ ଷ୍ଟୁଡିଓ-ଗୁଣମାନର ନିର୍ଗମ।

ଖେଳ ଏବଂ ଅନ୍ତରକ୍ରିୟା ମିଡିଆName

ଖେଳର ଆଲୋଚନା, ଅନ୍ତରଙ୍ଗ କାହାଣୀ ଏବଂ ଆବିଷ୍କାରର ଅନୁଭୂତି ପାଇଁ ପ୍ରୀମିୟମ ଗୁଣବତ୍ତା ।

ଅଧିକ Sesame CSM ଧ୍ୱନିName

ସମାନ TTS ନମୂନାରୁ ଅନ୍ୟାନ୍ୟ ଧ୍ୱନିଗୁଡ଼ିକ

Speaker 0

ଇଂରାଜୀName Neutral

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

Sesame CSM (Conversational Speech Model) ହେଉଛି ଗୋଟିଏ 1 ବିଲିୟନ ମାପଚୁକ ମଡେଲ ଯାହାକି ବିଶେଷ ଭାବରେ ବାକ୍ୟବାକ୍ୟ ସୃଷ୍ଟି କରିବା ପାଇଁ ନିର୍ମିତ ହୋଇଛି। ଏହା ମାନବ ବାକ୍ୟବାକ୍ୟର ପ୍ରାକୃତିକ ଢାଞ୍ଚାକୁ ମଡେଲ କରେ ଯାହାକି ସମୟ-ଗ୍ରହଣ, ପଛ ଚ୍ୟାନେଲ ଉତ୍ତର, ଭାବପ୍ରବଣ ପ୍ରତିକ୍ରିୟା, ଏବଂ ବାକ୍ୟବାକ୍ୟ ପ୍ରବାହକୁ ଅନ୍ତର୍ଭୁକ୍ତ କରିଥାଏ। CSM ସଂଯୋଜିତ ବାକ୍ୟ ବଦଳରେ ପ୍ରାକୃତିକ ବାକ୍ୟବାକ୍ୟ ପରି ସ୍ୱର ସୃଷ୍ଟି କରେ।

ସେସମ CSM ସେସମ ଦ୍ୱାରା ବିକଶିତ ହୋଇଥିଲା ଏବଂ ଏହା ଆପାଚି 2.0 ଲାଇସେନ୍ସ ଅନ୍ତର୍ଗତ ମୁକ୍ତ କରାଯାଇଛି, ଯାହାକି ଉତ୍ପନ୍ନ ଧ୍ୱନିର ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ।

Sesame CSM 1 ଭାଷାକୁ ସମର୍ଥନ କରେ: ଇଂରାଜୀ ।

Sesame CSM ପ୍ରୀମିୟମ ସ୍ତରରେ ଅଛି - ପ୍ରତି 1,000 ଅକ୍ଷରରେ4କରେଡିଟ। ଆପଣ ସମ୍ପୂର୍ଣ୍ଣ ଧ୍ୱନି ସୃଷ୍ଟି କରିବା ପୂର୍ବରୁ ଯେକୌଣସି Sesame CSM ଧ୍ୱନିକୁ ମୁକ୍ତରେ ପ୍ରାକଦର୍ଶନ କରିପାରିବେ।

Sesame CSM ରେ ଧିରେ (ଗୁଣବତ୍ତାକୁ ପ୍ରାଥମିକତା ଦେଇ) ଉତ୍ପାଦନ ଗତି ଅଛି। ଏହା ପ୍ରତି ଉତ୍ପାଦନ ପାଇଁ ଅଧିକ ସମୟ ନେଉଛି କିନ୍ତୁ ଉଚ୍ଚ ସ୍ଥାୟୀତା ନିର୍ଗମ କରିଥାଏ।

TTS.ai ରେ ଧ୍ୱନି ଗୁଣବତ୍ତା ପାଇଁ Sesame CSM କୁ 5/5 ରୂପେ ମାନ ଦିଆଯାଇଛି। ଏହା ଷ୍ଟୁଡିଓ-ସ୍ତରୀୟ, ମାନବ-ସଦୃଶ ଭାଷା ପ୍ରଦାନ କରିଥାଏ।

ନା, Sesame CSM ସ୍ଥାପିତ ଧ୍ୱନିଗୁଡ଼ିକର ଗୋଟିଏ ସ୍ଥିର ସେଟକୁ ବ୍ୟବହାର କରେ। ଧ୍ୱନି କ୍ଲୋନିଂ ପାଇଁ, CosyVoice2, GPT-SoVITS, କିମ୍ବା Chatterbox ପରି ନମୂନାକୁ ଚେଷ୍ଟାକରନ୍ତୁ।

ହଁ, ସେସମ ସିଏସଏମକୁ ବିଶେଷ ଭାବେ ଆଇ ସହାୟକ, ଚାଟବଟ, କଥାବାର୍ତ୍ତା ଆଇ ପ୍ରୟୋଗ ପାଇଁ ପରାମର୍ଶ ଦିଆଯାଉଛି । ଏହାର କଥାବାର୍ତ୍ତା, ପ୍ରାକୃତିକ ସମୟ ନିର୍ଦ୍ଧାରଣ, ପର୍ଯ୍ୟାୟକ୍ରମେ କାର୍ଯ୍ୟ କରିବାର କ୍ଷମତା ଏହାକୁ ଏହି ଉପଯୋଗ ମାମଲା ପାଇଁ ଏକ ଉତ୍ତମ ଚୟନ କରିଥାଏ ।

ହଁ, Sesame CSM କୁ Apache 2.0 ଅନ୍ତର୍ଗତ ଲାଇସେନ୍ସ ଦିଆଯାଇଛି, ଯାହାକି ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ। Sesame CSM ଧ୍ୱନି ସହିତ ନିର୍ଗତ ଧ୍ୱନିକୁ ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରକଳ୍ପରେ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ହଁ, TTS.ai ରେ ସମସ୍ତ ଧ୍ୱନି ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (MIT, Apache 2.0) ବ୍ୟବହାର କରିଥାଏ। ନିର୍ଗତ ଧ୍ୱନିଟି ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରୟୋଗରେ ବ୍ୟବହାର ପାଇଁ ଆପଣଙ୍କର ଅଟେ।

/api/v1/tts/କୁ ଆକାର ନାମ ଏବଂ ଭାଷା ID ସହିତ ଗୋଟିଏ POST ଅନୁରୋଧ ପଠାନ୍ତୁ। Python, JavaScript, Go, ଏବଂ cURL ରେ କୋଡ ଉଦାହରଣ ପାଇଁ ଆମର API ଦଲିଲିକରଣ ପୃଷ୍ଠାକୁ ଦେଖନ୍ତୁ।

ହଁ, ଗୋଟିଏ ନମୁନା ଶୁଣିବା ପାଇଁ ଏହି ପୃଷ୍ଠାରେ ଚାଲାଇବା ବଟନକୁ କ୍ଲିକ କରନ୍ତୁ। ଆପଣ ପାଠ୍ୟରୁ ଭାଷଣ ପୃଷ୍ଠାରେ ଇଚ୍ଛାରୂପୀ ପାଠ୍ୟ ଟାଇପ କରିପାରିବେ ଏବଂ କୌଣସି ଭାଷା ସହିତ ମୁକ୍ତ ପ୍ରାକଦର୍ଶନ ସୃଷ୍ଟି କରିପାରିବେ।

ଚେଷ୍ଟାକରନ୍ତୁ Speaker 1 ବର୍ତ୍ତମାନ

ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ Speaker 1. ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ.