Spark TTS

Chinese Default

ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଚାଇନିଜName Neutral Spark TTS

Chinese Default ଗୋଟିଏ neutral AI ଧ୍ୱନି ଯାହାକି Spark TTS ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ପୂର୍ବନିର୍ଦ୍ଧାରିତ ସ୍ତର ଧ୍ୱନି ଚାଇନିଜName କୁ କହୁଛି ଏବଂ ଉଚ୍ଚ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ମଧ୍ଯମ ଉତ୍ପାଦନ ଗତି ଏବଂ 4/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, Chinese Default content creation with cloned voices and emotional control ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। Spark TTS ଯନ୍ତ୍ରଟି SparkAudio under the CC BY-NC-SA 4.0 license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। ମୁଖ୍ୟ କ୍ଷମତାଗୁଡ଼ିକ ମଧ୍ୟରେ ରହିଛି: {ବିଶେଷତାଗୁଡ଼ିକ}। Spark TTS ନମୁନାଟି ମଧ୍ୟ ସ୍ୱର କ୍ଲୋନିଂକୁ ସମର୍ଥନ କରେ - ଗୋଟିଏ ଇଚ୍ଛାରୂପୀ ସ୍ୱର ନିର୍ମାଣ କରିବା ପାଇଁ ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଯାହାକି ସମାନ ଗୁଣବତ୍ତା ଗୁଣଧର୍ମକୁ ଧାରଣ କରିଥାଏ।

ବର୍ତ୍ତମାନ କୌଣସି ଆକଳନ ନାହିଁ

Spark TTSଆକାର ସୂଚନାName

ଆକାର Spark TTS
ବିକାଶକାରୀ SparkAudio
ଗୁଣବତ୍ତା
ବେଗ ମଧ୍ଯମ
ଅନୁମତିପତ୍ର CC BY-NC-SA 4.0
କ୍ଲୋନ କରୁଅଛି ସମର୍ଥିତ
ଅକ୍ଟୋବର ମାନକ (2 କ୍ରେଡିଟ/1K ଅକ୍ଷର)
ପ୍ରାଚଳଗୁଡ଼ିକ 500M
ବାସ୍ତୁଶାସ୍ତ୍ର BiCodec + LLM + Flow Matching
ବର୍ଷ 2025

ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା Chinese Default

ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ

ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ Chinese Default କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ଭିଡିଓ ଭାଷା

YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।

ଇଚ୍ଛାରୂପଣ ବ୍ରାଣ୍ଡ ଧ୍ୱନି

ଗୋଟିଏ ଭିନ୍ନ ଭିନ୍ନ ବ୍ରାଣ୍ଡ TTS ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ ଏହି ଧ୍ୱନି ଶୈଳୀକୁ ଆପଣଙ୍କର ନିଜ ଧ୍ୱନି ସହିତ କ୍ଲୋନ କରନ୍ତୁ।

ଇ-ଶିକ୍ଷା ଏବଂ ପ୍ରଶିକ୍ଷଣName

ସ୍ପଷ୍ଟ ଆଇ ନାରେଟିଂ ସହିତ ଆକର୍ଷଣୀୟ ପ୍ରଶିକ୍ଷଣ ସାମଗ୍ରୀ, ପାଠ୍ୟକ୍ରମ ଏବଂ ଶିକ୍ଷାଗତ ବିଷୟବସ୍ତୁ ସୃଷ୍ଟି କରନ୍ତୁ ।

ଅଧିକ Spark TTS ଧ୍ୱନିName

ସମାନ TTS ନମୂନାରୁ ଅନ୍ୟାନ୍ୟ ଧ୍ୱନିଗୁଡ଼ିକ

Default

ଇଂରାଜୀName Neutral

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

SparkAudio ଦ୍ୱାରା Spark TTS ଗୋଟିଏ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ମଡେଲ ଯାହାକି ନିୟନ୍ତ୍ରଣଯୋଗ୍ୟ ଭାବନା ଏବଂ ବକ୍ତବ୍ୟ ଶୈଳୀ ସହିତ ସ୍ୱର କ୍ଲୋନିଂକୁ ସଂଯୋଜିତ କରିଥାଏ। କେବଳ5ସେକେଣ୍ଡର ସଂଯୋଗ ଧ୍ୱନି ବ୍ୟବହାର କରି, ଏହା ଗୋଟିଏ ସ୍ୱରକୁ କ୍ଲୋନ କରିପାରେ ଏବଂ ତା'ପରେ ଭିନ୍ନ ଭିନ୍ନ ଭାବନା, ବେଗ ଏବଂ ଶୈଳୀ ସହିତ ବକ୍ତବ୍ୟ ସୃଷ୍ଟି କରିଥାଏ, ଏବଂ କ୍ଲୋନ ସ୍ୱର ପରିଚୟକୁ ବଜାୟ ରଖିଥାଏ। Spark TTS ଗୋଟିଏ ପ୍ରୋମୋଟ-ଆଧାରିତ ନିୟନ୍ତ୍ରଣ ତନ୍ତ୍ରକୁ ବ୍ୟବହାର କରିଥାଏ।

ସ୍ପାର୍କ TTSକୁ ସ୍ପାର୍କଅଡିଓ ଦ୍ୱାରା ବିକଶିତ କରାଯାଇଛି ଏବଂ CC BY-NC-SA 4.0 ଲାଇସେନ୍ସ ଅନ୍ତର୍ଗତ ପ୍ରକାଶିତ କରାଯାଇଛି, ଯାହାକି ଉତ୍ପନ୍ନ ଧ୍ୱନିର ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ ।

Spark TTS2ଭାଷାକୁ ସମର୍ଥନ କରେ: ଇଂରାଜୀ, ଚାଇନିଜ।

Spark TTS ମାନକ ସ୍ତରରେ ଅଛି - ପ୍ରତି 1,000 ଅକ୍ଷରରେ2କୋଟି। ଆପଣ ସମ୍ପୂର୍ଣ୍ଣ ଧ୍ୱନି ସୃଷ୍ଟି କରିବା ପୂର୍ବରୁ ଯେକୌଣସି Spark TTS ଧ୍ୱନିକୁ ମୁକ୍ତରେ ପ୍ରାକଦର୍ଶନ କରିପାରିବେ।

Spark TTSର ମଧ୍ଯମ ଉତ୍ପାଦନ ବେଗ ଅଛି। ଉତ୍ପାଦନ ସାଧାରଣତଃ ପାଠ୍ୟ ଲମ୍ବ ଉପରେ ନିର୍ଭର କରି କିଛି ସେକେଣ୍ଡ ସମୟ ନେଥାଏ।

Spark TTS କୁ TTS.ai ରେ ଧ୍ୱନି ଗୁଣବତ୍ତା ପାଇଁ 4/5 ରୂପେ ମାନ ଦିଆଯାଇଛି। ଏହା ଉଚ୍ଚ ଗୁଣବତ୍ତା, ପ୍ରାକୃତିକ-ସଙ୍ଗୀତ ବାକ୍ୟ ଉତ୍ପାଦନ କରେ।

ହଁ, Spark TTS ଶୂନ୍ଯ-ଶଟ ଧ୍ୱନି କ୍ଲୋନକୁ ସମର୍ଥନ କରେ। ଗୋଟିଏ ଇଚ୍ଛାରୂପଣ ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ 5-30 ସେକଣ୍ଡର ସଂଯୋଗ ଧ୍ୱନିକୁ ଅଦ୍ୟତନ କରନ୍ତୁ।

ହଁ, Spark TTS କୁ କ୍ଲୋନ ଧ୍ୱନି ଏବଂ ଭାବନାଗତ ନିୟନ୍ତ୍ରଣ ସହିତ ବିଷୟବସ୍ତୁ ନିର୍ମାଣ ପାଇଁ ବିଶେଷ ଭାବରେ ପରାମର୍ଶ ଦିଆଯାଏ । ଏହାର ଧ୍ୱନି କ୍ଲୋନିଂ, ଭାବନାଗତ ନିୟନ୍ତ୍ରଣ, ଶୈଳୀ ନିୟନ୍ତ୍ରଣ କ୍ଷମତା ଏହାକୁ ଏହି ବ୍ୟବହାର ମାମଲା ପାଇଁ ଏକ ଉତ୍ତମ ଚୟନ କରିଥାଏ ।

ହଁ, ସ୍ପାର୍କ TTS CC BY-NC-SA 4.0 ଅନ୍ତର୍ଗତ ଲାଇସେନ୍ସିତ, ଯାହା ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ। ସ୍ପାର୍କ TTS ଧ୍ୱନି ସହିତ ଉତ୍ପନ୍ନ ଧ୍ୱନିକୁ ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରକଳ୍ପରେ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ହଁ, TTS.ai ରେ ସମସ୍ତ ଧ୍ୱନି ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (MIT, Apache 2.0) ବ୍ୟବହାର କରିଥାଏ। ନିର୍ଗତ ଧ୍ୱନିଟି ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରୟୋଗରେ ବ୍ୟବହାର ପାଇଁ ଆପଣଙ୍କର ଅଟେ।

/api/v1/tts/କୁ ଆକାର ନାମ ଏବଂ ଭାଷା ID ସହିତ ଗୋଟିଏ POST ଅନୁରୋଧ ପଠାନ୍ତୁ। Python, JavaScript, Go, ଏବଂ cURL ରେ କୋଡ ଉଦାହରଣ ପାଇଁ ଆମର API ଦଲିଲିକରଣ ପୃଷ୍ଠାକୁ ଦେଖନ୍ତୁ।

ହଁ, ଗୋଟିଏ ନମୁନା ଶୁଣିବା ପାଇଁ ଏହି ପୃଷ୍ଠାରେ ଚାଲାଇବା ବଟନକୁ କ୍ଲିକ କରନ୍ତୁ। ଆପଣ ପାଠ୍ୟରୁ ଭାଷଣ ପୃଷ୍ଠାରେ ଇଚ୍ଛାରୂପୀ ପାଠ୍ୟ ଟାଇପ କରିପାରିବେ ଏବଂ କୌଣସି ଭାଷା ସହିତ ମୁକ୍ତ ପ୍ରାକଦର୍ଶନ ସୃଷ୍ଟି କରିପାରିବେ।

ଚେଷ୍ଟାକରନ୍ତୁ Chinese Default ବର୍ତ୍ତମାନ

ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ Chinese Default. ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ.