MOSS-TTSD

Default Speaker

ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଇଂରାଜୀName Neutral MOSS-TTSD

Default Speaker ଗୋଟିଏ neutral AI ଧ୍ୱନି ଯାହାକି MOSS-TTSD ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ପୂର୍ବନିର୍ଦ୍ଧାରିତ ସ୍ତର ଧ୍ୱନି ଇଂରାଜୀName କୁ କହୁଛି ଏବଂ ଷ୍ଟୁଡିଓ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ମଧ୍ଯମ ଉତ୍ପାଦନ ଗତି ଏବଂ 5/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, Default Speaker podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। MOSS-TTSD ଯନ୍ତ୍ରଟି OpenMOSS under the Apache 2.0 license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। ମୁଖ୍ୟ କ୍ଷମତାଗୁଡ଼ିକ ମଧ୍ୟରେ ରହିଛି: {ବିଶେଷତାଗୁଡ଼ିକ}। MOSS-TTSD ନମୁନାଟି ମଧ୍ୟ ସ୍ୱର କ୍ଲୋନିଂକୁ ସମର୍ଥନ କରେ - ଗୋଟିଏ ଇଚ୍ଛାରୂପୀ ସ୍ୱର ନିର୍ମାଣ କରିବା ପାଇଁ ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଯାହାକି ସମାନ ଗୁଣବତ୍ତା ଗୁଣଧର୍ମକୁ ଧାରଣ କରିଥାଏ।

ବର୍ତ୍ତମାନ କୌଣସି ଆକଳନ ନାହିଁ

MOSS-TTSDଆକାର ସୂଚନାName

ଆକାର MOSS-TTSD
ବିକାଶକାରୀ OpenMOSS
ଗୁଣବତ୍ତା
ବେଗ ମଧ୍ଯମ
ଅନୁମତିପତ୍ର Apache 2.0
କ୍ଲୋନ କରୁଅଛି ସମର୍ଥିତ
ଅକ୍ଟୋବର ମାନକ (2 କ୍ରେଡିଟ/1K ଅକ୍ଷର)
ପ୍ରାଚଳଗୁଡ଼ିକ 7B
ବାସ୍ତୁଶାସ୍ତ୍ର MOSS-TTS-Delay + dialogue continuation head
ବର୍ଷ 2026

ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା Default Speaker

ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ

ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ Default Speaker କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ଭିଡିଓ ଭାଷା

YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।

ପଡକଡ଼ଗୁଡ଼ିକ ଏବଂ ପ୍ରସାରଣName

ପଡକଡ଼, ରେଡିଓ ଏବଂ ବ୍ଯବସାୟିକ ପ୍ରସାରଣ ପାଇଁ ଉପଯୁକ୍ତ ଷ୍ଟୁଡିଓ-ଗୁଣମାନର ନିର୍ଗମ।

ଇଚ୍ଛାରୂପଣ ବ୍ରାଣ୍ଡ ଧ୍ୱନି

ଗୋଟିଏ ଭିନ୍ନ ଭିନ୍ନ ବ୍ରାଣ୍ଡ TTS ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ ଏହି ଧ୍ୱନି ଶୈଳୀକୁ ଆପଣଙ୍କର ନିଜ ଧ୍ୱନି ସହିତ କ୍ଲୋନ କରନ୍ତୁ।

ଅଧିକ MOSS-TTSD ଧ୍ୱନିName

ସମାନ TTS ନମୂନାରୁ ଅନ୍ୟାନ୍ୟ ଧ୍ୱନିଗୁଡ଼ିକ

Default (Chinese)

ଚାଇନିଜName Neutral

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

MOSS-TTSD v1.0 from OpenMOSS is a 7B dialogue text-to-speech model that continues conversations from a short audio prompt. Supports up to 5 simultaneous speakers via [S1]/[S2] tags, zero-shot voice cloning from 3-10s reference audio, and up to 60 minutes of coherent multi-turn dialogue across 20 languages. Distinct from MOSS-TTS — TTSD is specialized for podcast/audiobook/dubbing workflows.

MOSS-TTSD was developed by OpenMOSS and is released under the Apache 2.0 license, which permits commercial use of generated audio.

MOSS-TTSD supports 20 languages: English, Chinese, German, Spanish, French, Japanese, Italian, Korean and more.

MOSS-TTSD is in the Standard tier — 2 credits per 1,000 characters. You can preview any MOSS-TTSD voice for free before generating full audio.

MOSS-TTSD has moderate generation speed. Generation typically takes a few seconds depending on text length.

MOSS-TTSD is rated 5/5 for audio quality on TTS.ai. It delivers studio-grade, human-like speech.

Yes, MOSS-TTSD supports zero-shot voice cloning. Upload 5-30 seconds of reference audio to create a custom voice.

Yes, MOSS-TTSD is specifically recommended for podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices. Its multi-speaker dialogue, up to 5 speakers, 60min coherent audio capabilities make it an excellent choice for this use case.

Yes, MOSS-TTSD is licensed under Apache 2.0, which allows commercial use. Audio generated with MOSS-TTSD voices can be used in videos, podcasts, apps, games, and any other commercial project.

ହଁ, TTS.ai ରେ ସମସ୍ତ ଧ୍ୱନି ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (MIT, Apache 2.0) ବ୍ୟବହାର କରିଥାଏ। ନିର୍ଗତ ଧ୍ୱନିଟି ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରୟୋଗରେ ବ୍ୟବହାର ପାଇଁ ଆପଣଙ୍କର ଅଟେ।

/api/v1/tts/କୁ ଆକାର ନାମ ଏବଂ ଭାଷା ID ସହିତ ଗୋଟିଏ POST ଅନୁରୋଧ ପଠାନ୍ତୁ। Python, JavaScript, Go, ଏବଂ cURL ରେ କୋଡ ଉଦାହରଣ ପାଇଁ ଆମର API ଦଲିଲିକରଣ ପୃଷ୍ଠାକୁ ଦେଖନ୍ତୁ।

ହଁ, ଗୋଟିଏ ନମୁନା ଶୁଣିବା ପାଇଁ ଏହି ପୃଷ୍ଠାରେ ଚାଲାଇବା ବଟନକୁ କ୍ଲିକ କରନ୍ତୁ। ଆପଣ ପାଠ୍ୟରୁ ଭାଷଣ ପୃଷ୍ଠାରେ ଇଚ୍ଛାରୂପୀ ପାଠ୍ୟ ଟାଇପ କରିପାରିବେ ଏବଂ କୌଣସି ଭାଷା ସହିତ ମୁକ୍ତ ପ୍ରାକଦର୍ଶନ ସୃଷ୍ଟି କରିପାରିବେ।

ଚେଷ୍ଟାକରନ୍ତୁ Default Speaker ବର୍ତ୍ତମାନ

ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ Default Speaker. ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ.