Dia 2

Default

ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଇଂରାଜୀName Neutral Dia 2

Default ଗୋଟିଏ neutral AI ଧ୍ୱନି ଯାହାକି Dia 2 ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ପୂର୍ବନିର୍ଦ୍ଧାରିତ ସ୍ତର ଧ୍ୱନି ଇଂରାଜୀName କୁ କହୁଛି ଏବଂ ଉଚ୍ଚ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ପାଖାପାଖି-ତତ୍କାଳ ଉତ୍ପାଦନ ଗତି ଏବଂ 4/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, Default real-time voice agents, dialogue generation, streaming applications ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। Dia 2 ଯନ୍ତ୍ରଟି Nari Labs under the Apache 2.0 license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। ମୁଖ୍ୟ କ୍ଷମତାଗୁଡ଼ିକ ମଧ୍ୟରେ ରହିଛି: {ବିଶେଷତାଗୁଡ଼ିକ}।

ବର୍ତ୍ତମାନ କୌଣସି ଆକଳନ ନାହିଁ

Dia 2ଆକାର ସୂଚନାName

ଆକାର Dia 2
ବିକାଶକାରୀ Nari Labs
ଗୁଣବତ୍ତା
ବେଗ ସ୍ଥିର
ଅନୁମତିପତ୍ର Apache 2.0
କ୍ଲୋନ କରୁଅଛି ଉପଲବ୍ଧ ନାହିଁ
ଅକ୍ଟୋବର ମାନକ (2 କ୍ରେଡିଟ/1K ଅକ୍ଷର)
ପ୍ରାଚଳଗୁଡ଼ିକ 2B
ବାସ୍ତୁଶାସ୍ତ୍ର Streaming Transformer
ବର୍ଷ 2025

ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା Default

ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ

ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ Default କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ଭିଡିଓ ଭାଷା

YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।

ପ୍ରୟୋଗଗୁଡ଼ିକ ଏବଂ ସୁଗମତାName

ଦ୍ରୁତ ଉତ୍ପାଦନ ଏହି ଧ୍ୱନିକୁ ରିୟଲ-ଟାଇମ ପ୍ରୟୋଗ, ପରଦା ପାଠକ, ଏବଂ ସୁଗମତା ସାଧନଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ।

ଇ-ଶିକ୍ଷା ଏବଂ ପ୍ରଶିକ୍ଷଣName

ସ୍ପଷ୍ଟ ଆଇ ନାରେଟିଂ ସହିତ ଆକର୍ଷଣୀୟ ପ୍ରଶିକ୍ଷଣ ସାମଗ୍ରୀ, ପାଠ୍ୟକ୍ରମ ଏବଂ ଶିକ୍ଷାଗତ ବିଷୟବସ୍ତୁ ସୃଷ୍ଟି କରନ୍ତୁ ।

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

Nari Labs ଦ୍ୱାରା Dia2 Dia ପାଇଁ ଗୋଟିଏ ପ୍ରବାହ-ପ୍ରଥମ ଅଗ୍ରଗତି, 1B ଏବଂ 2B ପରିମାପକ ବିକଳ୍ପରେ ଉପଲବ୍ଧ। ଏହା ପ୍ରଥମ କିଛି ଟୋକନରୁ ଧ୍ୱନି ସଂଶ୍ଳୋଧନ ଆରମ୍ଭ କରିଥାଏ, ଏହାକୁ ରିୟଲ-ଟାଇମ ସ୍ୱର ଏଜେଣ୍ଟ ଏବଂ ଭାଷା-ରୁ-ଭାଷା ପାଇପଲାଇନଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ। [S1]/[S2] ଟ୍ୟାଗ ଏବଂ (ହସିଲା), (କଫା) ପରି ପାରାଲିଙ୍ଗୁଇଷ୍ଟିକ ସଙ୍କେତ ସହିତ ବହୁ-ବକ୍ତା ସଂଳାପକୁ ସମର୍ଥନ କରିଥାଏ।

Dia2କୁ Nari Labs ଦ୍ୱାରା ବିକଶିତ କରାଯାଇଛି ଏବଂ ଏହା Apache 2.0 ଲାଇସେନ୍ସ ଅନ୍ତର୍ଗତ ପ୍ରକାଶିତ ହୋଇଛି, ଯାହାକି ଉତ୍ପାଦିତ ଧ୍ୱନିର ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ ।

Dia21 ଭାଷାକୁ ସମର୍ଥନ କରେ: ଇଂରାଜୀ ।

Dia2ଏହା ମାନକ ସ୍ତରରେ ଅଛି - ପ୍ରତି 1,000 ଅକ୍ଷରରେ2କୋଟିଟୋ। ଆପଣ ସମ୍ପୂର୍ଣ୍ଣ ଧ୍ୱନି ସୃଷ୍ଟି କରିବା ପୂର୍ବରୁ ଯେକୌଣସି Dia2ଧ୍ୱନିକୁ ମୁକ୍ତରେ ପ୍ରାକଦର୍ଶନ କରିପାରିବେ।

Dia2ର ବହୁତ ଦ୍ରୁତ ଉତ୍ପାଦନ ବେଗ ଅଛି। ଏହା ପାଖାପାଖି ରିୟଲ-ଟାଇମରେ ଚଲାଇଥାଏ, ଏହାକୁ ଷ୍ଟ୍ରିମିଂ ଏବଂ ଅନ୍ତରକ୍ରିୟା ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଉପଯୁକ୍ତ କରିଥାଏ।

Dia2କୁ TTS.ai ରେ ଧ୍ୱନି ଗୁଣବତ୍ତା ପାଇଁ 4/5 ରୂପେ ମାନ ଦିଆଯାଇଛି। ଏହା ଉଚ୍ଚ ଗୁଣବତ୍ତା, ପ୍ରାକୃତିକ-ଧ୍ୱନି ବାକ୍ୟ ଉତ୍ପାଦନ କରିଥାଏ।

ନା, Dia2ଅଭିଗମ୍ଯ ସ୍ୱରଗୁଡ଼ିକର ଗୋଟିଏ ସ୍ଥିର ସେଟକୁ ବ୍ୟବହାର କରେ। ସ୍ୱର କ୍ଲୋନିଂ ପାଇଁ, CosyVoice2, GPT-SoVITS, କିମ୍ବା Chatterbox ପରି ନମୂନାକୁ ଚେଷ୍ଟାକରନ୍ତୁ।

ହଁ, Dia2କୁ ବିଶେଷ ଭାବରେ ରିୟଲ-ଟାଇମ ସ୍ୱର ପ୍ରତିନିଧି, ବାର୍ତ୍ତାଳାପ ଉତ୍ପାଦନ, ଷ୍ଟ୍ରିମିଂ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ପରାମର୍ଶ ଦିଆଯାଏ । ଏହାର ଷ୍ଟ୍ରିମିଂ ଆଉଟପୁଟ, ବହୁ-ସ୍ପିକର, କମ୍ ଲାଟେନସି କ୍ଷମତା ଏହାକୁ ଏହି ବ୍ୟବହାର ମାମଲା ପାଇଁ ଏକ ଉତ୍ତମ ଚୟନ କରିଥାଏ ।

ହଁ, Dia2କୁ Apache 2.0 ଅନ୍ତର୍ଗତ ଲାଇସେନ୍ସ ଦିଆଯାଇଛି, ଯାହା ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ। Dia2ଧ୍ୱନି ସହିତ ନିର୍ଗତ ଧ୍ୱନିକୁ ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ପ୍ରୟୋଗ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରକଳ୍ପରେ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ହଁ, TTS.ai ରେ ସମସ୍ତ ଧ୍ୱନି ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (MIT, Apache 2.0) ବ୍ୟବହାର କରିଥାଏ। ନିର୍ଗତ ଧ୍ୱନିଟି ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରୟୋଗରେ ବ୍ୟବହାର ପାଇଁ ଆପଣଙ୍କର ଅଟେ।

/api/v1/tts/କୁ ଆକାର ନାମ ଏବଂ ଭାଷା ID ସହିତ ଗୋଟିଏ POST ଅନୁରୋଧ ପଠାନ୍ତୁ। Python, JavaScript, Go, ଏବଂ cURL ରେ କୋଡ ଉଦାହରଣ ପାଇଁ ଆମର API ଦଲିଲିକରଣ ପୃଷ୍ଠାକୁ ଦେଖନ୍ତୁ।

ହଁ, ଗୋଟିଏ ନମୁନା ଶୁଣିବା ପାଇଁ ଏହି ପୃଷ୍ଠାରେ ଚାଲାଇବା ବଟନକୁ କ୍ଲିକ କରନ୍ତୁ। ଆପଣ ପାଠ୍ୟରୁ ଭାଷଣ ପୃଷ୍ଠାରେ ଇଚ୍ଛାରୂପୀ ପାଠ୍ୟ ଟାଇପ କରିପାରିବେ ଏବଂ କୌଣସି ଭାଷା ସହିତ ମୁକ୍ତ ପ୍ରାକଦର୍ଶନ ସୃଷ୍ଟି କରିପାରିବେ।

ଚେଷ୍ଟାକରନ୍ତୁ Default ବର୍ତ୍ତମାନ

ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ Default. ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ.