IndexTTS-2

Default

ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଇଂରାଜୀName Neutral IndexTTS-2

Default ଗୋଟିଏ neutral AI ଧ୍ୱନି ଯାହାକି IndexTTS-2 ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ପୂର୍ବନିର୍ଦ୍ଧାରିତ ସ୍ତର ଧ୍ୱନି ଇଂରାଜୀName କୁ କହୁଛି ଏବଂ ଉଚ୍ଚ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ମଧ୍ଯମ ଉତ୍ପାଦନ ଗତି ଏବଂ 4/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, Default emotionally expressive content, audiobooks, virtual assistants ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। IndexTTS-2 ଯନ୍ତ୍ରଟି Index Team under the Bilibili Model License license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। ମୁଖ୍ୟ କ୍ଷମତାଗୁଡ଼ିକ ମଧ୍ୟରେ ରହିଛି: {ବିଶେଷତାଗୁଡ଼ିକ}। IndexTTS-2 ନମୁନାଟି ମଧ୍ୟ ସ୍ୱର କ୍ଲୋନିଂକୁ ସମର୍ଥନ କରେ - ଗୋଟିଏ ଇଚ୍ଛାରୂପୀ ସ୍ୱର ନିର୍ମାଣ କରିବା ପାଇଁ ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାକୁ ଅଦ୍ୟତନ କରନ୍ତୁ ଯାହାକି ସମାନ ଗୁଣବତ୍ତା ଗୁଣଧର୍ମକୁ ଧାରଣ କରିଥାଏ।

ବର୍ତ୍ତମାନ କୌଣସି ଆକଳନ ନାହିଁ

IndexTTS-2ଆକାର ସୂଚନାName

ଆକାର IndexTTS-2
ବିକାଶକାରୀ Index Team
ଗୁଣବତ୍ତା
ବେଗ ମଧ୍ଯମ
ଅନୁମତିପତ୍ର Bilibili Model License
କ୍ଲୋନ କରୁଅଛି ସମର୍ଥିତ
ଅକ୍ଟୋବର ମାନକ (2 କ୍ରେଡିଟ/1K ଅକ୍ଷର)
ପ୍ରାଚଳଗୁଡ଼ିକ 300M
ବାସ୍ତୁଶାସ୍ତ୍ର Qwen2 + BigVGAN
ବର୍ଷ 2025

ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା Default

ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ

ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ Default କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ଭିଡିଓ ଭାଷା

YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।

ଇଚ୍ଛାରୂପଣ ବ୍ରାଣ୍ଡ ଧ୍ୱନି

ଗୋଟିଏ ଭିନ୍ନ ଭିନ୍ନ ବ୍ରାଣ୍ଡ TTS ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ ଏହି ଧ୍ୱନି ଶୈଳୀକୁ ଆପଣଙ୍କର ନିଜ ଧ୍ୱନି ସହିତ କ୍ଲୋନ କରନ୍ତୁ।

ଇ-ଶିକ୍ଷା ଏବଂ ପ୍ରଶିକ୍ଷଣName

ସ୍ପଷ୍ଟ ଆଇ ନାରେଟିଂ ସହିତ ଆକର୍ଷଣୀୟ ପ୍ରଶିକ୍ଷଣ ସାମଗ୍ରୀ, ପାଠ୍ୟକ୍ରମ ଏବଂ ଶିକ୍ଷାଗତ ବିଷୟବସ୍ତୁ ସୃଷ୍ଟି କରନ୍ତୁ ।

ଅଧିକ IndexTTS-2 ଧ୍ୱନିName

ସମାନ TTS ନମୂନାରୁ ଅନ୍ୟାନ୍ୟ ଧ୍ୱନିଗୁଡ଼ିକ

Chinese Default

ଚାଇନିଜName Neutral

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

IndexTTS-2 ଏକ ଉନ୍ନତ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ତନ୍ତ୍ର ଯାହାକି ଶୂନ୍ୟ-ଶଟ ସ୍ୱର ସଂଶ୍ଲେଷଣରେ ଉତ୍ତମ ଅଟେ ଏବଂ ସରଳ-ଗୋଲାକାର ଭାବନା ନିୟନ୍ତ୍ରଣ ସହିତ। ଏହା ଭାବନା-ନିର୍ଦ୍ଦିଷ୍ଟ ତାଲିମ ତଥ୍ୟର ଆବଶ୍ୟକତା ନକରି ବିଶେଷ ଭାବନାଗତ ଧ୍ୱନି ସହିତ ବାକ୍ୟ ସୃଷ୍ଟି କରିପାରେ ଯେପରିକି ଖୁସି, ଦୁଃଖ, କ୍ରୋଧିତ, କିମ୍ବା ଭୟଭୀତ। ମଡେଲଟି ଉତ୍ପନ୍ନ ବାକ୍ୟର ଭାବନାଗତ ଅଭିବ୍ୟକ୍ତିକୁ ସଠିକ ଭାବରେ ନିୟନ୍ତ୍ରଣ କରିବା ପାଇଁ ଭାବନାଗତ ଭେକଟରଗୁଡ଼ିକୁ ବ୍ୟବହାର କରିଥାଏ।

IndexTTS-2କୁ Index ଟିମ ଦ୍ୱାରା ବିକଶିତ କରାଯାଇଛି ଏବଂ Bilibili ମଡେଲ ଲାଇସେନ୍ସ ଲାଇସେନ୍ସ ଅଧୀନରେ ଏହାକୁ ମୁକ୍ତ କରାଯାଇଛି, ଯାହାକି ଉତ୍ପାଦିତ ଧ୍ୱନିର ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ ।

IndexTTS-22ଟି ଭାଷାକୁ ସମର୍ଥନ କରେ: ଇଂରାଜୀ, ଚାଇନିଜ ।

IndexTTS-2 ମାନକ ସ୍ତରରେ ଅଛି - ପ୍ରତି 1,000 ଅକ୍ଷରରେ2କୋଟି। ଆପଣ ସମ୍ପୂର୍ଣ୍ଣ ଧ୍ୱନି ସୃଷ୍ଟି କରିବା ପୂର୍ବରୁ ଯେକୌଣସି IndexTTS-2 ଧ୍ୱନିକୁ ମୁକ୍ତରେ ପ୍ରାକଦର୍ଶନ କରିପାରିବେ।

IndexTTS-2ର ମଧ୍ଯମ ଉତ୍ପାଦନ ବେଗ ଅଛି। ଉତ୍ପାଦନ ସାଧାରଣତଃ ପାଠ୍ୟ ଲମ୍ବ ଉପରେ ନିର୍ଭର କରି କିଛି ସେକେଣ୍ଡ ସମୟ ନେଥାଏ।

IndexTTS-2 କୁ TTS.ai ରେ ଧ୍ୱନି ଗୁଣବତ୍ତା ପାଇଁ 4/5 ରୂପେ ମାନ ଦିଆଯାଇଛି। ଏହା ଉଚ୍ଚ ଗୁଣବତ୍ତା, ପ୍ରାକୃତିକ-ସଙ୍ଗୀତ ବାକ୍ୟ ଉତ୍ପାଦନ କରେ।

ହଁ, IndexTTS-2 ଶୂନ୍ୟ-ଶଟ ଧ୍ୱନି କ୍ଲୋନକୁ ସମର୍ଥନ କରେ। ଗୋଟିଏ ଇଚ୍ଛାରୂପଣ ଧ୍ୱନି ନିର୍ମାଣ କରିବା ପାଇଁ 5-30 ସେକଣ୍ଡର ସଂଯୋଗ ଧ୍ୱନିକୁ ଅଦ୍ୟତନ କରନ୍ତୁ।

ହଁ, IndexTTS-2କୁ ବିଶେଷ ଭାବରେ ଭାବପ୍ରବଣ ବିଷୟବସ୍ତୁ, ଅଡିଓବାଇକ୍ସ, ଆଭାସୀ ସହାୟକମାନଙ୍କ ପାଇଁ ପରାମର୍ଶ ଦିଆଯାଏ । ଏହାର ଭାବପ୍ରବଣ ନିୟନ୍ତ୍ରଣ, ଶୂନ୍ୟ-ଶଟ, ଭାବପ୍ରବଣ ଭେକ୍ଟର କ୍ଷମତା ଏହାକୁ ଏହି ବ୍ୟବହାର ମାମଲା ପାଇଁ ଏକ ଉତ୍ତମ ଚୟନ କରିଥାଏ ।

ହଁ, IndexTTS-2 Bilibili ମଡେଲ ଲାଇସେନ୍ସ ଅଧୀନରେ ଲାଇସେନ୍ସିତ, ଯାହା ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ। IndexTTS-2 ଧ୍ୱନି ସହିତ ଉତ୍ପନ୍ନ ଧ୍ୱନିକୁ ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରକଳ୍ପରେ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ହଁ, TTS.ai ରେ ସମସ୍ତ ଧ୍ୱନି ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (MIT, Apache 2.0) ବ୍ୟବହାର କରିଥାଏ। ନିର୍ଗତ ଧ୍ୱନିଟି ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରୟୋଗରେ ବ୍ୟବହାର ପାଇଁ ଆପଣଙ୍କର ଅଟେ।

/api/v1/tts/କୁ ଆକାର ନାମ ଏବଂ ଭାଷା ID ସହିତ ଗୋଟିଏ POST ଅନୁରୋଧ ପଠାନ୍ତୁ। Python, JavaScript, Go, ଏବଂ cURL ରେ କୋଡ ଉଦାହରଣ ପାଇଁ ଆମର API ଦଲିଲିକରଣ ପୃଷ୍ଠାକୁ ଦେଖନ୍ତୁ।

ହଁ, ଗୋଟିଏ ନମୁନା ଶୁଣିବା ପାଇଁ ଏହି ପୃଷ୍ଠାରେ ଚାଲାଇବା ବଟନକୁ କ୍ଲିକ କରନ୍ତୁ। ଆପଣ ପାଠ୍ୟରୁ ଭାଷଣ ପୃଷ୍ଠାରେ ଇଚ୍ଛାରୂପୀ ପାଠ୍ୟ ଟାଇପ କରିପାରିବେ ଏବଂ କୌଣସି ଭାଷା ସହିତ ମୁକ୍ତ ପ୍ରାକଦର୍ଶନ ସୃଷ୍ଟି କରିପାରିବେ।

ଚେଷ୍ଟାକରନ୍ତୁ Default ବର୍ତ୍ତମାନ

ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ Default. ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ.