Parler TTS

Default

ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଇଂରାଜୀName Neutral Parler TTS

Default ଗୋଟିଏ neutral AI ଧ୍ୱନି ଯାହାକି Parler TTS ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ନମୂନା ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ। ଏହି ପୂର୍ବନିର୍ଦ୍ଧାରିତ ସ୍ତର ଧ୍ୱନି ଇଂରାଜୀName କୁ କହୁଛି ଏବଂ ଉଚ୍ଚ-ଗୁଣମାନର ଭାଷା ସଂଶ୍ଲେଷଣ ପ୍ରଦାନ କରେ। ମଧ୍ଯମ ଉତ୍ପାଦନ ଗତି ଏବଂ 4/5 ର ଗୁଣବତ୍ତା ଆକଳନ ସହିତ, Default creative applications where you need custom voice characteristics ପାଇଁ ଭଲ ଭାବରେ ଉପଯୁକ୍ତ। Parler TTS ଯନ୍ତ୍ରଟି Hugging Face under the Apache 2.0 license ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି, ଯାହାକି ଏହାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ ସୁରକ୍ଷିତ କରିଥାଏ। ମୁଖ୍ୟ କ୍ଷମତାଗୁଡ଼ିକ ମଧ୍ୟରେ ରହିଛି: {ବିଶେଷତାଗୁଡ଼ିକ}।

ବର୍ତ୍ତମାନ କୌଣସି ଆକଳନ ନାହିଁ

Parler TTSଆକାର ସୂଚନାName

ଆକାର Parler TTS
ବିକାଶକାରୀ Hugging Face
ଗୁଣବତ୍ତା
ବେଗ ମଧ୍ଯମ
ଅନୁମତିପତ୍ର Apache 2.0
କ୍ଲୋନ କରୁଅଛି ଉପଲବ୍ଧ ନାହିଁ
ଅକ୍ଟୋବର ମାନକ (2 କ୍ରେଡିଟ/1K ଅକ୍ଷର)
ପ୍ରାଚଳଗୁଡ଼ିକ 880M
ବାସ୍ତୁଶାସ୍ତ୍ର Transformer Encoder-Decoder
ତାଲିମ ତଥ୍ୟName 45000 ଘଣ୍ଟାunit-format
ବର୍ଷ 2024

ପାଇଁ ଶ୍ରେଷ୍ଠ ବ୍ୟବହାର ମାମଲା Default

ଏହି ଧ୍ୱନିର ଗୁଣଧର୍ମ ଆଧାରରେ ପରାମର୍ଶ ଦିଆଯାଉଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ

ଧ୍ୱନି ପୁସ୍ତକ ଏବଂ ବର୍ଣ୍ଣନାName

ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ଏବଂ ଅଭିବ୍ୟକ୍ତି ସହିତ ଲମ୍ବା-ଫର୍ମ ବିଷୟବସ୍ତୁକୁ ବର୍ଣ୍ଣନା କରିବା ପାଇଁ Default କୁ ବ୍ୟବହାର କରନ୍ତୁ।

ଭିଡିଓ ଭାଷା

YouTube ଭିଡିଓ, ବିଜ୍ଞାପନ, ଏବଂ ସାମାଜିକ ଗଣମାଧ୍ୟମ ବିଷୟବସ୍ତୁଗୁଡ଼ିକରେ ବୈଷୟିକ ବର୍ଣ୍ଣନା ଯୋଗ କରନ୍ତୁ।

ଇ-ଶିକ୍ଷା ଏବଂ ପ୍ରଶିକ୍ଷଣName

ସ୍ପଷ୍ଟ ଆଇ ନାରେଟିଂ ସହିତ ଆକର୍ଷଣୀୟ ପ୍ରଶିକ୍ଷଣ ସାମଗ୍ରୀ, ପାଠ୍ୟକ୍ରମ ଏବଂ ଶିକ୍ଷାଗତ ବିଷୟବସ୍ତୁ ସୃଷ୍ଟି କରନ୍ତୁ ।

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

Parler TTS ଗୋଟିଏ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ମଡେଲ ଯାହାକି ଉତ୍ପନ୍ନ ବାକ୍ୟକୁ ନିୟନ୍ତ୍ରଣ କରିବା ପାଇଁ ପ୍ରାକୃତିକ ଭାଷା ସ୍ୱର ବର୍ଣ୍ଣନାକୁ ବ୍ୟବହାର କରେ। ପୂର୍ବନିର୍ଦ୍ଧାରିତ ସ୍ୱରଗୁଡ଼ିକରୁ ଚୟନ କରିବା ବଦଳରେ, ଆପଣ ଚାହୁଁଥିବା ସ୍ୱରକୁ ବର୍ଣ୍ଣନା କରନ୍ତୁ (ଯେପରିକି, "ସମସ୍ତେ ବ୍ରିଟିଶ ଉଚ୍ଚାରଣ ସହିତ ଏକ ଉଷ୍ମ ମହିଳା ସ୍ୱର, ଧୀରେ ଧୀରେ ଏବଂ ସ୍ପଷ୍ଟ ଭାବରେ କଥାବାର୍ତ୍ତା ହେଉଛନ୍ତି") ଏବଂ Parler ସେହି ବର୍ଣ୍ଣନା ସହିତ ମେଳ ଖାଉଥିବା ବାକ୍ୟ ସୃଷ୍ଟି କରିଥାଏ। ଏହା ଏହାକୁ ସୃଜନଶୀଳ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଭିନ୍ନ ଭିନ୍ନ ଭାବରେ ନମନୀୟ କରିଥାଏ।

ପାଲର TTS କୁ ହଗିଂ ଫିସ ଦ୍ୱାରା ବିକଶିତ କରାଯାଇଛି ଏବଂ ଏହା ଆପାଚି 2.0 ଲାଇସେନ୍ସ ଅନ୍ତର୍ଗତ ମୁକ୍ତ କରାଯାଇଛି, ଯାହାକି ଉତ୍ପନ୍ନ ଧ୍ୱନିର ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ ।

ପାଲର TTS 1 ଭାଷାକୁ ସମର୍ଥନ କରେ: ଇଂରାଜୀ।

Parler TTS ମାନକ ସ୍ତରରେ ଅଛି - ପ୍ରତି 1,000 ଅକ୍ଷରରେ2କରେଡିଟ। ଆପଣ ସମ୍ପୂର୍ଣ୍ଣ ଧ୍ୱନି ସୃଷ୍ଟି କରିବା ପୂର୍ବରୁ କୌଣସି Parler TTS ଧ୍ୱନିକୁ ମୁକ୍ତରେ ପ୍ରାକଦର୍ଶନ କରିପାରିବେ।

Parler TTSର ମଧ୍ଯମ ଉତ୍ପାଦନ ବେଗ ଅଛି। ଉତ୍ପାଦନ ସାଧାରଣତଃ ପାଠ୍ୟ ଲମ୍ବ ଉପରେ ନିର୍ଭର କରି କିଛି ସେକେଣ୍ଡ ସମୟ ଗ୍ରହଣ କରେ।

Parler TTS କୁ TTS.ai ରେ ଧ୍ୱନି ଗୁଣବତ୍ତା ପାଇଁ 4/5 ରୂପେ ମାନ ଦିଆଯାଇଛି। ଏହା ଉଚ୍ଚ ଗୁଣବତ୍ତା, ପ୍ରାକୃତିକ-ସଙ୍ଗୀତ ବାକ୍ୟ ଉତ୍ପାଦନ କରେ।

ନା, Parler TTS ସ୍ଥାପିତ ଧ୍ୱନିଗୁଡ଼ିକର ଗୋଟିଏ ସ୍ଥିର ସେଟକୁ ବ୍ୟବହାର କରେ। ଧ୍ୱନି କ୍ଲୋନିଂ ପାଇଁ, CosyVoice2, GPT-SoVITS, କିମ୍ବା Chatterbox ପରି ନମୂନାକୁ ଚେଷ୍ଟାକରନ୍ତୁ।

ହଁ, Parler TTS ବିଶେଷକରି ସୃଜନଶୀଳ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ପରାମର୍ଶ ଦିଆଯାଏ ଯେଉଁଠାରେ ଆପଣଙ୍କୁ ଇଚ୍ଛାରୂପୀ ସ୍ୱର ଗୁଣଧର୍ମ ଆବଶ୍ୟକ ହୋଇଥାଏ। ଏହାର ସ୍ୱର ବର୍ଣ୍ଣନା, ପ୍ରାକୃତିକ ଭାଷା ନିୟନ୍ତ୍ରଣ, ନମନୀୟ ସ୍ୱର ନିର୍ମାଣ କ୍ଷମତା ଏହାକୁ ଏହି ବ୍ୟବହାର ମାମଲା ପାଇଁ ଏକ ଉତ୍ତମ ଚୟନ କରିଥାଏ।

ହଁ, Parler TTS Apache 2.0 ଅନ୍ତର୍ଗତ ଲାଇସେନ୍ସିତ, ଯାହା ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ। Parler TTS ଧ୍ୱନି ସହିତ ଉତ୍ପନ୍ନ ଧ୍ୱନିକୁ ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରକଳ୍ପରେ ବ୍ୟବହାର କରାଯାଇପାରିବ।

ହଁ, TTS.ai ରେ ସମସ୍ତ ଧ୍ୱନି ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (MIT, Apache 2.0) ବ୍ୟବହାର କରିଥାଏ। ନିର୍ଗତ ଧ୍ୱନିଟି ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଆପଲେଟ, ଖେଳ ଏବଂ ଅନ୍ୟାନ୍ୟ ବାଣିଜ୍ୟିକ ପ୍ରୟୋଗରେ ବ୍ୟବହାର ପାଇଁ ଆପଣଙ୍କର ଅଟେ।

/api/v1/tts/କୁ ଆକାର ନାମ ଏବଂ ଭାଷା ID ସହିତ ଗୋଟିଏ POST ଅନୁରୋଧ ପଠାନ୍ତୁ। Python, JavaScript, Go, ଏବଂ cURL ରେ କୋଡ ଉଦାହରଣ ପାଇଁ ଆମର API ଦଲିଲିକରଣ ପୃଷ୍ଠାକୁ ଦେଖନ୍ତୁ।

ହଁ, ଗୋଟିଏ ନମୁନା ଶୁଣିବା ପାଇଁ ଏହି ପୃଷ୍ଠାରେ ଚାଲାଇବା ବଟନକୁ କ୍ଲିକ କରନ୍ତୁ। ଆପଣ ପାଠ୍ୟରୁ ଭାଷଣ ପୃଷ୍ଠାରେ ଇଚ୍ଛାରୂପୀ ପାଠ୍ୟ ଟାଇପ କରିପାରିବେ ଏବଂ କୌଣସି ଭାଷା ସହିତ ମୁକ୍ତ ପ୍ରାକଦର୍ଶନ ସୃଷ୍ଟି କରିପାରିବେ।

ଚେଷ୍ଟାକରନ୍ତୁ Default ବର୍ତ୍ତମାନ

ଯେକୌଣସି ପାଠ୍ୟ ଟାଇପ କରନ୍ତୁ ଏବଂ ଏହାକୁ କହିବା ପାଇଁ ଶୁଣନ୍ତୁ Default. ବ୍ୟବହାର ପାଇଁ ମୁକ୍ତ.