ମୁକ୍ତ AI ପାଠ୍ୟରୁ ବାକ୍ୟName

20+ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ, 107+ ସ୍ୱର, 32+ କୌଣସି ଖାତା ଆବଶ୍ୟକ ନାହିଁ ।

1K+
ନିର୍ମାତାମାନେ
2K+
ଜନ୍ମଗୁଡିକ
20+
AI ମଡେଲଗୁଡିକ
107+
ଧ୍ୱନିଗୁଡିକ
0/500 ଅକ୍ଷର ମୁକ୍ତ
5,000 chars per generation 15,000 ମୁକ୍ତ ଅକ୍ଷର କ୍ରେଡିଟ କାର୍ଡ ନାହିଁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ଠିକ ଅଛି
Sign up free
0:00 / 0:00
ଧ୍ୱନି ଆହରଣ କରନ୍ତୁ ସଂଯୋଗ 24 ଘଣ୍ଟାରେ ସମୟ ସମାପ୍ତ ହୋଇଥାଏ
TTS.ai ପସନ୍ଦ? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ଭାଷା AI ପାଇଁ ଆପଣଙ୍କୁ ଆବଶ୍ୟକୀୟ ସବୁକିଛିName

ମୁକ୍ତ ଉତ୍ସ AI ମଡେଲ ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ 30+ ଉପକରଣ

20+ AI ଧ୍ୱନି ନମୂନାଗୁଡ଼ିକName

ଗୋଟିଏ ପ୍ଲାଟଫର୍ମରେ ମୁକ୍ତ ଉତ୍ସ TTS ନମୁନାର ସବୁଠାରୁ ବ୍ୟାପକ ସଂଗ୍ରହ

KokoroKokoro Free

କୋକୋରୋ ଏକ 82 ମିଲିୟନ ପରିମାପକ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ମଡେଲ ଯାହାକି ଏହାର ଓଜନ ଶ୍ରେଣୀର ଉର୍ଦ୍ଧ୍ଵରେ ଭଲ ଭାବରେ କାମ କରେ। ଏହାର ଛୋଟ ଆକାର ସତ୍ତ୍ୱେ, ଏହା ଅତ୍ୟନ୍ତ ପ୍ରାକୃତିକ ଏବଂ ଅଭିବ୍ୟକ୍ତ ଭାଷା ଉତ୍ପାଦନ କରେ। କୋକୋରୋ ଇଂରାଜୀ, ଜାପାନୀ, ଚାଇନିଜ, ଏବଂ କୋରିଆନ ସମେତ ଏକାଧିକ ଭାଷାକୁ ସମର୍ଥନ କରେ। ଏହା ଅତ୍ୟନ୍ତ ଦ୍ରୁତ ଭାବରେ ଚଳାଇଥାଏ - GPU ରେ ପ୍ରକୃତ ସମୟ ଅପେକ୍ଷା ପ୍ରାୟ 100x ଦ୍ରୁତ ଧ୍ୱନି ଉତ୍ପାଦନ କରିଥାଏ।

ଏହା ପାଇଁ ଉତ୍ତମ: ସର୍ବନିମ୍ନ ବିଳମ୍ବ ସହିତ ଉଚ୍ଚ ଗୁଣବତ୍ତା TTS, ପ୍ରବାହିତ ପ୍ରୟୋଗଗୁଡ଼ିକName

ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ

PiperPiper Free

Piper ଗୋଟିଏ ହାଲୁକା ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ଯନ୍ତ୍ର ଯାହାକି Rhasspy ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି ଯାହାକି VITS ଏବଂ larynx ସ୍ଥାପତ୍ୟକୁ ବ୍ୟବହାର କରେ। ଏହା ସମ୍ପୂର୍ଣ୍ଣ ଭାବରେ CPU ଉପରେ ଚାଲୁଛି, ଏହାକୁ ଅଂଶ ଉପକରଣ, ଘର ସ୍ୱୟଂଚାଳିତ, ଏବଂ ଅଫଲାଇନ TTS ଆବଶ୍ୟକ କରୁଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ। 30+ ଭାଷାରେ 100ରୁ ଅଧିକ ଧ୍ୱନି ସହିତ, Piper ଗୋଟିଏ Raspberry Pi4ରେ ମଧ୍ୟ ପ୍ରକୃତ ସମୟ ଗତିରେ ପ୍ରାକୃତିକ-ଧ୍ୱନି ବାକ୍ୟ ପ୍ରଦାନ କରେ।

ଏହା ପାଇଁ ଉତ୍ତମ: ଦ୍ରୁତ ପ୍ରାକଦର୍ଶନ, ସୁଗମତା, ଏବଂ ସନ୍ନିବେଶିତ ପ୍ରୟୋଗଗୁଡ଼ିକName

ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ

VITSVITS Free

VITS (ଏଣ୍ଡ-ଟୁ-ଏଣ୍ଡ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ପାଇଁ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱୀ ଶିକ୍ଷାଦାନ ସହିତ ଭେରିଅନଲ ଇନଫେରେନ୍ସ) ଏକ ସମତଳ ଶେଷ-ରୁ-ଶେଷ TTS ପଦ୍ଧତି ଯାହାକି ପ୍ରଚଳିତ ଦୁଇ-ସ୍ତର ମଡେଲ ଅପେକ୍ଷା ଅଧିକ ପ୍ରାକୃତିକ ଶବ୍ଦ ଧ୍ୱନି ଉତ୍ପାଦନ କରେ। ଏହା ଭେରିଅନଲ ଇନଫେରେନ୍ସକୁ ଗ୍ରହଣ କରେ ଯାହାକି ସାଧାରଣ ପ୍ରବାହ ଏବଂ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱୀ ପ୍ରଶିକ୍ଷଣ ପ୍ରକ୍ରିୟା ସହିତ ବୃଦ୍ଧି ପାଇଥାଏ, ପ୍ରାକୃତିକତାରେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ଉନ୍ନତି ହାସଲ କରିଥାଏ।

ଏହା ପାଇଁ ଉତ୍ତମ: ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ସହିତ ସାଧାରଣ ଉଦ୍ଦେଶ୍ୟ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟName

ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ

MeloTTSMeloTTS Free

MyShell.ai ଦ୍ଵାରା MeloTTS ଏକ ବହୁଭାଷୀ TTS ଲାଇବ୍ରେରୀ ଯାହାକି ଇଂରାଜୀ (ଆମେରିକୀୟ, ବ୍ରିଟିଶ, ଭାରତୀୟ, ଅଷ୍ଟ୍ରେଲିଆନ), ସ୍ପେନିସ, ଫ୍ରେଞ୍ଚ, ଚାଇନିଜ, ଜାପାନୀ, ଏବଂ କୋରିଆନକୁ ସମର୍ଥନ କରେ। ଏହା ଅତ୍ୟନ୍ତ ଦ୍ରୁତ, କେବଳ CPU ଉପରେ ପାଖାପାଖି ସତ୍ୟକାଳୀନ ବେଗରେ ପାଠ୍ୟକୁ ପ୍ରକ୍ରିୟା କରିଥାଏ। MeloTTS ଉତ୍ପାଦନ ବ୍ୟବହାର ପାଇଁ ନିର୍ମିତ ଏବଂ CPU ଏବଂ GPU ଉଭୟକୁ ସମର୍ଥନ କରେ।

ଏହା ପାଇଁ ଉତ୍ତମ: ଉତ୍ପାଦନ ପ୍ରୟୋଗଗୁଡ଼ିକୁ ଦ୍ରୁତ, ବହୁଭାଷୀ TTS ଆବଶ୍ୟକ

ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ

BarkBark Standard

ପରିବର୍ତ୍ତକ ଆଧାରିତ ପାଠ୍ୟ-ରୁ-ଧ୍ୱନି ମଡେଲ ଯାହାକି ବାସ୍ତବବାଦୀ ବକ୍ତବ୍ୟ, ସଂଗୀତ ଏବଂ ଧ୍ୱନି ପ୍ରଭାବ ସୃଷ୍ଟି କରିଥାଏ।

ବିକାଶକାରୀ: Suno · ଅନୁମତିପତ୍ର: MIT

ଚେଷ୍ଟାକରନ୍ତୁ

Bark SmallBark Small Standard

ଦ୍ରୁତ ଅନୁମାନ ଏବଂ କମ ସ୍ମୃତିସ୍ଥାନ ବ୍ୟବହାର ସହିତ Bark ର ହାଲୁକା ସଂସ୍କରଣ ।

ବିକାଶକାରୀ: Suno · ଅନୁମତିପତ୍ର: MIT

ଚେଷ୍ଟାକରନ୍ତୁ

CosyVoice 2CosyVoice 2 Standard

ମାନବ-ସମାନ ପ୍ରାକୃତିକତା ଏବଂ ଶୂନ୍ୟ ପାଖାପାଖି ଲାଟେନସି ସହିତ ଅଲିବାବା'ର ମାପଯୋଗ୍ୟ ଷ୍ଟ୍ରିମିଂ TTS।

ବିକାଶକାରୀ: Alibaba (Tongyi Lab) · ଅନୁମତିପତ୍ର: Apache 2.0

ଚେଷ୍ଟାକରନ୍ତୁ

Dia TTSDia TTS Standard

ବହୁ-ବକ୍ତା ସଂଳାପ ନିର୍ମାଣ ମଡେଲ ଯାହା ବକ୍ତାମାନଙ୍କ ମଧ୍ୟରେ ପ୍ରାକୃତିକ କଥାବାର୍ତ୍ତା ସୃଷ୍ଟି କରେ।

ବିକାଶକାରୀ: Nari Labs · ଅନୁମତିପତ୍ର: Apache 2.0

ଚେଷ୍ଟାକରନ୍ତୁ

Parler TTSParler TTS Standard

ଆପଣ ପ୍ରାକୃତିକ ଭାଷାରେ ଚାହୁଁଥିବା ଧ୍ୱନିକୁ ବର୍ଣ୍ଣନା କରନ୍ତୁ ଏବଂ ପାର୍ଲର ମେଳଖାଉଥିବା ଭାଷଣ ସୃଷ୍ଟି କରିଥାଏ।

ବିକାଶକାରୀ: Hugging Face · ଅନୁମତିପତ୍ର: Apache 2.0

ଚେଷ୍ଟାକରନ୍ତୁ

GLM-TTSGLM-TTS Standard

ମୁକ୍ତ ଉତ୍ସ TTS ନମୂନାଗୁଡ଼ିକ ମଧ୍ୟରେ ସର୍ବନିମ୍ନ ଅକ୍ଷର ତ୍ରୁଟି ହାରକୁ ହାସଲ କରିଥାଏ।

ବିକାଶକାରୀ: Zhipu AI · ଅନୁମତିପତ୍ର: GLM-4 License

ଚେଷ୍ଟାକରନ୍ତୁ

IndexTTS-2IndexTTS-2 Standard

ଶୂନ୍ୟ-ଶଟ TTS ଫାଇନ-ଗ୍ରେନ ଇମୋସନ ନିୟନ୍ତ୍ରଣ ଏବଂ ଉଚ୍ଚ ଅଭିବ୍ୟକ୍ତିଶୀଳତା ସହିତ ।

ବିକାଶକାରୀ: Index Team · ଅନୁମତିପତ୍ର: Bilibili Model License

ଚେଷ୍ଟାକରନ୍ତୁ

Spark TTSSpark TTS Standard

ନିୟନ୍ତ୍ରଣଯୋଗ୍ୟ ଅନୁଭୂତି ଏବଂ ପରାମର୍ଶ ମାଧ୍ୟମରେ କଥାବାର୍ତ୍ତା ଶୈଳୀ ସହିତ ଧ୍ୱନି କ୍ଲୋନ TTS।

ବିକାଶକାରୀ: SparkAudio · ଅନୁମତିପତ୍ର: CC BY-NC-SA 4.0

ଚେଷ୍ଟାକରନ୍ତୁ

GPT-SoVITSGPT-SoVITS Standard

କିଛି-ଶଟ ସ୍ୱର କ୍ଲୋନ TTS ଯାହାକି କେବଳ5ସେକେଣ୍ଡ ଧ୍ୱନିରୁ ଯେକୌଣସି ସ୍ୱରକୁ ନକଲ କରିଥାଏ।

ବିକାଶକାରୀ: RVC-Boss · ଅନୁମତିପତ୍ର: MIT

ଚେଷ୍ଟାକରନ୍ତୁ

OrpheusOrpheus Standard

100K ଘଣ୍ଟା ବାକ୍ୟ ତଥ୍ୟ ଉପରେ ପ୍ରଶିକ୍ଷିତ ମାନବ ସ୍ତରୀୟ ଭାବଗତ TTS ମଡେଲ ।

ବିକାଶକାରୀ: Canopy Labs · ଅନୁମତିପତ୍ର: Llama 3.2 Community

ଚେଷ୍ଟାକରନ୍ତୁ

Qwen3 TTSQwen3 TTS Standard

ଆଲିବାବାର ବହୁଭାଷୀ TTS ଧ୍ୱନି କ୍ଲୋନିଂ ସହିତ, ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଧ୍ୱନି, ଏବଂ ପାଠ୍ୟରୁ ଧ୍ୱନି ଡିଜାଇନ।

ବିକାଶକାରୀ: Alibaba (Qwen) · ଅନୁମତିପତ୍ର: Apache 2.0

ଚେଷ୍ଟାକରନ୍ତୁ

ChatterboxChatterbox Premium

Resemble AI ଠାରୁ ଆବେଗ ନିୟନ୍ତ୍ରଣ ସହିତ state-of-the-art ଶୂନ୍ୟ-ଶଟ ସ୍ୱର କ୍ଲୋନିଂ ।

ଗୁଣବତ୍ତା:

ଚେଷ୍ଟାକରନ୍ତୁ

Tortoise TTSTortoise TTS Premium

ବହୁ-ଭାଷା ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ଗୁଣବତ୍ତା ଉପରେ ଆଧାରିତ ଅଟୋ-ରିଗ୍ରେସିଭ ଢାଞ୍ଚା ସହିତ ।

ଗୁଣବତ୍ତା:

ଚେଷ୍ଟାକରନ୍ତୁ

StyleTTS 2StyleTTS 2 Premium

ମାନବ ସ୍ତରୀୟ ପାଠ-ରୁ-ବାକ୍ୟ ମାଧ୍ୟମରେ ଶୈଳୀ ପ୍ରସାରଣ ଏବଂ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱିତା ପ୍ରଶିକ୍ଷା

ଗୁଣବତ୍ତା:

ଚେଷ୍ଟାକରନ୍ତୁ

OpenVoiceOpenVoice Premium

ଶୈଳୀ, ଅନୁଭୂତି, ଏବଂ ଉଚ୍ଚାରଣ ଉପରେ ଗ୍ରାନୁଲାର ନିୟନ୍ତ୍ରଣ ସହିତ ତୁରନ୍ତ ସ୍ୱର କ୍ଲୋନିଂ।

ଗୁଣବତ୍ତା:

ଚେଷ୍ଟାକରନ୍ତୁ

Sesame CSMSesame CSM Premium

ଯୁକ୍ତିତର୍କର ଭାଷା ମଡେଲ, ଯାହାକି ଉପଯୁକ୍ତ ସମୟ ଏବଂ ଭାବନା ସହିତ ପ୍ରାକୃତିକ ଆଲୋଚନା ସୃଷ୍ଟି କରିଥାଏ ।

ଗୁଣବତ୍ତା:

ଚେଷ୍ଟାକରନ୍ତୁ

CosyVoice 2CosyVoice 2

ମାନବ-ସମାନ ପ୍ରାକୃତିକତା ଏବଂ ଶୂନ୍ୟ ପାଖାପାଖି ଲାଟେନସି ସହିତ ଅଲିବାବା'ର ମାପଯୋଗ୍ୟ ଷ୍ଟ୍ରିମିଂ TTS।

ଭାଷା: en, zh, ja, ko, fr, de, it, es

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

GLM-TTSGLM-TTS

ମୁକ୍ତ ଉତ୍ସ TTS ନମୂନାଗୁଡ଼ିକ ମଧ୍ୟରେ ସର୍ବନିମ୍ନ ଅକ୍ଷର ତ୍ରୁଟି ହାରକୁ ହାସଲ କରିଥାଏ।

ଭାଷା: en, zh

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

IndexTTS-2IndexTTS-2

ଶୂନ୍ୟ-ଶଟ TTS ଫାଇନ-ଗ୍ରେନ ଇମୋସନ ନିୟନ୍ତ୍ରଣ ଏବଂ ଉଚ୍ଚ ଅଭିବ୍ୟକ୍ତିଶୀଳତା ସହିତ ।

ଭାଷା: en, zh

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

Spark TTSSpark TTS

ନିୟନ୍ତ୍ରଣଯୋଗ୍ୟ ଅନୁଭୂତି ଏବଂ ପରାମର୍ଶ ମାଧ୍ୟମରେ କଥାବାର୍ତ୍ତା ଶୈଳୀ ସହିତ ଧ୍ୱନି କ୍ଲୋନ TTS।

ଭାଷା: en, zh

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

GPT-SoVITSGPT-SoVITS

କିଛି-ଶଟ ସ୍ୱର କ୍ଲୋନ TTS ଯାହାକି କେବଳ5ସେକେଣ୍ଡ ଧ୍ୱନିରୁ ଯେକୌଣସି ସ୍ୱରକୁ ନକଲ କରିଥାଏ।

ଭାଷା: en, zh, ja, ko

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

ChatterboxChatterbox

Resemble AI ଠାରୁ ଆବେଗ ନିୟନ୍ତ୍ରଣ ସହିତ state-of-the-art ଶୂନ୍ୟ-ଶଟ ସ୍ୱର କ୍ଲୋନିଂ ।

ଭାଷା: en

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

Tortoise TTSTortoise TTS

ବହୁ-ଭାଷା ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ଗୁଣବତ୍ତା ଉପରେ ଆଧାରିତ ଅଟୋ-ରିଗ୍ରେସିଭ ଢାଞ୍ଚା ସହିତ ।

ଭାଷା: en

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

OpenVoiceOpenVoice

ଶୈଳୀ, ଅନୁଭୂତି, ଏବଂ ଉଚ୍ଚାରଣ ଉପରେ ଗ୍ରାନୁଲାର ନିୟନ୍ତ୍ରଣ ସହିତ ତୁରନ୍ତ ସ୍ୱର କ୍ଲୋନିଂ।

ଭାଷା: en, zh, ja, ko, fr, de, es, it

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

Qwen3 TTSQwen3 TTS

ଆଲିବାବାର ବହୁଭାଷୀ TTS ଧ୍ୱନି କ୍ଲୋନିଂ ସହିତ, ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଧ୍ୱନି, ଏବଂ ପାଠ୍ୟରୁ ଧ୍ୱନି ଡିଜାଇନ।

ଭାଷା: en, zh, ja, ko, de, fr, ru, pt, es, it

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

ବିକାଶକାରୀ- ପ୍ରଥମ API

OpenAI-ସହଜ REST API. ଗୋଟିଏ ଶେଷ ବିନ୍ଦୁ, 22+ ନମୂନା. ରିୟଲ-ଟାଇମ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଷ୍ଟ୍ରିମିଂ ସମର୍ଥନ।

  • OpenAI- ସୁସଂଗତ ଶୈଳୀ
  • ରିଅଲ-ଟାଇମ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ TTS ପ୍ରବାହ
  • ବଡ଼ କାର୍ଯ୍ୟଗୁଡ଼ିକ ପାଇଁ ବ୍ୟାଚ ପ୍ରକ୍ରିୟାକରଣ
  • Webhook ବିଜ୍ଞପ୍ତିଗୁଡ଼ିକ
API ଦଲିଲଗୁଡ଼ିକୁ ଦେଖନ୍ତୁ
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ସରଳ, ପାରଦର୍ଶୀ ମୂଲ୍ୟାଙ୍କନ

ମୁକ୍ତ ଭାବରେ ଆରମ୍ଭ କରନ୍ତୁ । ଆପଣ ବଢିବା ସମୟରେ ମାପନ୍ତୁ ।

ମୁକ୍ତ

$0

15 କ୍ରିଡ଼େଟ

  • Kokoro, Piper, VITS, MeloTTS
  • 500 ଅକ୍ଷର ସୀମା
  • 3 ଜେନ/ଘଣ୍ଟା (କୌଣସି ଖାତା ନାହିଁ)
ମୁକ୍ତ ଭାବରେ ପଞ୍ଜିକୃତ ହୁଅନ୍ତୁ

ଆରମ୍ଭକର୍ତ୍ତା

$9/ମିନିଟ

500 ଋଣ/ମାସ

  • ସମସ୍ତ 22+ ଆକାର
  • 100,000 chars per generation
  • ଧ୍ୱନି କ୍ଲୋନିଂName
ଆରମ୍ଭ କରନ୍ତୁ
ସବୁଠାରୁ ଲୋକପ୍ରିୟ

ପ୍ରୋ

$29/ମିନିଟ

2,000 ଋଣ/ମାସ

  • ଆରମ୍ଭକର୍ତ୍ତାରେ ସବୁକିଛି
  • API ସୁଗମତା
  • ପ୍ରାଥମିକତା ପ୍ରକ୍ରିୟାକରଣ
ପ୍ରୋ ଗ୍ରହଣ କରନ୍ତୁ

ବ୍ୟବସାୟ

$99/ମିନିଟ

10,000 ଋଣ/ମାସ

  • Pro ରେ ସବୁକିଛି
  • ବୃହତ API
  • ପ୍ରାଥମିକତା ଧାଡ଼ି
ବ୍ୟବସାୟ ଗ୍ରହଣ କରନ୍ତୁ

ଅକ୍ଷର ପ୍ୟାକ ସମେତ ସମସ୍ତ ଯୋଜନାଗୁଡ଼ିକୁ ଦେଖନ୍ତୁ →

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

TTS.ai ହେଉଛି ସବୁଠୁ ବ୍ୟାପକ AI ଭାଷା ପ୍ଲାଟଫର୍ମ, ଯାହା 22+ ପାଠ୍ୟରୁ ଭାଷା ମଡେଲ, ଭାଷା କ୍ଲୋନିଂ, ଭାଷାରୁ ପାଠ୍ୟ ଏବଂ ଧ୍ୱନି ଉପକରଣ ପ୍ରଦାନ କରେ । ସମସ୍ତ ମଡେଲଗୁଡ଼ିକ କୌଣସି ବିକ୍ରୟକାରୀର ଲକ-ଇନ ବିନା ମୁକ୍ତ ଉତ୍ସ ।

ହଁ! TTS.ai Kokoro, Piper, VITS, ଏବଂ MeloTTS ମଡେଲ ସହିତ ମୁକ୍ତ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ପ୍ରଦାନ କରେ। କୌଣସି ଖାତା ଆବଶ୍ୟକ ନୁହଁ। 15,000 ମୁକ୍ତ ଅକ୍ଷର ଏବଂ ସମସ୍ତ ମଡେଲକୁ ବ୍ୟବହାର କରିବା ପାଇଁ ସଦସ୍ୟତା ନିଅନ୍ତୁ। ପୈଠିତ ଯୋଜନା $9/ମାସରେ ଆରମ୍ଭ ହୋଇଥାଏ।

ଗତି ପାଇଁ, Kokoro କିମ୍ବା Piper କୁ ବ୍ୟବହାର କରନ୍ତୁ। ଗୁଣବତ୍ତା ପାଇଁ, CosyVoice2ଅଥବା StyleTTS2କୁ ଚେଷ୍ଟାକରନ୍ତୁ। ଧ୍ୱନି କ୍ଲୋନିଂ ପାଇଁ, Chatterbox କିମ୍ବା GPT-SoVITS କୁ ବ୍ୟବହାର କରନ୍ତୁ। ସଂଳାପ ପାଇଁ, Dia TTS କୁ ବ୍ୟବହାର କରନ୍ତୁ। ତୁଳନା କରିବା ପାଇଁ ଏକା ପାଠ୍ୟରେ ଏକାଧିକ ନମୂନାକୁ ଚେଷ୍ଟାକରନ୍ତୁ।

ହଁ। TTS, STT, ସ୍ୱର କ୍ଲୋନିଂ, ଏବଂ ଧ୍ୱନି ସାଧନଗୁଡ଼ିକ ପାଇଁ OpenAI-ସହଜ REST API। ପ୍ରୋ ($29/ମାସ) ଏବଂ ଏଣ୍ଟରପ୍ରାଇଜ ($99/ମାସ) ଯୋଜନାରେ ଉପଲବ୍ଧ। tts.ai/api/ ରେ ଦଲିଲିକରଣ ଦେଖନ୍ତୁ।

ସ୍ୱର ଗୁଣବତ୍ତା ମଡେଲ ଅନୁଯାୟୀ ପରିବର୍ତ୍ତିତ ହୋଇଥାଏ। CosyVoice2, StyleTTS2, ଏବଂ Chatterbox ପରି ପ୍ରୀମିୟମ ମଡେଲଗୁଡ଼ିକ ପ୍ରାକୃତିକ ଢଙ୍ଗ ଏବଂ ଅନୁଭୂତି ସହିତ ପାଖାପାଖି-ମାନବୀୟ ଗୁଣବତ୍ତାର ଭାଷା ଉତ୍ପାଦନ କରିଥାଏ। Kokoro ଭଳି ମୁକ୍ତ ମଡେଲଗୁଡ଼ିକ ଅଧିକାଂଶ ବ୍ୟବହାର ମାମଲା ପାଇଁ ଉତ୍ତମ ଗୁଣବତ୍ତା ପ୍ରଦାନ କରିଥାଏ।

TTS.ai ଏହାର ମଡେଲ ଲାଇବ୍ରେରୀରେ 30+ ଭାଷାକୁ ସମର୍ଥନ କରେ। ଇଂରାଜୀରେ ସର୍ବବୃହତ ମଡେଲ ସମର୍ଥନ ଅଛି, କିନ୍ତୁ CosyVoice2ପରି ମଡେଲ ଚାଇନିଜ, ଜାପାନୀ, ଏବଂ କୋରିଆନକୁ ଆବରଣ କରେ; GPT-SoVITS ଚାଇନିଜ, ଜାପାନୀ, କୋରିଆନ, ଏବଂ ଇଂରାଜୀକୁ ପରିଚାଳନା କରେ; ଏବଂ MeloTTS ଇଂରାଜୀ, ସ୍ପେନିସ, ଫ୍ରେଞ୍ଚ, ଚାଇନିଜ, ଜାପାନୀ, ଏବଂ କୋରିଆନକୁ ସମର୍ଥନ କରେ।

ହଁ। ସମସ୍ତ ପ୍ରକ୍ରିୟା ଆମର ସମର୍ପିତ GPU ସର୍ଭରଗୁଡ଼ିକରେ ଘଟେ। ଆମେ ଆପଣଙ୍କର ପାଠ୍ୟ ନିବେଶକୁ ସଂରକ୍ଷଣ କରୁନାହିଁ କିମ୍ବା ପ୍ରଦାନ ପରେ ଉତ୍ପନ୍ନ ଧ୍ୱନିକୁ ସଂରକ୍ଷଣ କରୁନାହିଁ। କ୍ଲୋନ କରିବା ପାଇଁ ଅଦ୍ୟତନ କରାଯାଇଥିବା ଧ୍ୱନି ନମୁନାଗୁଡ଼ିକୁ କେବଳ ବର୍ତ୍ତମାନ ଅଧିବେଶନ ପାଇଁ ବ୍ୟବହାର କରାଯାଏ ଏବଂ ସଂରକ୍ଷିତ କରାଯାଇନାହିଁ। ଆମେ ଆପଣଙ୍କର ତଥ୍ୟକୁ ତୃତୀୟ ପକ୍ଷ ସହିତ କେବେ ବି ବାଣ୍ଟିନୁ କିମ୍ବା ଏହାକୁ ନମୂନାକୁ ପ୍ରଶିକ୍ଷଣ ଦେବା ପାଇଁ ବ୍ୟବହାର କରୁନୁ।

ହଁ। TTS.ai ରେ ନିର୍ମିତ ସମସ୍ତ ଧ୍ୱନି ଆପଣଙ୍କର ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ, YouTube ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଅଡିଓବାଇକ, ଆପ, ବିଜ୍ଞାପନ, ଏବଂ ଉତ୍ପାଦଗୁଡ଼ିକ ସହିତ। ଆମର ମଡେଲଗୁଡ଼ିକ ଅନୁମତିପ୍ରଦାନକାରୀ ଲାଇସେନ୍ସ (MIT, Apache 2.0) ଅନ୍ତର୍ଗତ ମୁକ୍ତ ଉତ୍ସ। କୌଣସି ରୟାଲଟି କିମ୍ବା ଯୋଗଦାନ ଆବଶ୍ୟକ ନାହିଁ।

TTS.ai ସର୍ବାଧିକ ଗୁଣବତ୍ତା ପାଇଁ ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଭାବରେ WAV ଶୈଳୀରେ ଧ୍ୱନି ସୃଷ୍ଟି କରିଥାଏ। ଆପଣ MP3, FLAC, OGG, କିମ୍ବା M4A କୁ ଆମର ମୁକ୍ତ ଧ୍ୱନି ପରିବର୍ତ୍ତକ ସାଧନକୁ ବ୍ୟବହାର କରି ପରିବର୍ତ୍ତନ କରିପାରିବେ। API ଅନୁରୋଧରେ ଆପଣଙ୍କର ପସନ୍ଦଯୋଗ୍ୟ ନିର୍ଗମ ଶୈଳୀକୁ ସିଧାସଳଖ ନିର୍ଦ୍ଦିଷ୍ଟ କରିବା ପାଇଁ ସମର୍ଥନ କରିଥାଏ।

ଆପଣ କ୍ଲୋନ କରିବାକୁ ଚାହୁଁଥିବା ଧ୍ୱନିର ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାକୁ ଅପଲୋଡ କରନ୍ତୁ (5 ସେକେଣ୍ଡରୁ କମ), ତା'ପରେ ସେହି ଧ୍ୱନିରେ ଭାଷା ସୃଷ୍ଟି କରିବା ପାଇଁ କୌଣସି ପାଠ୍ୟକୁ ଟାଇପ କରନ୍ତୁ। ଚାଟରବକ୍ସ, GPT-SoVITS, ଏବଂ CosyVoice2ପରି ନମୂନାଗୁଡ଼ିକ ଧ୍ୱନି କ୍ଲୋନକୁ ସମର୍ଥନ କରିଥାଏ। କ୍ଲୋନ କରାଯାଇଥିବା ଧ୍ୱନି ଧ୍ୱନି, ଉଚ୍ଚାରଣ, ଏବଂ ଭାଷା ଶୈଳୀକୁ ଗ୍ରହଣ କରିଥାଏ।

ମୁକ୍ତ ମଡେଲ (Kokoro, Piper, VITS, MeloTTS) ପାଇଁ କୌଣସି ଖାତା ଆବଶ୍ୟକ ନାହିଁ ଏବଂ ଶୂନ୍ୟ ଅକ୍ଷର ଖର୍ଚ୍ଚ ହୋଇଥାଏ। ମାନକ ମଡେଲ (2,000 ଅକ୍ଷର/1K ନିବେଶ) ରେ Bark, CosyVoice2, F5-TTS, ଏବଂ Dia ସାମିଲ ଅଛି। ପ୍ରୀମିୟମ ମଡେଲ (4,000 ଅକ୍ଷର/1K ନିବେଶ) ରେ OpenVoice, Chatterbox, StyleTTS2, ଏବଂ Tortoise ସାମିଲ ଅଛି। ପୈଠିତ ମଡେଲ ସାଧାରଣତଃ ଉଚ୍ଚ ଗୁଣବତ୍ତା, ଅଧିକ ଧ୍ୱନି, ଏବଂ ଅତିରିକ୍ତ ବିଶେଷତା ଭଳି ଧ୍ୱନି କ୍ଲୋନିଂ ପ୍ରଦାନ କରିଥାଏ।

ହଁ। ପାଠ୍ୟର ବଡ଼ ପରିମାଣକୁ ଭାଷାରେ ପରିବର୍ତ୍ତନ କରିବା ପାଇଁ API ବ୍ୟାଚ ପ୍ରକ୍ରିୟାକରଣକୁ ସମର୍ଥନ କରେ। ଏକାଧିକ ଅନୁରୋଧ ଦାଖଲ କରନ୍ତୁ ଏବଂ କାର୍ଯ୍ୟ UUIDଗୁଡ଼ିକୁ ବ୍ୟବହାର କରି ଅପରିବର୍ତ୍ତନୀୟ ଭାବରେ ଫଳାଫଳଗୁଡ଼ିକୁ ପୁନଃପ୍ରାପ୍ତ କରନ୍ତୁ। କମ୍ପାନୀ ଯୋଜନା ($99/ମାସ) ଦ୍ରୁତ ବ୍ୟାଚ ପ୍ରକ୍ରିୟାକରଣ ପାଇଁ ପ୍ରାଥମିକତା ଧାଡ଼ି ଅଭିଗମ୍ୟତା ଅନ୍ତର୍ଭୁକ୍ତ କରିଥାଏ। ଧ୍ୱନି ପୁସ୍ତକ ଉତ୍ପାଦନ, ପାଠ୍ୟ ବିଷୟବସ୍ତୁ, ଏବଂ ବଡ଼ ପରିମାଣର ଭାଷା ପ୍ରକଳ୍ପଗୁଡ଼ିକ ପାଇଁ ଉପଯୁକ୍ତ।
4.0/5 (8)

AI ଧ୍ୱନି ବ୍ୟବହାର କରିବା ଆଜି ଆରମ୍ଭ କରନ୍ତୁ

TTS.ai ବ୍ୟବହାର କରି ନିର୍ମାତା, ବିକାଶକାରୀ ଏବଂ ବ୍ୟବସାୟରେ ଯୋଗ ଦିଅନ୍ତୁ