ମୁକ୍ତ AI ପାଠ୍ୟରୁ ବାକ୍ୟName
20+ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ, 107+ ସ୍ୱର, 32+ କୌଣସି ଖାତା ଆବଶ୍ୟକ ନାହିଁ ।
ଭାଷା AI ପାଇଁ ଆପଣଙ୍କୁ ଆବଶ୍ୟକୀୟ ସବୁକିଛିName
ମୁକ୍ତ ଉତ୍ସ AI ମଡେଲ ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ 30+ ଉପକରଣ
20+ AI ଧ୍ୱନି ନମୂନାଗୁଡ଼ିକName
ଗୋଟିଏ ପ୍ଲାଟଫର୍ମରେ ମୁକ୍ତ ଉତ୍ସ TTS ନମୁନାର ସବୁଠାରୁ ବ୍ୟାପକ ସଂଗ୍ରହ
Kokoro Free
କୋକୋରୋ ଏକ 82 ମିଲିୟନ ପରିମାପକ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ମଡେଲ ଯାହାକି ଏହାର ଓଜନ ଶ୍ରେଣୀର ଉର୍ଦ୍ଧ୍ଵରେ ଭଲ ଭାବରେ କାମ କରେ। ଏହାର ଛୋଟ ଆକାର ସତ୍ତ୍ୱେ, ଏହା ଅତ୍ୟନ୍ତ ପ୍ରାକୃତିକ ଏବଂ ଅଭିବ୍ୟକ୍ତ ଭାଷା ଉତ୍ପାଦନ କରେ। କୋକୋରୋ ଇଂରାଜୀ, ଜାପାନୀ, ଚାଇନିଜ, ଏବଂ କୋରିଆନ ସମେତ ଏକାଧିକ ଭାଷାକୁ ସମର୍ଥନ କରେ। ଏହା ଅତ୍ୟନ୍ତ ଦ୍ରୁତ ଭାବରେ ଚଳାଇଥାଏ - GPU ରେ ପ୍ରକୃତ ସମୟ ଅପେକ୍ଷା ପ୍ରାୟ 100x ଦ୍ରୁତ ଧ୍ୱନି ଉତ୍ପାଦନ କରିଥାଏ।
ଏହା ପାଇଁ ଉତ୍ତମ: ସର୍ବନିମ୍ନ ବିଳମ୍ବ ସହିତ ଉଚ୍ଚ ଗୁଣବତ୍ତା TTS, ପ୍ରବାହିତ ପ୍ରୟୋଗଗୁଡ଼ିକName
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
Piper Free
Piper ଗୋଟିଏ ହାଲୁକା ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ଯନ୍ତ୍ର ଯାହାକି Rhasspy ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି ଯାହାକି VITS ଏବଂ larynx ସ୍ଥାପତ୍ୟକୁ ବ୍ୟବହାର କରେ। ଏହା ସମ୍ପୂର୍ଣ୍ଣ ଭାବରେ CPU ଉପରେ ଚାଲୁଛି, ଏହାକୁ ଅଂଶ ଉପକରଣ, ଘର ସ୍ୱୟଂଚାଳିତ, ଏବଂ ଅଫଲାଇନ TTS ଆବଶ୍ୟକ କରୁଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ। 30+ ଭାଷାରେ 100ରୁ ଅଧିକ ଧ୍ୱନି ସହିତ, Piper ଗୋଟିଏ Raspberry Pi4ରେ ମଧ୍ୟ ପ୍ରକୃତ ସମୟ ଗତିରେ ପ୍ରାକୃତିକ-ଧ୍ୱନି ବାକ୍ୟ ପ୍ରଦାନ କରେ।
ଏହା ପାଇଁ ଉତ୍ତମ: ଦ୍ରୁତ ପ୍ରାକଦର୍ଶନ, ସୁଗମତା, ଏବଂ ସନ୍ନିବେଶିତ ପ୍ରୟୋଗଗୁଡ଼ିକName
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
VITS Free
VITS (ଏଣ୍ଡ-ଟୁ-ଏଣ୍ଡ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ପାଇଁ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱୀ ଶିକ୍ଷାଦାନ ସହିତ ଭେରିଅନଲ ଇନଫେରେନ୍ସ) ଏକ ସମତଳ ଶେଷ-ରୁ-ଶେଷ TTS ପଦ୍ଧତି ଯାହାକି ପ୍ରଚଳିତ ଦୁଇ-ସ୍ତର ମଡେଲ ଅପେକ୍ଷା ଅଧିକ ପ୍ରାକୃତିକ ଶବ୍ଦ ଧ୍ୱନି ଉତ୍ପାଦନ କରେ। ଏହା ଭେରିଅନଲ ଇନଫେରେନ୍ସକୁ ଗ୍ରହଣ କରେ ଯାହାକି ସାଧାରଣ ପ୍ରବାହ ଏବଂ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱୀ ପ୍ରଶିକ୍ଷଣ ପ୍ରକ୍ରିୟା ସହିତ ବୃଦ୍ଧି ପାଇଥାଏ, ପ୍ରାକୃତିକତାରେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ଉନ୍ନତି ହାସଲ କରିଥାଏ।
ଏହା ପାଇଁ ଉତ୍ତମ: ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ସହିତ ସାଧାରଣ ଉଦ୍ଦେଶ୍ୟ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟName
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
MeloTTS Free
MyShell.ai ଦ୍ଵାରା MeloTTS ଏକ ବହୁଭାଷୀ TTS ଲାଇବ୍ରେରୀ ଯାହାକି ଇଂରାଜୀ (ଆମେରିକୀୟ, ବ୍ରିଟିଶ, ଭାରତୀୟ, ଅଷ୍ଟ୍ରେଲିଆନ), ସ୍ପେନିସ, ଫ୍ରେଞ୍ଚ, ଚାଇନିଜ, ଜାପାନୀ, ଏବଂ କୋରିଆନକୁ ସମର୍ଥନ କରେ। ଏହା ଅତ୍ୟନ୍ତ ଦ୍ରୁତ, କେବଳ CPU ଉପରେ ପାଖାପାଖି ସତ୍ୟକାଳୀନ ବେଗରେ ପାଠ୍ୟକୁ ପ୍ରକ୍ରିୟା କରିଥାଏ। MeloTTS ଉତ୍ପାଦନ ବ୍ୟବହାର ପାଇଁ ନିର୍ମିତ ଏବଂ CPU ଏବଂ GPU ଉଭୟକୁ ସମର୍ଥନ କରେ।
ଏହା ପାଇଁ ଉତ୍ତମ: ଉତ୍ପାଦନ ପ୍ରୟୋଗଗୁଡ଼ିକୁ ଦ୍ରୁତ, ବହୁଭାଷୀ TTS ଆବଶ୍ୟକ
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
Bark Standard
ପରିବର୍ତ୍ତକ ଆଧାରିତ ପାଠ୍ୟ-ରୁ-ଧ୍ୱନି ମଡେଲ ଯାହାକି ବାସ୍ତବବାଦୀ ବକ୍ତବ୍ୟ, ସଂଗୀତ ଏବଂ ଧ୍ୱନି ପ୍ରଭାବ ସୃଷ୍ଟି କରିଥାଏ।
ବିକାଶକାରୀ: Suno · ଅନୁମତିପତ୍ର: MIT
ଚେଷ୍ଟାକରନ୍ତୁ
Bark Small Standard
ଦ୍ରୁତ ଅନୁମାନ ଏବଂ କମ ସ୍ମୃତିସ୍ଥାନ ବ୍ୟବହାର ସହିତ Bark ର ହାଲୁକା ସଂସ୍କରଣ ।
ବିକାଶକାରୀ: Suno · ଅନୁମତିପତ୍ର: MIT
ଚେଷ୍ଟାକରନ୍ତୁ
CosyVoice 2 Standard
ମାନବ-ସମାନ ପ୍ରାକୃତିକତା ଏବଂ ଶୂନ୍ୟ ପାଖାପାଖି ଲାଟେନସି ସହିତ ଅଲିବାବା'ର ମାପଯୋଗ୍ୟ ଷ୍ଟ୍ରିମିଂ TTS।
ବିକାଶକାରୀ: Alibaba (Tongyi Lab) · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
Dia TTS Standard
ବହୁ-ବକ୍ତା ସଂଳାପ ନିର୍ମାଣ ମଡେଲ ଯାହା ବକ୍ତାମାନଙ୍କ ମଧ୍ୟରେ ପ୍ରାକୃତିକ କଥାବାର୍ତ୍ତା ସୃଷ୍ଟି କରେ।
ବିକାଶକାରୀ: Nari Labs · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
Parler TTS Standard
ଆପଣ ପ୍ରାକୃତିକ ଭାଷାରେ ଚାହୁଁଥିବା ଧ୍ୱନିକୁ ବର୍ଣ୍ଣନା କରନ୍ତୁ ଏବଂ ପାର୍ଲର ମେଳଖାଉଥିବା ଭାଷଣ ସୃଷ୍ଟି କରିଥାଏ।
ବିକାଶକାରୀ: Hugging Face · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
GLM-TTS Standard
ମୁକ୍ତ ଉତ୍ସ TTS ନମୂନାଗୁଡ଼ିକ ମଧ୍ୟରେ ସର୍ବନିମ୍ନ ଅକ୍ଷର ତ୍ରୁଟି ହାରକୁ ହାସଲ କରିଥାଏ।
ବିକାଶକାରୀ: Zhipu AI · ଅନୁମତିପତ୍ର: GLM-4 License
ଚେଷ୍ଟାକରନ୍ତୁ
IndexTTS-2 Standard
ଶୂନ୍ୟ-ଶଟ TTS ଫାଇନ-ଗ୍ରେନ ଇମୋସନ ନିୟନ୍ତ୍ରଣ ଏବଂ ଉଚ୍ଚ ଅଭିବ୍ୟକ୍ତିଶୀଳତା ସହିତ ।
ବିକାଶକାରୀ: Index Team · ଅନୁମତିପତ୍ର: Bilibili Model License
ଚେଷ୍ଟାକରନ୍ତୁ
Spark TTS Standard
ନିୟନ୍ତ୍ରଣଯୋଗ୍ୟ ଅନୁଭୂତି ଏବଂ ପରାମର୍ଶ ମାଧ୍ୟମରେ କଥାବାର୍ତ୍ତା ଶୈଳୀ ସହିତ ଧ୍ୱନି କ୍ଲୋନ TTS।
ବିକାଶକାରୀ: SparkAudio · ଅନୁମତିପତ୍ର: CC BY-NC-SA 4.0
ଚେଷ୍ଟାକରନ୍ତୁ
GPT-SoVITS Standard
କିଛି-ଶଟ ସ୍ୱର କ୍ଲୋନ TTS ଯାହାକି କେବଳ5ସେକେଣ୍ଡ ଧ୍ୱନିରୁ ଯେକୌଣସି ସ୍ୱରକୁ ନକଲ କରିଥାଏ।
ବିକାଶକାରୀ: RVC-Boss · ଅନୁମତିପତ୍ର: MIT
ଚେଷ୍ଟାକରନ୍ତୁ
Orpheus Standard
100K ଘଣ୍ଟା ବାକ୍ୟ ତଥ୍ୟ ଉପରେ ପ୍ରଶିକ୍ଷିତ ମାନବ ସ୍ତରୀୟ ଭାବଗତ TTS ମଡେଲ ।
ବିକାଶକାରୀ: Canopy Labs · ଅନୁମତିପତ୍ର: Llama 3.2 Community
ଚେଷ୍ଟାକରନ୍ତୁ
Qwen3 TTS Standard
ଆଲିବାବାର ବହୁଭାଷୀ TTS ଧ୍ୱନି କ୍ଲୋନିଂ ସହିତ, ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଧ୍ୱନି, ଏବଂ ପାଠ୍ୟରୁ ଧ୍ୱନି ଡିଜାଇନ।
ବିକାଶକାରୀ: Alibaba (Qwen) · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
CosyVoice 2
ମାନବ-ସମାନ ପ୍ରାକୃତିକତା ଏବଂ ଶୂନ୍ୟ ପାଖାପାଖି ଲାଟେନସି ସହିତ ଅଲିବାବା'ର ମାପଯୋଗ୍ୟ ଷ୍ଟ୍ରିମିଂ TTS।
ଭାଷା: en, zh, ja, ko, fr, de, it, es
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
GLM-TTS
ମୁକ୍ତ ଉତ୍ସ TTS ନମୂନାଗୁଡ଼ିକ ମଧ୍ୟରେ ସର୍ବନିମ୍ନ ଅକ୍ଷର ତ୍ରୁଟି ହାରକୁ ହାସଲ କରିଥାଏ।
ଭାଷା: en, zh
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
IndexTTS-2
ଶୂନ୍ୟ-ଶଟ TTS ଫାଇନ-ଗ୍ରେନ ଇମୋସନ ନିୟନ୍ତ୍ରଣ ଏବଂ ଉଚ୍ଚ ଅଭିବ୍ୟକ୍ତିଶୀଳତା ସହିତ ।
ଭାଷା: en, zh
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Spark TTS
ନିୟନ୍ତ୍ରଣଯୋଗ୍ୟ ଅନୁଭୂତି ଏବଂ ପରାମର୍ଶ ମାଧ୍ୟମରେ କଥାବାର୍ତ୍ତା ଶୈଳୀ ସହିତ ଧ୍ୱନି କ୍ଲୋନ TTS।
ଭାଷା: en, zh
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
GPT-SoVITS
କିଛି-ଶଟ ସ୍ୱର କ୍ଲୋନ TTS ଯାହାକି କେବଳ5ସେକେଣ୍ଡ ଧ୍ୱନିରୁ ଯେକୌଣସି ସ୍ୱରକୁ ନକଲ କରିଥାଏ।
ଭାଷା: en, zh, ja, ko
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Chatterbox
Resemble AI ଠାରୁ ଆବେଗ ନିୟନ୍ତ୍ରଣ ସହିତ state-of-the-art ଶୂନ୍ୟ-ଶଟ ସ୍ୱର କ୍ଲୋନିଂ ।
ଭାଷା: en
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Tortoise TTS
ବହୁ-ଭାଷା ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ଗୁଣବତ୍ତା ଉପରେ ଆଧାରିତ ଅଟୋ-ରିଗ୍ରେସିଭ ଢାଞ୍ଚା ସହିତ ।
ଭାଷା: en
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
OpenVoice
ଶୈଳୀ, ଅନୁଭୂତି, ଏବଂ ଉଚ୍ଚାରଣ ଉପରେ ଗ୍ରାନୁଲାର ନିୟନ୍ତ୍ରଣ ସହିତ ତୁରନ୍ତ ସ୍ୱର କ୍ଲୋନିଂ।
ଭାଷା: en, zh, ja, ko, fr, de, es, it
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Qwen3 TTS
ଆଲିବାବାର ବହୁଭାଷୀ TTS ଧ୍ୱନି କ୍ଲୋନିଂ ସହିତ, ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଧ୍ୱନି, ଏବଂ ପାଠ୍ୟରୁ ଧ୍ୱନି ଡିଜାଇନ।
ଭାଷା: en, zh, ja, ko, de, fr, ru, pt, es, it
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁବିକାଶକାରୀ- ପ୍ରଥମ API
OpenAI-ସହଜ REST API. ଗୋଟିଏ ଶେଷ ବିନ୍ଦୁ, 22+ ନମୂନା. ରିୟଲ-ଟାଇମ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଷ୍ଟ୍ରିମିଂ ସମର୍ଥନ।
- OpenAI- ସୁସଂଗତ ଶୈଳୀ
- ରିଅଲ-ଟାଇମ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ TTS ପ୍ରବାହ
- ବଡ଼ କାର୍ଯ୍ୟଗୁଡ଼ିକ ପାଇଁ ବ୍ୟାଚ ପ୍ରକ୍ରିୟାକରଣ
- Webhook ବିଜ୍ଞପ୍ତିଗୁଡ଼ିକ
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ସରଳ, ପାରଦର୍ଶୀ ମୂଲ୍ୟାଙ୍କନ
ମୁକ୍ତ ଭାବରେ ଆରମ୍ଭ କରନ୍ତୁ । ଆପଣ ବଢିବା ସମୟରେ ମାପନ୍ତୁ ।
ମୁକ୍ତ
15 କ୍ରିଡ଼େଟ
- Kokoro, Piper, VITS, MeloTTS
- 500 ଅକ୍ଷର ସୀମା
- 3 ଜେନ/ଘଣ୍ଟା (କୌଣସି ଖାତା ନାହିଁ)
ଆରମ୍ଭକର୍ତ୍ତା
500 ଋଣ/ମାସ
- ସମସ୍ତ 22+ ଆକାର
- 100,000 chars per generation
- ଧ୍ୱନି କ୍ଲୋନିଂName
ପ୍ରୋ
2,000 ଋଣ/ମାସ
- ଆରମ୍ଭକର୍ତ୍ତାରେ ସବୁକିଛି
- API ସୁଗମତା
- ପ୍ରାଥମିକତା ପ୍ରକ୍ରିୟାକରଣ
ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName
AI ଧ୍ୱନି ବ୍ୟବହାର କରିବା ଆଜି ଆରମ୍ଭ କରନ୍ତୁ
TTS.ai ବ୍ୟବହାର କରି ନିର୍ମାତା, ବିକାଶକାରୀ ଏବଂ ବ୍ୟବସାୟରେ ଯୋଗ ଦିଅନ୍ତୁ