ମୁକ୍ତ ଉତ୍ସ ପାଠ୍ୟରୁ ବାକ୍ୟ ମଡେଲଗୁଡ଼ିକName

ଆମ ପ୍ଲାଟଫର୍ମର ପ୍ରତ୍ୟେକ TTS ମଡେଲ ବାଣିଜ୍ୟିକ-ସହଜ ଲାଇସେନ୍ସ ସହିତ ମୁକ୍ତ ଉତ୍ସ । MIT, Apache 2.0 — କୌଣସି ସ୍ୱତନ୍ତ୍ର ଲକ୍-ଇନ ନାହିଁ, କୌଣସି ବ୍ୟବହାର ପ୍ରତିବନ୍ଧକ ନାହିଁ, କୌଣସି ଆଶ୍ଚର୍ଯ୍ୟଜନକ ଲାଇସେନ୍ସିଂ ଫି ନାହିଁ । ଏହାକୁ ଆମର ହୋଷ୍ଟ API ମାଧ୍ୟମରେ ବ୍ୟବହାର କରନ୍ତୁ, କିମ୍ବା ସମ୍ପୂର୍ଣ୍ଣ ନିୟନ୍ତ୍ରଣ ସହିତ ଆପଣଙ୍କ ନିଜ ଭିତ୍ତିଭୂମିରେ ସ୍ୱୟଂ-ହୋଷ୍ଟ କରନ୍ତୁ ।

ମୁକ୍ତ ଉତ୍ସName MIT ଅନୁମତିପତ୍ର ଆପାଚିName ସ୍ୱୟଂ-ହୋଷ୍ଟେବଲ GitHub ରେ

ବର୍ତ୍ତମାନ ଚେଷ୍ଟାକରନ୍ତୁ

Kokoro, Piper, VITS, MeloTTS ସହିତ ମୁକ୍ତ
ଆପଣଙ୍କର ନିର୍ମିତ ଧ୍ୱନି ଏଠାରେ ଦର୍ଶାଯିବ
ସୃଷ୍ଟିକର୍ତ୍ତା
ଆହରଣ କରନ୍ତୁ
TTS.ai କୁ ଭଲପାଆନ୍ତି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ମୁକ୍ତ ଉତ୍ସ TTS ଲାଭଗୁଡ଼ିକ

ଆପଣଙ୍କ ପ୍ରକଳ୍ପ ପାଇଁ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ କାହିଁକି ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ

ସମସ୍ତ ମୁକ୍ତ ଉତ୍ସ ଲାଇସେନ୍ସିତ

TTS.ai ରେ ପ୍ରତ୍ୟେକ ମଡେଲ ଗୋଟିଏ ଅନୁମତିପ୍ରାପ୍ତ ମୁକ୍ତ ଉତ୍ସ ଲାଇସେନ୍ସ ବ୍ୟବହାର କରେ । କୌଣସି ସ୍ୱତନ୍ତ୍ର କଳା ବାକ୍ସ ନାହିଁ, କୌଣସି ବିକ୍ରେତା ଲକ୍-ଇନ ନାହିଁ, କୌଣସି ଅପ୍ରତ୍ୟାଶିତ ଲାଇସେନ୍ସିଂ ଫି ନାହିଁ ।

MIT / Apache 2.0

ନମୂନାଗୁଡ଼ିକ MIT କିମ୍ବା Apache 2.0, ସବୁଠାରୁ ଅଧିକ ଅନୁମତିପ୍ରଦାନକାରୀ ମୁକ୍ତ ଉତ୍ସ ଲାଇସେନ୍ସ ଅନ୍ତର୍ଗତ ଲାଇସେନ୍ସିତ। ବାଣିଜ୍ୟିକ ଭାବେ ବ୍ୟବହାର କରନ୍ତୁ, ପରିବର୍ତ୍ତନ କରନ୍ତୁ, ପୁନଃବଣ୍ଟନ କରନ୍ତୁ - କୌଣସି ପ୍ରତିବନ୍ଧକ ନାହିଁ।

ସ୍ୱୟଂ-ହୋଷ୍ଟେବଲ

କୌଣସି ନମୂନାକୁ ଆହରଣ କରନ୍ତୁ ଏବଂ ଏହାକୁ ଆପଣଙ୍କର ନିଜ ହାର୍ଡୱେରରେ ଚଲାନ୍ତୁ। ଆପଣଙ୍କର ତଥ୍ୟ, ଲାଟେନସି ଏବଂ ଭିତ୍ତିଭୂମି ଉପରେ ସମ୍ପୂର୍ଣ୍ଣ ନିୟନ୍ତ୍ରଣ ରଖନ୍ତୁ। କୌଣସି କ୍ଳାଉଡ ନିର୍ଭରତା ଆବଶ୍ୟକ ନାହିଁ।

GPU ସୁସଜ୍ଜିତ

CUDA ସମର୍ଥନ ସହିତ NVIDIA GPUs ପାଇଁ ନମୂନାଗୁଡ଼ିକୁ ଅନୁକୂଳିତ କରାଯାଇଛି। Piper କେବଳ CPU ଉପରେ ଚଲାଇଥାଏ। ଅଧିକାଂଶ ନମୂନାଗୁଡ଼ିକୁ ଶକ୍ତିଶୀଳ ଅନୁମାନ ପାଇଁ 2-8GB VRAM ଆବଶ୍ୟକ।

ସମୁଦାୟ ପରିଚାଳିତ

ସକ୍ରିୟ ମୁକ୍ତ ଉତ୍ସ ସମୁଦାୟଗୁଡ଼ିକ ଏହି ନମୂନାଗୁଡ଼ିକୁ ପରିଚାଳନା କରନ୍ତି ଏବଂ ଉନ୍ନତ କରନ୍ତି । ଯୋଗଦାନକୁ ସ୍ୱାଗତ କରାଯାଏ — ତ୍ରୁଟିଗୁଡ଼ିକୁ ଦାଖଲ କରନ୍ତୁ, ଉନ୍ନତି, ଏବଂ GitHub ରେ ନୂତନ ସ୍ୱର ।

ବାଣିଜ୍ୟିକ ଉପଯୋଗ ଠିକ ଅଛି

ସମସ୍ତ ମଡେଲଗୁଡ଼ିକ ସେମାନଙ୍କର ଲାଇସେନ୍ସ ଅଧୀନରେ ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ । ଉତ୍ପାଦ ନିର୍ମାଣ କରନ୍ତୁ, ସେବା ବିକ୍ରି କରନ୍ତୁ, ଏବଂ ବାଣିଜ୍ୟିକ ବିଷୟବସ୍ତୁ ନିର୍ମାଣ କରନ୍ତୁ ଯାହାର କୌଣସି ରୟାଲଟି କିମ୍ବା ବ୍ୟବହାର ଫି ନାହିଁ ।

ଆମର ମୁକ୍ତ ଉତ୍ସ ମଡେଲ ତାଲିକା

ପ୍ରତ୍ୟେକ ମଡେଲ, ଏହାର ଲାଇସେନ୍ସ ଏବଂ ଏହା ସବୁଠାରୁ ଭଲ ଭାବେ କଣ କରିଥାଏ

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

ଏହା ପାଇଁ ଉତ୍ତମ: Apache 2. 0 — ଶ୍ରେଷ୍ଠ ଗୁଣବତ୍ତା ମୁକ୍ତ ନମୁନା, 82M ପରିମାପକ, ସ୍ୱୟଂ- ହୋଷ୍ଟ କରିବା ପାଇଁ ସହଜName

ଚେଷ୍ଟାକରନ୍ତୁ Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

ଏହା ପାଇଁ ଉତ୍ତମ: MIT — CPU- କେବଳ, ଅଂଶ ଉପକରଣ ଏବଂ ସନ୍ନିବେଶିତ ସ୍ୱୟଂ- ହୋଷ୍ଟିଂ ପାଇଁ ସମ୍ପୂର୍ଣ୍ଣ

ଚେଷ୍ଟାକରନ୍ତୁ Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

ଏହା ପାଇଁ ଉତ୍ତମ: MIT – ଅନେକ ଡାଉନଷ୍ଟ୍ରିମ ମଡେଲ ଦ୍ୱାରା ବ୍ୟବହୃତ ଭିତ୍ତିଭୂମି ସ୍ଥାପନା

ଚେଷ୍ଟାକରନ୍ତୁ VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

ଏହା ପାଇଁ ଉତ୍ତମ: MIT — ମାନକ TTS ଠାରୁ ଅଧିକ ଅଲଗା ଧ୍ୱନି ଉତ୍ପାଦନ କ୍ଷମତା

ଚେଷ୍ଟାକରନ୍ତୁ Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 ଧ୍ୱନି କ୍ଲୋନିଂName

ଏହା ପାଇଁ ଉତ୍ତମ: Apache 2. 0 — ସର୍ବାଧିକ ଗୁଣବତ୍ତା, ବ୍ୟାପକ ଭାବରେ ଅଧ୍ୟୟନ କରାଯାଇଥିବା ସମ୍ବଳ କାର୍ଯ୍ୟକାରୀତାName

ଚେଷ୍ଟାକରନ୍ତୁ Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 ଧ୍ୱନି କ୍ଲୋନିଂName

ଏହା ପାଇଁ ଉତ୍ତମ: MIT — ମୁକ୍ତ-ସଂରକ୍ଷିତ ସ୍ୱର କ୍ଲୋନିଂ, ଗ୍ରେନାଲ ଶୈଳୀ ନିୟନ୍ତ୍ରଣ ସହିତName

ଚେଷ୍ଟାକରନ୍ତୁ OpenVoice

ମୁକ୍ତ ଉତ୍ସ TTS କୁ କିପରି ବ୍ୟବହାର କରିବେ

ଆମର ହୋଷ୍ଟ API କୁ ବ୍ୟବହାର କରନ୍ତୁ କିମ୍ବା ଆପଣ ନିଜେ ନମୂନାକୁ ଚଲାନ୍ତୁ

1

ମୁକ୍ତ ଉତ୍ସ ମଡେଲଗୁଡ଼ିକୁ ଅନୁସନ୍ଧାନ କରନ୍ତୁ

20+ ମୁକ୍ତ ଉତ୍ସ TTS ମଡେଲର ଆମ କ୍ୟାଟାଲଗକୁ ବ୍ରାଉଜ କରନ୍ତୁ। ପ୍ରତ୍ୟେକ ମଡେଲ ପୃଷ୍ଠା ଲାଇସେନ୍ସ, ଢାଞ୍ଚା, କ୍ଷମତା, ଏବଂ ସ୍ୱୟଂ-ହୋଷ୍ଟିଂ ଆବଶ୍ୟକତାକୁ ଦର୍ଶାଇଥାଏ।

2

ଆପଣଙ୍କ ବ୍ରାଉଜରରେ ଚେଷ୍ଟାକରନ୍ତୁ

କିଛି ସ୍ଥାପନ ନକରି TTS.ai ରେ ପ୍ରତ୍ୟେକ ମଡେଲକୁ ସିଧାସଳଖ ପରୀକ୍ଷଣ କରନ୍ତୁ। ଆମର GPU ସର୍ଭରଗୁଡ଼ିକ ପ୍ରକ୍ରିୟାକରଣକୁ ନିୟନ୍ତ୍ରଣ କରିଥାଏ ତେଣୁ ଆପଣ ସ୍ୱୟଂ-ହୋଷ୍ଟିଂ ପାଇଁ ପ୍ରତିଶ୍ରୁତିବଦ୍ଧ ହେବା ପୂର୍ବରୁ ଗୁଣବତ୍ତାକୁ ଆକଳନ କରିପାରିବେ।

3

ସ୍ୱୟଂ-ହୋଷ୍ଟ କିମ୍ବା ଆମ API ବ୍ୟବହାର କରନ୍ତୁ

GitHub ରୁ ନମୂନା ରିପୋକୁ କ୍ଲୋନ କରନ୍ତୁ ଏବଂ ସ୍ଥାନୀୟ ଭାବରେ ଚଲାନ୍ତୁ, କିମ୍ବା ଉତ୍ପାଦନ ପାଇଁ ଆମର ହୋଷ୍ଟ API କୁ ବ୍ୟବହାର କରନ୍ତୁ। ସ୍ୱୟଂ-ହୋଷ୍ଟିଂ ସମ୍ପୂର୍ଣ୍ଣ ନିୟନ୍ତ୍ରଣ ପ୍ରଦାନ କରେ; ଆମର API ପରିଚାଳିତ ଭିତ୍ତିଭୂମି ପ୍ରଦାନ କରେ।

4

ଆପଣଙ୍କର ପ୍ରୟୋଗକୁ ନିର୍ମାଣ କରନ୍ତୁName

TTSକୁ ଆପଣଙ୍କ ଉତ୍ପାଦରେ ସ୍ୱୟଂ-ହୋଷ୍ଟ ମଡେଲ କିମ୍ବା ଆମର REST API ବ୍ୟବହାର କରି ଏକୀକୃତ କରନ୍ତୁ । ସମସ୍ତ ମଡେଲଗୁଡ଼ିକ କୌଣସି ଲାଇସେନ୍ସିଂ ଫୀସ କିମ୍ବା ରେୟାଲଟି ବିନା ବାଣିଜ୍ୟିକ ଭାବେ ବ୍ୟବହାରଯୋଗ୍ୟ ।

ଲାଇସେନ୍ସ ତୁଳନା

TTS.ai ରେ ସମସ୍ତ ଆକାର ବାଣିଜ୍ୟିକ-ସହଜ ମୁକ୍ତ-ସୋର ଲାଇସେନ୍ସ ବ୍ୟବହାର କରନ୍ତୁ

ଆକାର ଅନୁମତିପତ୍ର ବାଣିଜ୍ୟିକ ଉପଯୋଗ ପରିବର୍ତ୍ତନ ସ୍ୱୟଂ-ହୋଷ୍ଟ ଯୋଗଦାନ
Kokoro Apache 2.0 ଆବଶ୍ୟକୀୟ
Piper MIT ଇଚ୍ଛାଧୀନ
VITS MIT ଇଚ୍ଛାଧୀନ
MeloTTS MIT ଇଚ୍ଛାଧୀନ
Chatterbox MIT ଇଚ୍ଛାଧୀନ
Tortoise TTS Apache 2.0 ଆବଶ୍ୟକୀୟ
StyleTTS 2 MIT ଇଚ୍ଛାଧୀନ
OpenVoice MIT ଇଚ୍ଛାଧୀନ
Sesame CSM Apache 2.0 ଆବଶ୍ୟକୀୟ
Orpheus Llama 3.2 "Built with Llama"

ସ୍ୱୟଂ-ହୋଷ୍ଟିଂ ବିରୁଦ୍ଧରେ ହୋଷ୍ଟ API

ଆପଣ ନିଜେ ନମୂନା ଚଲାନ୍ତୁ କିମ୍ବା ଆମକୁ ଭିତ୍ତିଭୂମି ପରିଚାଳନା କରିବାକୁ ଦିଅନ୍ତୁ

ଆପଣଙ୍କର ହାର୍ଡୱେରରେ ସ୍ୱୟଂ-ହୋଷ୍ଟ କରନ୍ତୁ

TTS.ai ରେ ପ୍ରତ୍ୟେକ ନମୂନା GitHub କିମ୍ବା Hugging Face ରେ ଗୋଟିଏ ମୁକ୍ତ ଉତ୍ସ ପ୍ରକଳ୍ପ ଭାବରେ ଉପଲବ୍ଧ ଅଛି। ଓଜନଗୁଡ଼ିକୁ ଡାଉନଲୋଡ କରନ୍ତୁ, ନିର୍ଭରତାଗୁଡ଼ିକୁ ସ୍ଥାପନ କରନ୍ତୁ, ଏବଂ ଆପଣଙ୍କର ନିଜ GPUs ରେ ଅନୁମାନ ଚଲାନ୍ତୁ। ଆପଣଙ୍କର ଲାଟେନସି, ଗୋପନୀୟତା ଏବଂ ମାପ ଉପରେ ସମ୍ପୂର୍ଣ୍ଣ ନିୟନ୍ତ୍ରଣ ଅଛି।

  • ସମ୍ପୂର୍ଣ୍ଣ ତଥ୍ୟ ଗୋପନୀୟତା — ଧ୍ୱନି ଆପଣଙ୍କର ସର୍ଭରକୁ କେବେ ବି ଛାଡ଼େ ନାହିଁ
  • ପ୍ରାରମ୍ଭିକ ବିନ୍ୟାସ ପରେ କୌଣସି ପ୍ରତି-ଆବେଦନ ମୂଲ୍ୟ ନାହିଁ
  • ଆପଣଙ୍କର ନିଜ ତଥ୍ୟ ଉପରେ ଇଚ୍ଛାରୂପଣ ସଜାଗତା
  • GPU ହାର୍ଡ଼ୱେର ଆବଶ୍ୟକ (NVIDIA ସୁପାରିଶ)
  • ଆପଣ ଅଦ୍ୟତନଗୁଡ଼ିକୁ ପରିଚାଳନା କରନ୍ତୁ, ମାପନ୍ତୁ, ଏବଂ ନିର୍ଭରତାଗୁଡ଼ିକୁ

TTS.ai ହୋଷ୍ଟ API ବ୍ୟବହାର କରନ୍ତୁ

ଗୋଟିଏ REST API ମାଧ୍ୟମରେ ସମସ୍ତ 20+ ନମୁନାକୁ ତୁରନ୍ତ ପ୍ରବେଶ କରନ୍ତୁ। ଆମେ GPU ପ୍ରଦାନ, ନମୁନା ଅଦ୍ୟତନ, ଧାଡ଼ି ପରିଚାଳନା ଏବଂ ମାପକୁ ନିୟନ୍ତ୍ରଣ କରୁ। ଗୋଟିଏ API କି ଆପଣଙ୍କୁ ପ୍ରତ୍ୟେକ ନମୁନାକୁ ପ୍ରବେଶ କରିବାର ସୁଯୋଗ ଦେଇଥାଏ - ବିଭିନ୍ନ ବିସ୍ତାର ପରିଚାଳନା କରିବାର ଆବଶ୍ୟକତା ନାହିଁ।

  • କୌଣସି GPU ହାର୍ଡୱେର ଆବଶ୍ୟକ ନାହିଁ
  • ଗୋଟିଏ API ମାଧ୍ୟମରେ ସମସ୍ତ 20+ ନମୂନା
  • ସ୍ୱୟଂଚାଳିତ ନମୁନା ଅଦ୍ୟତନ ଏବଂ ଉନ୍ନତି
  • ଅତ୍ୟଧିକ ଭିତ୍ତିଭୂମି ସହିତ 99.9% ଅପଟାଇମ
  • କେବଳ ଆପଣ ବ୍ୟବହାର କରୁଥିବା ପାଇଁ ପଇସା ଦିଅନ୍ତୁ

ଦ୍ରୁତ ଆରମ୍ଭ: API କିମ୍ବା Self-Host

ଆମର ହୋଷ୍ଟ API କୁ ବ୍ୟବହାର କରନ୍ତୁ, କିମ୍ବା Kokoro କୁ ମିନିଟଗୁଡ଼ିକରେ ସ୍ଥାନୀୟ ଭାବରେ ସ୍ଥାପନ କରନ୍ତୁ

ବିକଳ୍ପ 1: TTS.ai ହୋଷ୍ଟ API ସବୁଠାରୁ ସହଜ
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
ବିକଳ୍ପ 2: pip ସହିତ Self-Host ସମ୍ପୂର୍ଣ୍ଣ ନିୟନ୍ତ୍ରଣ
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

ମୁକ୍ତ ଉତ୍ସ, ସୁଲଭ ମୂଲ୍ୟ

ଆମର ହୋଷ୍ଟ API GPUs ପରିଚାଳନା ନକରି ମୁକ୍ତ ଉତ୍ସ TTS ସୁଗମ କରିଥାଏ ।

ମୁକ୍ତ ସ୍ତର

$0

ପଞ୍ଜୀକରଣ ସମୟରେ 15 ୟୁରୋ

  • 4 ମୁକ୍ତ ଉତ୍ସ ମଡେଲ ମୁକ୍ତ
  • ମୂଳ ବ୍ୟବହାର ପାଇଁ କୌଣସି ସଦସ୍ୟତା ନାହିଁ
  • ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦିଅନ୍ତୁ

ଆରମ୍ଭକର୍ତ୍ତା

$9

500,000 ଅକ୍ଷର/ମାସ

  • ସମସ୍ତ 20+ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ
  • ଧ୍ୱନି କ୍ଲୋନିଂ
  • API ଅଭିଗମ୍ୟତା

ପ୍ରୋ

$29

2,000,000 ଅକ୍ଷର/ମାସ

  • ଅଗ୍ରତା GPU ପ୍ରକ୍ରିୟାକରଣ
  • ସମସ୍ତ ପ୍ରୀମିୟମ ନମୂନା
  • କମ୍ପାନୀ ସମର୍ଥନ
ସମ୍ପୂର୍ଣ୍ଣ ମୂଲ୍ୟାଙ୍କନ ଦେଖନ୍ତୁ

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

ମୁକ୍ତ ଉତ୍ସ ପାଠ୍ୟରୁ ଭାଷଣ ବିଷୟରେ ସାଧାରଣ ପ୍ରଶ୍ନଗୁଡ଼ିକ

ହଁ। TTS.ai ରେ ପ୍ରତ୍ୟେକ ମଡେଲ ଗୋଟିଏ ଅନୁମତିପ୍ରାପ୍ତ ମୁକ୍ତ ଉତ୍ସ ଲାଇସେନ୍ସକୁ ବ୍ୟବହାର କରେ - MIT କିମ୍ବା Apache 2.0. ଆମେ ନିର୍ଦ୍ଦିଷ୍ଟ ଭାବରେ ପ୍ରତିବନ୍ଧକ ଲାଇସେନ୍ସ ସହିତ ମଡେଲଗୁଡ଼ିକୁ ବାଦ୍ ଦେଉଛୁ (ଯେପରିକି Coqui's CPML କିମ୍ବା ଅବାଣିଜ୍ୟିକ CC-BY-NC)। ଆପଣ GitHub ରିପୋଜିଟୋରୀରେ ପ୍ରତ୍ୟେକ ମଡେଲର ଲାଇସେନ୍ସକୁ ଯାଞ୍ଚ କରିପାରିବେ।

ଉଭୟ ଅନୁମତିପ୍ରଦ ମୁକ୍ତ-ସଂରକ୍ଷିତ ଲାଇସେନ୍ସ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର, ପରିବର୍ତ୍ତନ ଏବଂ ପୁନଃବଂଟନକୁ ଅନୁମତି ଦେଇଥାଏ । Apache 2.0ସ୍ପଷ୍ଟ ପେଟେଣ୍ଟ ଅନୁମତି ଯୋଗକରେ ଏବଂ ପରିବର୍ତ୍ତନଗୁଡ଼ିକୁ ସ୍ପଷ୍ଟ କରିବା ଆବଶ୍ୟକ ଯଦି ଆପଣ ସଂକେତକୁ ପରିବର୍ତ୍ତନ କରନ୍ତି । MIT କମ ଆବଶ୍ୟକତା ସହିତ ସରଳ ଅଟେ । ଉଭୟ ବ୍ୟବସାୟ-ସହଜ ।

ହଁ. ପ୍ରତ୍ୟେକ ନମୁନାକୁ ସ୍ୱୟଂ-ହୋଷ୍ଟ କରାଯାଇପାରିବ। GitHub ରୁ ନମୁନା ରିପୋଜିଟରୀକୁ କ୍ଲୋନ କରନ୍ତୁ, ନିର୍ଭରତାଗୁଡ଼ିକୁ ସ୍ଥାପନ କରନ୍ତୁ, ନମୁନା ଓଜନକୁ ଆହରଣ କରନ୍ତୁ, ଏବଂ ଅନୁମାନ କରନ୍ତୁ। GPU, RAM, ଏବଂ Python ସଂସ୍କରଣ ସମେତ ପ୍ରତ୍ୟେକ ନମୁନାର ସ୍ୱୟଂ-ହୋଷ୍ଟିଂ ଆବଶ୍ୟକତା ପାଇଁ ଆମେ ଦଲିଲ ପ୍ରଦାନ କରୁଛୁ।

ଆବଶ୍ୟକତାଗୁଡ଼ିକ ମଡେଲ ଅନୁଯାୟୀ ପରିବର୍ତ୍ତିତ ହୋଇଥାଏ। Piper ପାଇଁ କୌଣସି GPU ଆବଶ୍ୟକ ନାହିଁ (କେବଳ CPU)। Kokoro ଏବଂ MeloTTS ପାଇଁ 1-2GB VRAM ଆବଶ୍ୟକ। ଅଧିକାଂଶ ମାନକ ମଡେଲ ପାଇଁ 4GB VRAM ଆବଶ୍ୟକ। Tortoise ଏବଂ Sesame CSM ପାଇଁ 8GB ଆବଶ୍ୟକ। ଗୋଟିଏ NVIDIA RTX 3060 (12GB) ଅଧିକାଂଶ ମଡେଲକୁ ଆରାମରେ ଚାଲାଇପାରେ।

ହଁ। ମୁକ୍ତ ଉତ୍ସ ଲାଇସେନ୍ସଗୁଡ଼ିକ ଫାଇନ-ଟୁନିଙ୍ଗ ସମେତ ପରିବର୍ତ୍ତନକୁ ଅନୁମତି ଦେଇଥାଏ। GPT-SoVITS ଏବଂ Bark ଭଳି ନମୂନାଗୁଡ଼ିକ ଫାଇନ-ଟୁନିଙ୍ଗ ସ୍କ୍ରିପ୍ଟଗୁଡ଼ିକୁ ପ୍ରଦାନ କରିଥାଏ। ଆପଣ ନିଜ ସ୍ୱର ତଥ୍ୟରେ ନମୂନାଗୁଡ଼ିକୁ ତାଲିମ ଦେଇପାରିବେ ଇଚ୍ଛାମୁତାବକ ସ୍ୱରଗୁଡ଼ିକୁ ନିର୍ମାଣ କରିବା ପାଇଁ କିମ୍ବା ନିର୍ଦ୍ଦିଷ୍ଟ ଭାଷାଗୁଡ଼ିକ ପାଇଁ କାର୍ଯ୍ୟଦକ୍ଷତାକୁ ବୃଦ୍ଧି କରିବା ପାଇଁ।

ଶ୍ରେଷ୍ଠ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ (କୋକୋରୋ, ଷ୍ଟାଇଲଟିଟିଏସ ୨, ଚାଟରବକ୍ସ) ଏବେ ଗୁଣବତ୍ତା କ୍ଷେତ୍ରରେ ଇଲେଭେନଲେବ୍ସ ଏବଂ ଗୁଗୁଲ ଟିଟିଏସ ଭଳି ବାଣିଜ୍ୟିକ ସେବା ସହିତ ମେଳ ଖାଉଛି କିମ୍ବା ତାହାକୁ ଅତିକ୍ରମ କରୁଛି ।

ଆମେ ପୂର୍ବରୁ ସେମାନଙ୍କୁ ବାଦ୍ ପକାଇଛୁ। XTTS/XTTS-v2 (Coqui's CPML — ବାଣିଜ୍ୟିକ ନୁହେଁ), F5-TTS (CC-BY-NC — ବାଣିଜ୍ୟିକ ନୁହେଁ), ଏବଂ Higgs-v2 (ବୋସନ ଲାଇସେନ୍ସ — ପ୍ରତିବନ୍ଧକ) ସମସ୍ତଙ୍କୁ ହଟାଯାଇଅଛି। TTS.ai ରେ ପ୍ରତ୍ୟେକ ନମୂନାକୁ ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ନିରାପଦ ଭାବରେ ଯାଞ୍ଚ କରାଯାଇଛି।

ହଁ। ଅଧିକାଂଶ ମଡେଲ GitHub ମାଧ୍ୟମରେ ସମୁଦାୟ ଯୋଗଦାନକୁ ଗ୍ରହଣ କରିଥାଏ। ଆପଣ ତ୍ରୁଟି ବିବରଣୀ, ନୂତନ ଭାଷାଗୁଡ଼ିକ ପାଇଁ ସ୍ୱର ରେକର୍ଡିଂ, କୋଡ ଉନ୍ନତି, ଏବଂ ଦଲିଲ ଦାଖଲ କରିପାରିବେ। ଯୋଗଦାନ ମାର୍ଗଦର୍ଶିକା ଏବଂ ସକ୍ରିୟ ପ୍ରସଙ୍ଗଗୁଡ଼ିକ ପାଇଁ ପ୍ରତ୍ୟେକ ମଡେଲର GitHub ରିପୋଜିଟୋରୀ ଯାଞ୍ଚ କରନ୍ତୁ।

GPU ସ୍ମୃତିଭାଗ କରିବା ପାଇଁ ଚାହିଦା ଅନୁଯାୟୀ ମଡେଲଗୁଡ଼ିକୁ ଧାରଣ କରନ୍ତୁ ଏବଂ ନିଷ୍କ୍ରିୟ ସମୟରେ ଅଧାରଣ କରନ୍ତୁ। ଆମର GPU ସର୍ଭର 4x Tesla P40 (96GB ମୋଟ VRAM) ରେ 20+ ମଡେଲକୁ ଗତିଶୀଳ ଧାରଣ ବ୍ୟବହାର କରି ଚାଲାଇଥାଏ। ସ୍ୱୟଂ-ହୋଷ୍ଟିଂ ପାଇଁ, ଗୋଟିଏ 24GB GPU 3-5 ମଡେଲକୁ ଏକସଙ୍ଗେ ସେବା ଦେଇପାରେ।

ଅନେକ ମଡେଲ ସରକାରୀ Docker ପ୍ରତିଛବି କିମ୍ବା Dockerfiles ପ୍ରଦାନ କରିଥାଏ। ଏକାଧିକ ମଡେଲକୁ ଚଲାଇବା ପାଇଁ, ଆପଣ GPU ସୁବିଧା ପାଇଁ NVIDIA Container Toolkit ସହିତ ଗୋଟିଏ ଇଚ୍ଛାରୂପୀ Docker ବିନ୍ୟାସ ନିର୍ମାଣ କରିପାରିବେ। ଆମର API ସର୍ଭର ସ୍ଥାପନା ଏକ ସଂଯୋଗ କାର୍ଯ୍ୟକାରୀତା ଭାବରେ କାର୍ଯ୍ୟ କରିପାରେ।

ଅଧିକାଂଶ ମଡେଲକୁ Python 3.10-3.12 ଆବଶ୍ୟକ। Coqui TTS (VITS)କୁ ବିଶେଷକରି Python 3.11 ଆବଶ୍ୟକ। ଅଧିକାଂଶ ମଡେଲ ପାଇଁ ଆମେ Python 3.12 କୁ ପରାମର୍ଶ ଦେଉଛୁ। ସଠିକ ସଂସ୍କରଣ ସୁସଂଗତି ପାଇଁ ପ୍ରତ୍ୟେକ ମଡେଲର requirements.txt କୁ ଯାଞ୍ଚ କରନ୍ତୁ।

ହଁ. MIT ଏବଂ Apache 2.0 ଲାଇସେନ୍ସଗୁଡ଼ିକ ବାଣିଜ୍ୟିକ ବ୍ୟବହାରକୁ ଅନୁମତି ଦେଇଥାଏ। ଆପଣ SaaS ଉତ୍ପାଦ, ମୋବାଇଲ ଆପଲିକେସନ, ଖେଳ ଏବଂ ସେବାଗୁଡ଼ିକୁ ଏହି ମଡେଲଗୁଡ଼ିକୁ ବ୍ୟବହାର କରି ଲାଇସେନ୍ସ ଫୀ, ରେୟାଲଟି କିମ୍ବା ଯୋଗଦାନ ଆବଶ୍ୟକତା ନଥିବା ନିର୍ମାଣ କରିପାରିବେ (ଯଦିଚ ଯୋଗଦାନକୁ ପ୍ରଶଂସା କରାଯାଏ)।
5.0/5 (1)

ଆମେ କଣ ସୁଧାରିପାରିବା? ଆପଣଙ୍କର ପ୍ରତିକ୍ରିୟା ଆମକୁ ସମସ୍ୟାର ସମାଧାନ କରିବାରେ ସହାୟକ ହୋଇଥାଏ ।

ଆଜି ମୁକ୍ତ ଉତ୍ସ TTSକୁ ଚେଷ୍ଟାକରନ୍ତୁ

20+ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ, ସମସ୍ତ ବାଣିଜ୍ୟିକ-ଲାଇନସେଟ. ଆମର API କିମ୍ବା ସ୍ୱୟଂ-ହୋଷ୍ଟ ବ୍ୟବହାର କରନ୍ତୁ - ପସନ୍ଦ ଆପଣଙ୍କର ।