ମୁକ୍ତ AI ପାଠ୍ୟରୁ ବାକ୍ୟName

31+ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ, 231+ ସ୍ୱର, 34+ କୌଣସି ଖାତା ଆବଶ୍ୟକ ନାହିଁ ।

8K+
ନିର୍ମାତାମାନେ
32K+
ଜନ୍ମଗୁଡିକ
31+
AI ମଡେଲଗୁଡିକ
231+
ଧ୍ୱନିଗୁଡିକ
0/500 ଅକ୍ଷର · Sign up for 5,000 per generation → ମୁକ୍ତ
TTS.ai କୁ ଭଲପାଆନ୍ତି? ଆପଣଙ୍କ ବନ୍ଧୁମାନଙ୍କୁ ଜଣାଇ ଦିଅନ୍ତୁ!

ଭାଷା AI ପାଇଁ ଆପଣଙ୍କୁ ଆବଶ୍ୟକୀୟ ସବୁକିଛିName

ମୁକ୍ତ ଉତ୍ସ AI ମଡେଲ ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ 30+ ଉପକରଣ

31+ AI ଧ୍ୱନି ନମୂନାଗୁଡ଼ିକName

ଗୋଟିଏ ପ୍ଲାଟଫର୍ମରେ ମୁକ୍ତ ଉତ୍ସ TTS ନମୁନାର ସବୁଠାରୁ ବ୍ୟାପକ ସଂଗ୍ରହ

KokoroKokoro Free

Kokoro ଗୋଟିଏ 82 ମିଲିୟନ ମାପଦଣ୍ଡ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ମଡେଲ ଯାହାକି ଏହାର ଓଜନ ଶ୍ରେଣୀର ଉର୍ଦ୍ଧରେ ଭଲ ଭାବରେ କାମ କରେ। ଏହାର ଛୋଟ ଆକାର ସତ୍ତ୍ୱେ, ଏହା ଅତ୍ୟନ୍ତ ପ୍ରାକୃତିକ ଏବଂ ଅଭିବ୍ୟକ୍ତିଶୀଳ ଭାଷା ଉତ୍ପାଦନ କରେ। Kokoro ଏକାଧିକ ଭାଷା ସମର୍ଥନ କରେ, ଯେଉଁଥିରେ ଇଂରାଜୀ, ଜାପାନୀ, ଚାଇନିଜ ଏବଂ କୋରିଆନ ବିଭିନ୍ନ ପ୍ରକାର ଅଭିବ୍ୟକ୍ତିଶୀଳ ସ୍ୱର ସହିତ। ଏହା ଅତ୍ୟନ୍ତ ଦ୍ରୁତ ଭାବରେ ଚଳାଇଥାଏ - GPU ରେ ପ୍ରକୃତ ସମୟ ଅପେକ୍ଷା ପ୍ରାୟ 100x ଦ୍ରୁତ ଧ୍ୱନି ଉତ୍ପାଦନ କରିଥାଏ।

ଏହା ପାଇଁ ଉତ୍ତମ: ସର୍ବନିମ୍ନ ଲାଟେନସି ସହିତ ଉଚ୍ଚ ଗୁଣବତ୍ତା TTS, ପ୍ରବାହିତ ପ୍ରୟୋଗଗୁଡ଼ିକName

ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ

PiperPiper Free

Piper ଗୋଟିଏ ହାଲୁକା ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ଯନ୍ତ୍ର ଯାହାକି Rhasspy ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି ଯାହାକି VITS ଏବଂ larynx ସ୍ଥାପତ୍ୟକୁ ବ୍ୟବହାର କରେ। ଏହା ସମ୍ପୂର୍ଣ୍ଣ ଭାବରେ CPU ଉପରେ ଚାଲୁଛି, ଏହାକୁ ଅଂଶ ଉପକରଣ, ଘର ସ୍ୱୟଂଚାଳିତ, ଏବଂ ଅଫଲାଇନ TTS ଆବଶ୍ୟକ କରୁଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ। 30+ ଭାଷାରେ 100ରୁ ଅଧିକ ଧ୍ୱନି ସହିତ, Piper ଗୋଟିଏ Raspberry Pi4ରେ ମଧ୍ୟ ପ୍ରକୃତ ସମୟ ଗତିରେ ପ୍ରାକୃତିକ-ଧ୍ୱନି ବାକ୍ୟ ପ୍ରଦାନ କରେ।

ଏହା ପାଇଁ ଉତ୍ତମ: ଦ୍ରୁତ ପ୍ରାକଦର୍ଶନ, ସୁଗମତା, ଏବଂ ସନ୍ନିବେଶିତ ପ୍ରୟୋଗଗୁଡ଼ିକName

ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ

VITSVITS Free

VITS (ଅନୁସରଣୀୟ ସନ୍ଧାନ ସହିତ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱିତା ଜ୍ଞାନ ପାଇଁ ଶେଷ-ରୁ-ଶେଷ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ) ଏକ ସମତଳ ଶେଷ-ରୁ-ଶେଷ TTS ପଦ୍ଧତି ଯାହାକି ବର୍ତ୍ତମାନ ଦୁଇ-ସ୍ତରୀୟ ମଡେଲ ଅପେକ୍ଷା ଅଧିକ ପ୍ରାକୃତିକ ସ୍ୱର ଧ୍ୱନି ସୃଷ୍ଟି କରିଥାଏ। ଏହା ପ୍ରାକୃତିକତାରେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ଉନ୍ନତି ହାସଲ କରିବା ପାଇଁ ସାଧାରଣକରଣ ପ୍ରବାହ ଏବଂ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱିତା ପ୍ରଶିକ୍ଷା ପ୍ରକ୍ରିୟା ସହିତ ବୃଦ୍ଧି ପାଇଥିବା ଅନୁସରଣୀୟ ସନ୍ଧାନକୁ ଗ୍ରହଣ କରିଥାଏ।

ଏହା ପାଇଁ ଉତ୍ତମ: ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ସହିତ ସାଧାରଣ- ଉଦ୍ଦେଶ୍ୟ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟName

ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ

MeloTTSMeloTTS Free

MyShell.ai ଦ୍ୱାରା MeloTTS ଏକ ବହୁଭାଷୀ TTS ଲାଇବ୍ରେରୀ ଯାହାକି ଇଂରାଜୀ (ଆମେରିକୀୟ, ବ୍ରିଟିଶ, ଭାରତୀୟ, ଅଷ୍ଟ୍ରେଲିଆନ), ସ୍ପେନିସ, ଫ୍ରେଞ୍ଚ, ଚାଇନିଜ, ଜାପାନୀ, ଏବଂ କୋରିଆନକୁ ସମର୍ଥନ କରେ। ଏହା ଅତ୍ୟନ୍ତ ଦ୍ରୁତ, କେବଳ CPU ଉପରେ ପାଖାପାଖି ରିୟଲ-ଟାଇମ ବେଗରେ ପାଠ୍ୟକୁ ପ୍ରକ୍ରିୟା କରିଥାଏ। MeloTTS ଉତ୍ପାଦନ ବ୍ୟବହାର ପାଇଁ ନିର୍ମିତ ଏବଂ CPU ଏବଂ GPU ଉଭୟକୁ ସମର୍ଥନ କରେ।

ଏହା ପାଇଁ ଉତ୍ତମ: ଉତ୍ପାଦନ ପ୍ରୟୋଗଗୁଡ଼ିକୁ ଦ୍ରୁତ, ବହୁଭାଷୀ TTS ଆବଶ୍ୟକ

ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ

OuteTTSOuteTTS Free

OuteTTS ବଡ଼ ଭାଷା ମଡେଲଗୁଡ଼ିକୁ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ କ୍ଷମତା ସହିତ ବଢ଼ାଇଥାଏ, କିନ୍ତୁ ପ୍ରକୃତ ସ୍ଥାପତ୍ୟକୁ ସଂରକ୍ଷଣ କରିଥାଏ। ଏହା llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ଏବଂ Transformers.js ମାଧ୍ୟମରେ ବ୍ରାଉଜର ସନ୍ଧାନକୁ ସମର୍ଥନ କରେ। JSON ଭାବରେ ସଂରକ୍ଷିତ ସ୍ଵର ପ୍ରୋଫାଇଲଗୁଡ଼ିକ ମାଧ୍ୟମରେ ଶୂନ୍ୟ-ଶଟ ଭାଷା କ୍ଲୋନିଂର ବିଶେଷତା।

ଏହା ପାଇଁ ଉତ୍ତମ: ଆଡ଼ଜଷ୍ଟମେଣ୍ଟ, ବ୍ରାଉଜର ଆଧାରିତ TTS, କମ୍-ସମ୍ପଦ ପରିବେଶଗୁଡ଼ିକName

ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ

Pocket TTSPocket TTS Free

Kyutai (Moshi ର ନିର୍ମାତା) ଦ୍ୱାରା ପକେଟ TTS ଏକ ସଂକଳ୍ପ 100M ପରିମାପ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ମଡେଲ ଯାହାକି ଏହାର ଓଜନଠାରୁ ଅଧିକ ଭଲ ଭାବରେ ସ୍ପର୍ଶ କରିଥାଏ। ଏହା CPU ଉପରେ ଦକ୍ଷତା ସହିତ ଚାଲୁଛି, ଗୋଟିଏ ସ୍ୱର ନମୁନାରୁ ଶୂନ୍ୟ-ଶଟ ସ୍ୱର କ୍ଲୋନକୁ ସମର୍ଥନ କରେ, ଏବଂ ପ୍ରାକୃତିକ-ସ୍ୱର ଭାଷା ଉତ୍ପାଦନ କରେ। ଛୋଟ ମଡେଲ ଆକାର ଏହାକୁ ଅଂଶ ବିସ୍ତାର ଏବଂ କମ୍-ସମ୍ପଦ ପରିବେଶଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ।

ଏହା ପାଇଁ ଉତ୍ତମ: ହଳଦିଆ ବିସ୍ତାର, CPU-କେବଳ ପରିବେଶ, ଶୀଘ୍ର ଧ୍ୱନି କ୍ଲୋନିଂName

ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ

Kitten TTSKitten TTS Free

Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.

ଏହା ପାଇଁ ଉତ୍ତମ: Fast lightweight TTS, edge deployment, low-latency applications

ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ

BarkBark Standard

ପରିବର୍ତ୍ତକ ଆଧାରିତ ପାଠ୍ୟ-ରୁ-ଧ୍ୱନି ମଡେଲ ଯାହାକି ବାସ୍ତବବାଦୀ ବକ୍ତବ୍ୟ, ସଂଗୀତ ଏବଂ ଧ୍ୱନି ପ୍ରଭାବ ସୃଷ୍ଟି କରିଥାଏ।

ବିକାଶକାରୀ: Suno · ଅନୁମତିପତ୍ର: MIT

ଚେଷ୍ଟାକରନ୍ତୁ

Bark SmallBark Small Standard

ଦ୍ରୁତ ଅନୁମାନ ଏବଂ କମ ସ୍ମୃତିସ୍ଥାନ ବ୍ୟବହାର ସହିତ Bark ର ହାଲୁକା ସଂସ୍କରଣ ।

ବିକାଶକାରୀ: Suno · ଅନୁମତିପତ୍ର: MIT

ଚେଷ୍ଟାକରନ୍ତୁ

CosyVoice 2CosyVoice 2 Standard

ଅଲିବାବା ର ମାପଯୋଗ୍ୟ ଷ୍ଟ୍ରିମିଂ TTS ମାନବ-ସମାନ ପ୍ରାକୃତିକତା ଏବଂ ଶୂନ୍ୟ-ନିକଟତର ଲାଟେନସି ସହିତ।

ବିକାଶକାରୀ: Alibaba (Tongyi Lab) · ଅନୁମତିପତ୍ର: Apache 2.0

ଚେଷ୍ଟାକରନ୍ତୁ

Dia TTSDia TTS Standard

ବହୁ-ବକ୍ତା ସଂଳାପ ନିର୍ମାଣ ମଡେଲ ଯାହା ବକ୍ତାମାନଙ୍କ ମଧ୍ୟରେ ପ୍ରାକୃତିକ ବାର୍ତ୍ତାଳାପ ସୃଷ୍ଟି କରେ।

ବିକାଶକାରୀ: Nari Labs · ଅନୁମତିପତ୍ର: Apache 2.0

ଚେଷ୍ଟାକରନ୍ତୁ

Parler TTSParler TTS Standard

ଆପଣ ପ୍ରାକୃତିକ ଭାଷାରେ ଚାହୁଁଥିବା ଧ୍ୱନିକୁ ବର୍ଣ୍ଣନା କରନ୍ତୁ ଏବଂ ପାର୍ଲର ମେଳଖାଉଥିବା ଭାଷଣ ସୃଷ୍ଟି କରିଥାଏ।

ବିକାଶକାରୀ: Hugging Face · ଅନୁମତିପତ୍ର: Apache 2.0

ଚେଷ୍ଟାକରନ୍ତୁ

GLM-TTSGLM-TTS Standard

ମୁକ୍ତ ଉତ୍ସ TTS ନମୂନାଗୁଡ଼ିକ ମଧ୍ୟରେ ସର୍ବନିମ୍ନ ଅକ୍ଷର ତ୍ରୁଟି ହାରକୁ ହାସଲ କରିଥାଏ।

ବିକାଶକାରୀ: Zhipu AI · ଅନୁମତିପତ୍ର: GLM-4 License

ଚେଷ୍ଟାକରନ୍ତୁ

IndexTTS-2IndexTTS-2 Standard

ଶୂନ୍ୟ-ଶଟ TTS ଫାଇନ-ଗ୍ରେନ ଇମୋସନ ନିୟନ୍ତ୍ରଣ ଏବଂ ଉଚ୍ଚ ଅଭିବ୍ୟକ୍ତିଶୀଳତା ସହିତ ।

ବିକାଶକାରୀ: Index Team · ଅନୁମତିପତ୍ର: Bilibili Model License

ଚେଷ୍ଟାକରନ୍ତୁ

Spark TTSSpark TTS Standard

ନିୟନ୍ତ୍ରଣଯୋଗ୍ୟ ଅନୁଭୂତି ଏବଂ ପରାମର୍ଶ ମାଧ୍ୟମରେ କଥାବାର୍ତ୍ତା ଶୈଳୀ ସହିତ ଧ୍ୱନି କ୍ଲୋନ TTS।

ବିକାଶକାରୀ: SparkAudio · ଅନୁମତିପତ୍ର: CC BY-NC-SA 4.0

ଚେଷ୍ଟାକରନ୍ତୁ

GPT-SoVITSGPT-SoVITS Standard

କିଛି-ଶଟ ସ୍ୱର କ୍ଲୋନ TTS ଯାହାକି କେବଳ5ସେକେଣ୍ଡ ଧ୍ୱନିରୁ ଯେକୌଣସି ସ୍ୱରକୁ ନକଲ କରିଥାଏ।

ବିକାଶକାରୀ: RVC-Boss · ଅନୁମତିପତ୍ର: MIT

ଚେଷ୍ଟାକରନ୍ତୁ

OrpheusOrpheus Standard

100K ଘଣ୍ଟା ବାକ୍ୟ ତଥ୍ୟ ଉପରେ ପ୍ରଶିକ୍ଷିତ ମାନବ ସ୍ତରୀୟ ଭାବଗତ TTS ମଡେଲ ।

ବିକାଶକାରୀ: Canopy Labs · ଅନୁମତିପତ୍ର: Llama 3.2 Community

ଚେଷ୍ଟାକରନ୍ତୁ

Qwen3 TTSQwen3 TTS Standard

ଆଲିବାବାର ବହୁଭାଷୀ TTS ଧ୍ୱନି କ୍ଲୋନିଂ ସହିତ, ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଧ୍ୱନି, ଏବଂ ପାଠ୍ୟରୁ ଧ୍ୱନି ଡିଜାଇନ।

ବିକାଶକାରୀ: Alibaba (Qwen) · ଅନୁମତିପତ୍ର: Apache 2.0

ଚେଷ୍ଟାକରନ୍ତୁ

Chatterbox TurboChatterbox Turbo Standard

ଦ୍ରୁତ ଚାଟରବକ୍ସ ଅଧି-200ms ଲାଟେନସି ଏବଂ ହସ, କାଶି ଏବଂ ଅଧିକ ପାଇଁ ପାରାଲିଙ୍ଗୁଇଷ୍ଟିକ ଟ୍ୟାଗ ସହିତ।

ବିକାଶକାରୀ: Resemble AI · ଅନୁମତିପତ୍ର: MIT

ଚେଷ୍ଟାକରନ୍ତୁ

Dia 2Dia 2 Standard

ବହୁ-ଭାଷକ ବାର୍ତ୍ତାଳାପ ଏବଂ ପାରାଲିଙ୍ଗୁଇଷ୍ଟିକ ସଙ୍କେତ ସହିତ ପ୍ରଥମ-ସଂଳାପ TTSକୁ ପ୍ରବାହିତ କରନ୍ତୁ।

ବିକାଶକାରୀ: Nari Labs · ଅନୁମତିପତ୍ର: Apache 2.0

ଚେଷ୍ଟାକରନ୍ତୁ

VoxCPMVoxCPM Standard

Tokenizer-ମୁକ୍ତ TTS 44.1kHz ଧ୍ୱନି ଉତ୍ପାଦନ କରୁଅଛି ଯାହାର ପ୍ରସଙ୍ଗ-ସଚେତନ ଅନୁଚ୍ଛେଦ ସ୍ଥିରତା ଅଛି।

ବିକାଶକାରୀ: OpenBMB · ଅନୁମତିପତ୍ର: Apache 2.0

ଚେଷ୍ଟାକରନ୍ତୁ

TADATADA Standard

ପାଠ୍ୟ-ଅକୁସିକ ଦ୍ୱିଗୁଣିତ ସଂଯୋଜକତା ସହିତ ଶୂନ୍ୟ-ହାଲ୍ୟୁସିନେଶନ TTS, ତୁଳନାଯୋଗ୍ୟ LLM TTS ଅପେକ୍ଷା5x ଦ୍ରୁତ।

ବିକାଶକାରୀ: Hume AI · ଅନୁମତିପତ୍ର: MIT

ଚେଷ୍ଟାକରନ୍ତୁ

VibeVoiceVibeVoice Standard

ପୋଡକାଷ୍ଟ ଏବଂ ଧ୍ୱନି ପୁସ୍ତକ ଭଳି ଲମ୍ବା-ଫର୍ମ ବହୁ-ବକ୍ତା ବିଷୟବସ୍ତୁ ପାଇଁ Microsoft ମଡେଲ।

ବିକାଶକାରୀ: Microsoft · ଅନୁମତିପତ୍ର: MIT

ଚେଷ୍ଟାକରନ୍ତୁ

CosyVoice3CosyVoice3 Standard

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ବିକାଶକାରୀ: Alibaba (FunAudioLLM) · ଅନୁମତିପତ୍ର: Apache 2.0

ଚେଷ୍ଟାକରନ୍ତୁ

ChatterboxChatterbox Premium

Resemble AI ଠାରୁ ଆବେଗ ନିୟନ୍ତ୍ରଣ ସହିତ state-of-the-art ଶୂନ୍ୟ-ଶଟ ସ୍ୱର କ୍ଲୋନିଂ ।

ଗୁଣବତ୍ତା:

ଚେଷ୍ଟାକରନ୍ତୁ

Tortoise TTSTortoise TTS Premium

ବହୁ-ଭାଷା ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ଗୁଣବତ୍ତା ଉପରେ ଆଧାରିତ ଅଟୋ-ରିଗ୍ରେସିଭ ଢାଞ୍ଚା ସହିତ ।

ଗୁଣବତ୍ତା:

ଚେଷ୍ଟାକରନ୍ତୁ

StyleTTS 2StyleTTS 2 Premium

ମାନବ ସ୍ତରୀୟ ପାଠ-ରୁ-ବାକ୍ୟ ମାଧ୍ୟମରେ ଶୈଳୀ ପ୍ରସାରଣ ଏବଂ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱିତା ପ୍ରଶିକ୍ଷା

ଗୁଣବତ୍ତା:

ଚେଷ୍ଟାକରନ୍ତୁ

OpenVoiceOpenVoice Premium

ଶୈଳୀ, ଅନୁଭୂତି ଏବଂ ଉଚ୍ଚାରଣ ଉପରେ ଗ୍ରେନାଲ ନିୟନ୍ତ୍ରଣ ସହିତ ତୁରନ୍ତ ସ୍ୱର କ୍ଲୋନିଂ।

ଗୁଣବତ୍ତା:

ଚେଷ୍ଟାକରନ୍ତୁ

Sesame CSMSesame CSM Premium

ଯୁକ୍ତିତର୍କର ଭାଷା ମଡେଲ, ଯାହାକି ଉପଯୁକ୍ତ ସମୟ ଏବଂ ଭାବନା ସହିତ ପ୍ରାକୃତିକ ଆଲୋଚନା ସୃଷ୍ଟି କରିଥାଏ ।

ଗୁଣବତ୍ତା:

ଚେଷ୍ଟାକରନ୍ତୁ

MOSS-TTSMOSS-TTS Premium

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

ଗୁଣବତ୍ତା:

ଚେଷ୍ଟାକରନ୍ତୁ

MegaTTS3MegaTTS3 Premium

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

ଗୁଣବତ୍ତା:

ଚେଷ୍ଟାକରନ୍ତୁ

CosyVoice 2CosyVoice 2

ଅଲିବାବା ର ମାପଯୋଗ୍ୟ ଷ୍ଟ୍ରିମିଂ TTS ମାନବ-ସମାନ ପ୍ରାକୃତିକତା ଏବଂ ଶୂନ୍ୟ-ନିକଟତର ଲାଟେନସି ସହିତ।

ଭାଷା: en, zh, ja, ko, fr, de, it, es

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

GLM-TTSGLM-TTS

ମୁକ୍ତ ଉତ୍ସ TTS ନମୂନାଗୁଡ଼ିକ ମଧ୍ୟରେ ସର୍ବନିମ୍ନ ଅକ୍ଷର ତ୍ରୁଟି ହାରକୁ ହାସଲ କରିଥାଏ।

ଭାଷା: en, zh

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

IndexTTS-2IndexTTS-2

ଶୂନ୍ୟ-ଶଟ TTS ଫାଇନ-ଗ୍ରେନ ଇମୋସନ ନିୟନ୍ତ୍ରଣ ଏବଂ ଉଚ୍ଚ ଅଭିବ୍ୟକ୍ତିଶୀଳତା ସହିତ ।

ଭାଷା: en, zh

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

Spark TTSSpark TTS

ନିୟନ୍ତ୍ରଣଯୋଗ୍ୟ ଅନୁଭୂତି ଏବଂ ପରାମର୍ଶ ମାଧ୍ୟମରେ କଥାବାର୍ତ୍ତା ଶୈଳୀ ସହିତ ଧ୍ୱନି କ୍ଲୋନ TTS।

ଭାଷା: en, zh

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

GPT-SoVITSGPT-SoVITS

କିଛି-ଶଟ ସ୍ୱର କ୍ଲୋନ TTS ଯାହାକି କେବଳ5ସେକେଣ୍ଡ ଧ୍ୱନିରୁ ଯେକୌଣସି ସ୍ୱରକୁ ନକଲ କରିଥାଏ।

ଭାଷା: en, zh, ja, ko

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

ChatterboxChatterbox

Resemble AI ଠାରୁ ଆବେଗ ନିୟନ୍ତ୍ରଣ ସହିତ state-of-the-art ଶୂନ୍ୟ-ଶଟ ସ୍ୱର କ୍ଲୋନିଂ ।

ଭାଷା: en

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

Tortoise TTSTortoise TTS

ବହୁ-ଭାଷା ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ଗୁଣବତ୍ତା ଉପରେ ଆଧାରିତ ଅଟୋ-ରିଗ୍ରେସିଭ ଢାଞ୍ଚା ସହିତ ।

ଭାଷା: en

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

OpenVoiceOpenVoice

ଶୈଳୀ, ଅନୁଭୂତି ଏବଂ ଉଚ୍ଚାରଣ ଉପରେ ଗ୍ରେନାଲ ନିୟନ୍ତ୍ରଣ ସହିତ ତୁରନ୍ତ ସ୍ୱର କ୍ଲୋନିଂ।

ଭାଷା: en, zh, ja, ko, fr, de, es, it

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

Qwen3 TTSQwen3 TTS

ଆଲିବାବାର ବହୁଭାଷୀ TTS ଧ୍ୱନି କ୍ଲୋନିଂ ସହିତ, ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଧ୍ୱନି, ଏବଂ ପାଠ୍ୟରୁ ଧ୍ୱନି ଡିଜାଇନ।

ଭାଷା: en, zh, ja, ko, de, fr, ru, pt, es, it

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

Chatterbox TurboChatterbox Turbo

ଦ୍ରୁତ ଚାଟରବକ୍ସ ଅଧି-200ms ଲାଟେନସି ଏବଂ ହସ, କାଶି ଏବଂ ଅଧିକ ପାଇଁ ପାରାଲିଙ୍ଗୁଇଷ୍ଟିକ ଟ୍ୟାଗ ସହିତ।

ଭାଷା: en

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

VoxCPMVoxCPM

Tokenizer-ମୁକ୍ତ TTS 44.1kHz ଧ୍ୱନି ଉତ୍ପାଦନ କରୁଅଛି ଯାହାର ପ୍ରସଙ୍ଗ-ସଚେତନ ଅନୁଚ୍ଛେଦ ସ୍ଥିରତା ଅଛି।

ଭାଷା: en, zh

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

OuteTTSOuteTTS

LLM-ଆଧାରିତ TTS ଯାହାକି CPU, GPU, କିମ୍ବା lama.cpp ଏବଂ Transformers.js ମାଧ୍ୟମରେ ବ୍ରାଉଜରରେ ଚଲାଇଥାଏ।

ଭାଷା: en

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

Pocket TTSPocket TTS

ଗୋଟିଏ ନମୁନାରୁ ସ୍ୱର କ୍ଲୋନିଂ ସହିତ Kyutai ଦ୍ୱାରା ହଳଦିଆ 100M ପରିମାପକ ମଡେଲ ।

ଭାଷା: en, fr

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

CosyVoice3CosyVoice3

Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.

ଭାଷା: en, zh, ja, ko, de, es, fr, it, ru

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

MOSS-TTSMOSS-TTS

Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.

ଭାଷା: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

MegaTTS3MegaTTS3

ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.

ଭାଷା: en, zh

ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ

ବିକାଶକାରୀ- ପ୍ରଥମ API

OpenAI-ସହଜ REST API. ଗୋଟିଏ ଶେଷ ବିନ୍ଦୁ, 22+ ନମୂନା. ରିୟଲ-ଟାଇମ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଷ୍ଟ୍ରିମିଂ ସମର୍ଥନ।

  • OpenAI- ସୁସଂଗତ ଶୈଳୀ
  • ରିଅଲ-ଟାଇମ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ TTS ପ୍ରବାହ
  • ବଡ଼ କାର୍ଯ୍ୟଗୁଡ଼ିକ ପାଇଁ ବ୍ୟାଚ ପ୍ରକ୍ରିୟାକରଣ
  • Webhook ବିଜ୍ଞପ୍ତିଗୁଡ଼ିକ
API ଦଲିଲଗୁଡ଼ିକୁ ଦେଖନ୍ତୁ
pip install ttsai npm install @ttsainpm/ttsai
Python
from tts_ai import TTSClient

client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
    text="Hello from TTS.ai!",
    model="kokoro",
    voice="af_bella",
)
client.save(audio, "output.mp3")

ସରଳ, ପାରଦର୍ଶୀ ମୂଲ୍ୟାଙ୍କନ

ମୁକ୍ତ ଭାବରେ ଆରମ୍ଭ କରନ୍ତୁ । ଆପଣ ବଢିବା ସମୟରେ ମାପନ୍ତୁ ।

ମୁକ୍ତ

$0

15 କ୍ରିଡ଼େଟ

  • Kokoro, Piper, VITS, MeloTTS
  • 500 ଅକ୍ଷର ସୀମା
  • 3 ଜେନ/ଘଣ୍ଟା (କୌଣସି ଖାତା ନାହିଁ)
ମୁକ୍ତ ଭାବରେ ପଞ୍ଜିକୃତ ହୁଅନ୍ତୁ

ଆରମ୍ଭକର୍ତ୍ତା

$9/ମିନିଟ

500 ଋଣ/ମାସ

  • ସମସ୍ତ 22+ ଆକାର
  • ପ୍ରତି ଉତ୍ପତ୍ତିରେ 100,000 ଅକ୍ଷର
  • ଧ୍ୱନି କ୍ଲୋନିଂName
ଆରମ୍ଭ କରନ୍ତୁ
ସବୁଠାରୁ ଲୋକପ୍ରିୟ

ପ୍ରୋ

$29/ମିନିଟ

2,000 ଋଣ/ମାସ

  • ଆରମ୍ଭକର୍ତ୍ତାରେ ସବୁକିଛି
  • API ସୁଗମତା
  • ପ୍ରାଥମିକତା ପ୍ରକ୍ରିୟାକରଣ
ପ୍ରୋ ଗ୍ରହଣ କରନ୍ତୁ

ବ୍ୟବସାୟ

$99/ମିନିଟ

10,000 ଋଣ/ମାସ

  • Pro ରେ ସବୁକିଛି
  • ବୃହତ API
  • ପ୍ରାଥମିକତା ଧାଡ଼ି
ବ୍ୟବସାୟ ଗ୍ରହଣ କରନ୍ତୁ

ଅକ୍ଷର ପ୍ୟାକ ସମେତ ସମସ୍ତ ଯୋଜନାଗୁଡ଼ିକୁ ଦେଖନ୍ତୁ →

ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName

TTS.ai ହେଉଛି ସବୁଠାରୁ ବ୍ୟାପକ AI ସ୍ୱର ପ୍ଲାଟଫର୍ମ, ଯାହା 22+ ପାଠ୍ୟ-ରୁ-ଭାଷା ମଡେଲ, ଭାଷା କ୍ଲୋନିଂ, ଭାଷା-ରୁ-ପାଠ୍ୟ ଏବଂ ଧ୍ୱନି ଉପକରଣ ପ୍ରଦାନ କରେ । ସମସ୍ତ ମଡେଲଗୁଡ଼ିକ କୌଣସି ବିକ୍ରୟକାରୀ ଲକ-ଇନ ସହିତ ମୁକ୍ତ ଉତ୍ସ ।

ହଁ! TTS.ai Kokoro, Piper, VITS, ଏବଂ MeloTTS ମଡେଲ ସହିତ ମୁକ୍ତ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ପ୍ରଦାନ କରେ। କୌଣସି ଖାତା ଆବଶ୍ୟକ ନୁହଁ। 15,000 ମୁକ୍ତ ଅକ୍ଷର ଏବଂ ସମସ୍ତ ମଡେଲକୁ ବ୍ୟବହାର କରିବା ପାଇଁ ସଦସ୍ୟତା ନିଅନ୍ତୁ। ପୈଠିତ ଯୋଜନା $9/ମାସରେ ଆରମ୍ଭ ହୋଇଥାଏ।

ଗତି ପାଇଁ, Kokoro କିମ୍ବା Piper କୁ ବ୍ୟବହାର କରନ୍ତୁ। ଗୁଣବତ୍ତା ପାଇଁ, CosyVoice2ଅଥବା StyleTTS2କୁ ଚେଷ୍ଟାକରନ୍ତୁ। ଧ୍ୱନି କ୍ଲୋନିଂ ପାଇଁ, Chatterbox କିମ୍ବା GPT-SoVITS କୁ ବ୍ୟବହାର କରନ୍ତୁ। ସଂଳାପ ପାଇଁ, Dia TTS କୁ ବ୍ୟବହାର କରନ୍ତୁ। ତୁଳନା କରିବା ପାଇଁ ଏକା ପାଠ୍ୟରେ ଏକାଧିକ ନମୂନାକୁ ଚେଷ୍ଟାକରନ୍ତୁ।

ହଁ। OpenAI-ସଂଗଠିତ REST API TTS, STT, ସ୍ୱର କ୍ଲୋନିଂ, ଏବଂ ଧ୍ୱନି ସାଧନଗୁଡ଼ିକ ପାଇଁ। ପ୍ରୋ ($29/ମାସ) ଏବଂ ଏଣ୍ଟରପ୍ରାଇଜ ($99/ମାସ) ଯୋଜନାରେ ଉପଲବ୍ଧ। tts.ai/api/ ରେ ଦଲିଲ ଦେଖନ୍ତୁ।

ସ୍ୱର ଗୁଣବତ୍ତା ମଡେଲ ଅନୁଯାୟୀ ପରିବର୍ତ୍ତିତ ହୋଇଥାଏ। CosyVoice2, StyleTTS2, ଏବଂ Chatterbox ପରି ପ୍ରୀମିୟମ ମଡେଲଗୁଡ଼ିକ ପ୍ରାକୃତିକ ଢଙ୍ଗ ଏବଂ ଅନୁଭୂତି ସହିତ ପାଖାପାଖି-ମାନବୀୟ ଗୁଣବତ୍ତାର ଭାଷା ଉତ୍ପାଦନ କରିଥାଏ। Kokoro ଭଳି ମୁକ୍ତ ମଡେଲଗୁଡ଼ିକ ଅଧିକାଂଶ ବ୍ୟବହାର ମାମଲା ପାଇଁ ଉତ୍ତମ ଗୁଣବତ୍ତା ପ୍ରଦାନ କରିଥାଏ।

TTS.ai ଏହାର ଆଦର୍ଶ ଲାଇବ୍ରେରୀରେ 30+ ଭାଷାକୁ ସମର୍ଥନ କରେ। ଇଂରାଜୀ ସର୍ବବୃହତ ଆଦର୍ଶ ସମର୍ଥନ କରେ, କିନ୍ତୁ CosyVoice2ପରି ଆଦର୍ଶ ଚୀନୀୟ, ଜାପାନୀ ଏବଂ କୋରିଆନକୁ ଆବରଣ କରେ; GPT-SoVITS ଚୀନୀୟ, ଜାପାନୀ, କୋରିଆନ ଏବଂ ଇଂରାଜୀକୁ ପରିଚାଳନା କରେ; ଏବଂ MeloTTS ଇଂରାଜୀ, ସ୍ପେନିସ, ଫ୍ରେଞ୍ଚ, ଚୀନୀୟ, ଜାପାନୀ ଏବଂ କୋରିଆନକୁ ସମର୍ଥନ କରେ।

ହଁ। ସମସ୍ତ ପ୍ରକ୍ରିୟା ଆମର ସମର୍ପିତ GPU ସର୍ଭରଗୁଡ଼ିକରେ ଘଟେ। ଆମେ ଆପଣଙ୍କର ପାଠ୍ୟ ନିବେଶକୁ ସଂରକ୍ଷଣ କରୁନାହିଁ କିମ୍ବା ପ୍ରଦାନ ପରେ ଉତ୍ପନ୍ନ ଧ୍ୱନିକୁ ସଂରକ୍ଷଣ କରୁନାହିଁ। କ୍ଲୋନ କରିବା ପାଇଁ ଅଦ୍ୟତନ କରାଯାଇଥିବା ଧ୍ୱନି ନମୁନାଗୁଡ଼ିକୁ କେବଳ ବର୍ତ୍ତମାନ ଅଧିବେଶନ ପାଇଁ ବ୍ୟବହାର କରାଯାଏ ଏବଂ ସଂରକ୍ଷିତ କରାଯାଇନାହିଁ। ଆମେ ଆପଣଙ୍କର ତଥ୍ୟକୁ ତୃତୀୟ ପକ୍ଷ ସହିତ କେବେ ବି ବାଣ୍ଟିନୁ କିମ୍ବା ଏହାକୁ ନମୂନାକୁ ପ୍ରଶିକ୍ଷଣ ଦେବା ପାଇଁ ବ୍ୟବହାର କରୁନୁ।

ହଁ। TTS.ai ରେ ନିର୍ମିତ ସମସ୍ତ ଧ୍ୱନି ଆପଣଙ୍କର ବାଣିଜ୍ୟିକ ବ୍ୟବହାର ପାଇଁ, YouTube ଭିଡିଓ, ପୋଡକାଷ୍ଟ, ଅଡିଓବାଇକ, ଆପ, ବିଜ୍ଞାପନ, ଏବଂ ଉତ୍ପାଦଗୁଡ଼ିକ ସହିତ। ଆମର ମଡେଲଗୁଡ଼ିକ ଅନୁମତିପ୍ରଦାନକାରୀ ଲାଇସେନ୍ସ (MIT, Apache 2.0) ଅନ୍ତର୍ଗତ ମୁକ୍ତ ଉତ୍ସ। କୌଣସି ରୟାଲଟି କିମ୍ବା ଯୋଗଦାନ ଆବଶ୍ୟକ ନାହିଁ।

TTS.ai ସର୍ବାଧିକ ଗୁଣବତ୍ତା ପାଇଁ ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଭାବରେ WAV ଶୈଳୀରେ ଧ୍ୱନି ସୃଷ୍ଟି କରିଥାଏ। ଆପଣ MP3, FLAC, OGG, କିମ୍ବା M4A କୁ ଆମର ମୁକ୍ତ ଧ୍ୱନି ପରିବର୍ତ୍ତକ ସାଧନକୁ ବ୍ୟବହାର କରି ପରିବର୍ତ୍ତନ କରିପାରିବେ। API ଅନୁରୋଧରେ ଆପଣଙ୍କର ପସନ୍ଦଯୋଗ୍ୟ ନିର୍ଗମ ଶୈଳୀକୁ ସିଧାସଳଖ ନିର୍ଦ୍ଦିଷ୍ଟ କରିବା ପାଇଁ ସମର୍ଥନ କରିଥାଏ।

ଆପଣ କ୍ଲୋନ କରିବାକୁ ଚାହୁଁଥିବା ଧ୍ୱନିର ଗୋଟିଏ ସଂକ୍ଷିପ୍ତ ଧ୍ୱନି ନମୁନାକୁ ଅପଲୋଡ କରନ୍ତୁ (5 ସେକେଣ୍ଡରୁ କମ), ତା'ପରେ ସେହି ଧ୍ୱନିରେ ଭାଷା ସୃଷ୍ଟି କରିବା ପାଇଁ କୌଣସି ପାଠ୍ୟକୁ ଟାଇପ କରନ୍ତୁ। ଚାଟରବକ୍ସ, GPT-SoVITS, ଏବଂ CosyVoice2ପରି ନମୂନାଗୁଡ଼ିକ ଧ୍ୱନି କ୍ଲୋନକୁ ସମର୍ଥନ କରିଥାଏ। କ୍ଲୋନ କରାଯାଇଥିବା ଧ୍ୱନି ଧ୍ୱନି, ଉଚ୍ଚାରଣ, ଏବଂ ଭାଷା ଶୈଳୀକୁ ଗ୍ରହଣ କରିଥାଏ।

ମୁକ୍ତ ମଡେଲ (Kokoro, Piper, VITS, MeloTTS) ପାଇଁ କୌଣସି ଖାତା ଆବଶ୍ୟକ ନାହିଁ ଏବଂ ଶୂନ୍ୟ ଅକ୍ଷର ଖର୍ଚ୍ଚ ହୋଇଥାଏ। ମାନକ ମଡେଲ (2,000 ଅକ୍ଷର/1K ନିବେଶ) ରେ Bark, CosyVoice2, F5-TTS, ଏବଂ Dia ସାମିଲ ଅଛି। ପ୍ରୀମିୟମ ମଡେଲ (4,000 ଅକ୍ଷର/1K ନିବେଶ) ରେ OpenVoice, Chatterbox, StyleTTS2, ଏବଂ Tortoise ସାମିଲ ଅଛି। ପୈଠିତ ମଡେଲ ସାଧାରଣତଃ ଉଚ୍ଚ ଗୁଣବତ୍ତା, ଅଧିକ ଧ୍ୱନି, ଏବଂ ଅତିରିକ୍ତ ବିଶେଷତା ଭଳି ଧ୍ୱନି କ୍ଲୋନିଂ ପ୍ରଦାନ କରିଥାଏ।

ହଁ। ପାଠ୍ୟର ବଡ଼ ପରିମାଣକୁ ଭାଷାରେ ପରିବର୍ତ୍ତନ କରିବା ପାଇଁ API ବ୍ୟାଚ ପ୍ରକ୍ରିୟାକରଣକୁ ସମର୍ଥନ କରେ। ଏକାଧିକ ଅନୁରୋଧ ଦାଖଲ କରନ୍ତୁ ଏବଂ କାର୍ଯ୍ୟ UUIDଗୁଡ଼ିକୁ ବ୍ୟବହାର କରି ଅପରିବର୍ତ୍ତନୀୟ ଭାବରେ ଫଳାଫଳଗୁଡ଼ିକୁ ପୁନଃପ୍ରାପ୍ତ କରନ୍ତୁ। କମ୍ପାନୀ ଯୋଜନା ($99/ମାସ) ଦ୍ରୁତ ବ୍ୟାଚ ପ୍ରକ୍ରିୟାକରଣ ପାଇଁ ପ୍ରାଥମିକତା ଧାଡ଼ି ଅଭିଗମ୍ୟତା ଅନ୍ତର୍ଭୁକ୍ତ କରିଥାଏ। ଧ୍ୱନି ପୁସ୍ତକ ଉତ୍ପାଦନ, ପାଠ୍ୟ ବିଷୟବସ୍ତୁ, ଏବଂ ବଡ଼ ପରିମାଣର ଭାଷା ପ୍ରକଳ୍ପଗୁଡ଼ିକ ପାଇଁ ଉପଯୁକ୍ତ।
4.0/5 (22)

ଆମେ କଣ ସୁଧାରିପାରିବା? ଆପଣଙ୍କର ପ୍ରତିକ୍ରିୟା ଆମକୁ ସମସ୍ୟାର ସମାଧାନ କରିବାରେ ସହାୟକ ହୋଇଥାଏ ।

AI ଧ୍ୱନି ବ୍ୟବହାର କରିବା ଆଜି ଆରମ୍ଭ କରନ୍ତୁ

TTS.ai ବ୍ୟବହାର କରି ନିର୍ମାତା, ବିକାଶକାରୀ ଏବଂ ବ୍ୟବସାୟରେ ଯୋଗ ଦିଅନ୍ତୁ