ମୁକ୍ତ AI ପାଠ୍ୟରୁ ବାକ୍ୟName
31+ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ, 231+ ସ୍ୱର, 34+ କୌଣସି ଖାତା ଆବଶ୍ୟକ ନାହିଁ ।
ଭାଷା AI ପାଇଁ ଆପଣଙ୍କୁ ଆବଶ୍ୟକୀୟ ସବୁକିଛିName
ମୁକ୍ତ ଉତ୍ସ AI ମଡେଲ ଦ୍ୱାରା ଶକ୍ତିପ୍ରାପ୍ତ 30+ ଉପକରଣ
31+ AI ଧ୍ୱନି ନମୂନାଗୁଡ଼ିକName
ଗୋଟିଏ ପ୍ଲାଟଫର୍ମରେ ମୁକ୍ତ ଉତ୍ସ TTS ନମୁନାର ସବୁଠାରୁ ବ୍ୟାପକ ସଂଗ୍ରହ
Kokoro Free
Kokoro ଗୋଟିଏ 82 ମିଲିୟନ ମାପଦଣ୍ଡ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ମଡେଲ ଯାହାକି ଏହାର ଓଜନ ଶ୍ରେଣୀର ଉର୍ଦ୍ଧରେ ଭଲ ଭାବରେ କାମ କରେ। ଏହାର ଛୋଟ ଆକାର ସତ୍ତ୍ୱେ, ଏହା ଅତ୍ୟନ୍ତ ପ୍ରାକୃତିକ ଏବଂ ଅଭିବ୍ୟକ୍ତିଶୀଳ ଭାଷା ଉତ୍ପାଦନ କରେ। Kokoro ଏକାଧିକ ଭାଷା ସମର୍ଥନ କରେ, ଯେଉଁଥିରେ ଇଂରାଜୀ, ଜାପାନୀ, ଚାଇନିଜ ଏବଂ କୋରିଆନ ବିଭିନ୍ନ ପ୍ରକାର ଅଭିବ୍ୟକ୍ତିଶୀଳ ସ୍ୱର ସହିତ। ଏହା ଅତ୍ୟନ୍ତ ଦ୍ରୁତ ଭାବରେ ଚଳାଇଥାଏ - GPU ରେ ପ୍ରକୃତ ସମୟ ଅପେକ୍ଷା ପ୍ରାୟ 100x ଦ୍ରୁତ ଧ୍ୱନି ଉତ୍ପାଦନ କରିଥାଏ।
ଏହା ପାଇଁ ଉତ୍ତମ: ସର୍ବନିମ୍ନ ଲାଟେନସି ସହିତ ଉଚ୍ଚ ଗୁଣବତ୍ତା TTS, ପ୍ରବାହିତ ପ୍ରୟୋଗଗୁଡ଼ିକName
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
Piper Free
Piper ଗୋଟିଏ ହାଲୁକା ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ଯନ୍ତ୍ର ଯାହାକି Rhasspy ଦ୍ୱାରା ବିକଶିତ ହୋଇଛି ଯାହାକି VITS ଏବଂ larynx ସ୍ଥାପତ୍ୟକୁ ବ୍ୟବହାର କରେ। ଏହା ସମ୍ପୂର୍ଣ୍ଣ ଭାବରେ CPU ଉପରେ ଚାଲୁଛି, ଏହାକୁ ଅଂଶ ଉପକରଣ, ଘର ସ୍ୱୟଂଚାଳିତ, ଏବଂ ଅଫଲାଇନ TTS ଆବଶ୍ୟକ କରୁଥିବା ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ। 30+ ଭାଷାରେ 100ରୁ ଅଧିକ ଧ୍ୱନି ସହିତ, Piper ଗୋଟିଏ Raspberry Pi4ରେ ମଧ୍ୟ ପ୍ରକୃତ ସମୟ ଗତିରେ ପ୍ରାକୃତିକ-ଧ୍ୱନି ବାକ୍ୟ ପ୍ରଦାନ କରେ।
ଏହା ପାଇଁ ଉତ୍ତମ: ଦ୍ରୁତ ପ୍ରାକଦର୍ଶନ, ସୁଗମତା, ଏବଂ ସନ୍ନିବେଶିତ ପ୍ରୟୋଗଗୁଡ଼ିକName
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
VITS Free
VITS (ଅନୁସରଣୀୟ ସନ୍ଧାନ ସହିତ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱିତା ଜ୍ଞାନ ପାଇଁ ଶେଷ-ରୁ-ଶେଷ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ) ଏକ ସମତଳ ଶେଷ-ରୁ-ଶେଷ TTS ପଦ୍ଧତି ଯାହାକି ବର୍ତ୍ତମାନ ଦୁଇ-ସ୍ତରୀୟ ମଡେଲ ଅପେକ୍ଷା ଅଧିକ ପ୍ରାକୃତିକ ସ୍ୱର ଧ୍ୱନି ସୃଷ୍ଟି କରିଥାଏ। ଏହା ପ୍ରାକୃତିକତାରେ ଏକ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ ଉନ୍ନତି ହାସଲ କରିବା ପାଇଁ ସାଧାରଣକରଣ ପ୍ରବାହ ଏବଂ ପ୍ରତିଦ୍ୱନ୍ଦ୍ୱିତା ପ୍ରଶିକ୍ଷା ପ୍ରକ୍ରିୟା ସହିତ ବୃଦ୍ଧି ପାଇଥିବା ଅନୁସରଣୀୟ ସନ୍ଧାନକୁ ଗ୍ରହଣ କରିଥାଏ।
ଏହା ପାଇଁ ଉତ୍ତମ: ପ୍ରାକୃତିକ ପ୍ରୋସୋଡି ସହିତ ସାଧାରଣ- ଉଦ୍ଦେଶ୍ୟ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟName
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
MeloTTS Free
MyShell.ai ଦ୍ୱାରା MeloTTS ଏକ ବହୁଭାଷୀ TTS ଲାଇବ୍ରେରୀ ଯାହାକି ଇଂରାଜୀ (ଆମେରିକୀୟ, ବ୍ରିଟିଶ, ଭାରତୀୟ, ଅଷ୍ଟ୍ରେଲିଆନ), ସ୍ପେନିସ, ଫ୍ରେଞ୍ଚ, ଚାଇନିଜ, ଜାପାନୀ, ଏବଂ କୋରିଆନକୁ ସମର୍ଥନ କରେ। ଏହା ଅତ୍ୟନ୍ତ ଦ୍ରୁତ, କେବଳ CPU ଉପରେ ପାଖାପାଖି ରିୟଲ-ଟାଇମ ବେଗରେ ପାଠ୍ୟକୁ ପ୍ରକ୍ରିୟା କରିଥାଏ। MeloTTS ଉତ୍ପାଦନ ବ୍ୟବହାର ପାଇଁ ନିର୍ମିତ ଏବଂ CPU ଏବଂ GPU ଉଭୟକୁ ସମର୍ଥନ କରେ।
ଏହା ପାଇଁ ଉତ୍ତମ: ଉତ୍ପାଦନ ପ୍ରୟୋଗଗୁଡ଼ିକୁ ଦ୍ରୁତ, ବହୁଭାଷୀ TTS ଆବଶ୍ୟକ
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
OuteTTS Free
OuteTTS ବଡ଼ ଭାଷା ମଡେଲଗୁଡ଼ିକୁ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ କ୍ଷମତା ସହିତ ବଢ଼ାଇଥାଏ, କିନ୍ତୁ ପ୍ରକୃତ ସ୍ଥାପତ୍ୟକୁ ସଂରକ୍ଷଣ କରିଥାଏ। ଏହା llama.cpp (CPU/GPU), Hugging Face Transformers, ExLlamaV2, VLLM, ଏବଂ Transformers.js ମାଧ୍ୟମରେ ବ୍ରାଉଜର ସନ୍ଧାନକୁ ସମର୍ଥନ କରେ। JSON ଭାବରେ ସଂରକ୍ଷିତ ସ୍ଵର ପ୍ରୋଫାଇଲଗୁଡ଼ିକ ମାଧ୍ୟମରେ ଶୂନ୍ୟ-ଶଟ ଭାଷା କ୍ଲୋନିଂର ବିଶେଷତା।
ଏହା ପାଇଁ ଉତ୍ତମ: ଆଡ଼ଜଷ୍ଟମେଣ୍ଟ, ବ୍ରାଉଜର ଆଧାରିତ TTS, କମ୍-ସମ୍ପଦ ପରିବେଶଗୁଡ଼ିକName
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
Pocket TTS Free
Kyutai (Moshi ର ନିର୍ମାତା) ଦ୍ୱାରା ପକେଟ TTS ଏକ ସଂକଳ୍ପ 100M ପରିମାପ ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ମଡେଲ ଯାହାକି ଏହାର ଓଜନଠାରୁ ଅଧିକ ଭଲ ଭାବରେ ସ୍ପର୍ଶ କରିଥାଏ। ଏହା CPU ଉପରେ ଦକ୍ଷତା ସହିତ ଚାଲୁଛି, ଗୋଟିଏ ସ୍ୱର ନମୁନାରୁ ଶୂନ୍ୟ-ଶଟ ସ୍ୱର କ୍ଲୋନକୁ ସମର୍ଥନ କରେ, ଏବଂ ପ୍ରାକୃତିକ-ସ୍ୱର ଭାଷା ଉତ୍ପାଦନ କରେ। ଛୋଟ ମଡେଲ ଆକାର ଏହାକୁ ଅଂଶ ବିସ୍ତାର ଏବଂ କମ୍-ସମ୍ପଦ ପରିବେଶଗୁଡ଼ିକ ପାଇଁ ଆଦର୍ଶ କରିଥାଏ।
ଏହା ପାଇଁ ଉତ୍ତମ: ହଳଦିଆ ବିସ୍ତାର, CPU-କେବଳ ପରିବେଶ, ଶୀଘ୍ର ଧ୍ୱନି କ୍ଲୋନିଂName
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
Kitten TTS Free
Kitten TTS by KittenML is an ultra-lightweight text-to-speech model built on ONNX. With variants from 15M to 80M parameters (25-80 MB on disk), it delivers high-quality voice synthesis on CPU without requiring a GPU. Features 8 built-in voices, adjustable speech speed, and built-in text preprocessing for numbers, currencies, and units. Ideal for edge deployment and low-latency applications.
ଏହା ପାଇଁ ଉତ୍ତମ: Fast lightweight TTS, edge deployment, low-latency applications
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
Bark Standard
ପରିବର୍ତ୍ତକ ଆଧାରିତ ପାଠ୍ୟ-ରୁ-ଧ୍ୱନି ମଡେଲ ଯାହାକି ବାସ୍ତବବାଦୀ ବକ୍ତବ୍ୟ, ସଂଗୀତ ଏବଂ ଧ୍ୱନି ପ୍ରଭାବ ସୃଷ୍ଟି କରିଥାଏ।
ବିକାଶକାରୀ: Suno · ଅନୁମତିପତ୍ର: MIT
ଚେଷ୍ଟାକରନ୍ତୁ
Bark Small Standard
ଦ୍ରୁତ ଅନୁମାନ ଏବଂ କମ ସ୍ମୃତିସ୍ଥାନ ବ୍ୟବହାର ସହିତ Bark ର ହାଲୁକା ସଂସ୍କରଣ ।
ବିକାଶକାରୀ: Suno · ଅନୁମତିପତ୍ର: MIT
ଚେଷ୍ଟାକରନ୍ତୁ
CosyVoice 2 Standard
ଅଲିବାବା ର ମାପଯୋଗ୍ୟ ଷ୍ଟ୍ରିମିଂ TTS ମାନବ-ସମାନ ପ୍ରାକୃତିକତା ଏବଂ ଶୂନ୍ୟ-ନିକଟତର ଲାଟେନସି ସହିତ।
ବିକାଶକାରୀ: Alibaba (Tongyi Lab) · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
Dia TTS Standard
ବହୁ-ବକ୍ତା ସଂଳାପ ନିର୍ମାଣ ମଡେଲ ଯାହା ବକ୍ତାମାନଙ୍କ ମଧ୍ୟରେ ପ୍ରାକୃତିକ ବାର୍ତ୍ତାଳାପ ସୃଷ୍ଟି କରେ।
ବିକାଶକାରୀ: Nari Labs · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
Parler TTS Standard
ଆପଣ ପ୍ରାକୃତିକ ଭାଷାରେ ଚାହୁଁଥିବା ଧ୍ୱନିକୁ ବର୍ଣ୍ଣନା କରନ୍ତୁ ଏବଂ ପାର୍ଲର ମେଳଖାଉଥିବା ଭାଷଣ ସୃଷ୍ଟି କରିଥାଏ।
ବିକାଶକାରୀ: Hugging Face · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
GLM-TTS Standard
ମୁକ୍ତ ଉତ୍ସ TTS ନମୂନାଗୁଡ଼ିକ ମଧ୍ୟରେ ସର୍ବନିମ୍ନ ଅକ୍ଷର ତ୍ରୁଟି ହାରକୁ ହାସଲ କରିଥାଏ।
ବିକାଶକାରୀ: Zhipu AI · ଅନୁମତିପତ୍ର: GLM-4 License
ଚେଷ୍ଟାକରନ୍ତୁ
IndexTTS-2 Standard
ଶୂନ୍ୟ-ଶଟ TTS ଫାଇନ-ଗ୍ରେନ ଇମୋସନ ନିୟନ୍ତ୍ରଣ ଏବଂ ଉଚ୍ଚ ଅଭିବ୍ୟକ୍ତିଶୀଳତା ସହିତ ।
ବିକାଶକାରୀ: Index Team · ଅନୁମତିପତ୍ର: Bilibili Model License
ଚେଷ୍ଟାକରନ୍ତୁ
Spark TTS Standard
ନିୟନ୍ତ୍ରଣଯୋଗ୍ୟ ଅନୁଭୂତି ଏବଂ ପରାମର୍ଶ ମାଧ୍ୟମରେ କଥାବାର୍ତ୍ତା ଶୈଳୀ ସହିତ ଧ୍ୱନି କ୍ଲୋନ TTS।
ବିକାଶକାରୀ: SparkAudio · ଅନୁମତିପତ୍ର: CC BY-NC-SA 4.0
ଚେଷ୍ଟାକରନ୍ତୁ
GPT-SoVITS Standard
କିଛି-ଶଟ ସ୍ୱର କ୍ଲୋନ TTS ଯାହାକି କେବଳ5ସେକେଣ୍ଡ ଧ୍ୱନିରୁ ଯେକୌଣସି ସ୍ୱରକୁ ନକଲ କରିଥାଏ।
ବିକାଶକାରୀ: RVC-Boss · ଅନୁମତିପତ୍ର: MIT
ଚେଷ୍ଟାକରନ୍ତୁ
Orpheus Standard
100K ଘଣ୍ଟା ବାକ୍ୟ ତଥ୍ୟ ଉପରେ ପ୍ରଶିକ୍ଷିତ ମାନବ ସ୍ତରୀୟ ଭାବଗତ TTS ମଡେଲ ।
ବିକାଶକାରୀ: Canopy Labs · ଅନୁମତିପତ୍ର: Llama 3.2 Community
ଚେଷ୍ଟାକରନ୍ତୁ
Qwen3 TTS Standard
ଆଲିବାବାର ବହୁଭାଷୀ TTS ଧ୍ୱନି କ୍ଲୋନିଂ ସହିତ, ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଧ୍ୱନି, ଏବଂ ପାଠ୍ୟରୁ ଧ୍ୱନି ଡିଜାଇନ।
ବିକାଶକାରୀ: Alibaba (Qwen) · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
Chatterbox Turbo Standard
ଦ୍ରୁତ ଚାଟରବକ୍ସ ଅଧି-200ms ଲାଟେନସି ଏବଂ ହସ, କାଶି ଏବଂ ଅଧିକ ପାଇଁ ପାରାଲିଙ୍ଗୁଇଷ୍ଟିକ ଟ୍ୟାଗ ସହିତ।
ବିକାଶକାରୀ: Resemble AI · ଅନୁମତିପତ୍ର: MIT
ଚେଷ୍ଟାକରନ୍ତୁ
Dia 2 Standard
ବହୁ-ଭାଷକ ବାର୍ତ୍ତାଳାପ ଏବଂ ପାରାଲିଙ୍ଗୁଇଷ୍ଟିକ ସଙ୍କେତ ସହିତ ପ୍ରଥମ-ସଂଳାପ TTSକୁ ପ୍ରବାହିତ କରନ୍ତୁ।
ବିକାଶକାରୀ: Nari Labs · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
VoxCPM Standard
Tokenizer-ମୁକ୍ତ TTS 44.1kHz ଧ୍ୱନି ଉତ୍ପାଦନ କରୁଅଛି ଯାହାର ପ୍ରସଙ୍ଗ-ସଚେତନ ଅନୁଚ୍ଛେଦ ସ୍ଥିରତା ଅଛି।
ବିକାଶକାରୀ: OpenBMB · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
TADA Standard
ପାଠ୍ୟ-ଅକୁସିକ ଦ୍ୱିଗୁଣିତ ସଂଯୋଜକତା ସହିତ ଶୂନ୍ୟ-ହାଲ୍ୟୁସିନେଶନ TTS, ତୁଳନାଯୋଗ୍ୟ LLM TTS ଅପେକ୍ଷା5x ଦ୍ରୁତ।
ବିକାଶକାରୀ: Hume AI · ଅନୁମତିପତ୍ର: MIT
ଚେଷ୍ଟାକରନ୍ତୁ
VibeVoice Standard
ପୋଡକାଷ୍ଟ ଏବଂ ଧ୍ୱନି ପୁସ୍ତକ ଭଳି ଲମ୍ବା-ଫର୍ମ ବହୁ-ବକ୍ତା ବିଷୟବସ୍ତୁ ପାଇଁ Microsoft ମଡେଲ।
ବିକାଶକାରୀ: Microsoft · ଅନୁମତିପତ୍ର: MIT
ଚେଷ୍ଟାକରନ୍ତୁ
CosyVoice3 Standard
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ବିକାଶକାରୀ: Alibaba (FunAudioLLM) · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
CosyVoice 2
ଅଲିବାବା ର ମାପଯୋଗ୍ୟ ଷ୍ଟ୍ରିମିଂ TTS ମାନବ-ସମାନ ପ୍ରାକୃତିକତା ଏବଂ ଶୂନ୍ୟ-ନିକଟତର ଲାଟେନସି ସହିତ।
ଭାଷା: en, zh, ja, ko, fr, de, it, es
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
GLM-TTS
ମୁକ୍ତ ଉତ୍ସ TTS ନମୂନାଗୁଡ଼ିକ ମଧ୍ୟରେ ସର୍ବନିମ୍ନ ଅକ୍ଷର ତ୍ରୁଟି ହାରକୁ ହାସଲ କରିଥାଏ।
ଭାଷା: en, zh
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
IndexTTS-2
ଶୂନ୍ୟ-ଶଟ TTS ଫାଇନ-ଗ୍ରେନ ଇମୋସନ ନିୟନ୍ତ୍ରଣ ଏବଂ ଉଚ୍ଚ ଅଭିବ୍ୟକ୍ତିଶୀଳତା ସହିତ ।
ଭାଷା: en, zh
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Spark TTS
ନିୟନ୍ତ୍ରଣଯୋଗ୍ୟ ଅନୁଭୂତି ଏବଂ ପରାମର୍ଶ ମାଧ୍ୟମରେ କଥାବାର୍ତ୍ତା ଶୈଳୀ ସହିତ ଧ୍ୱନି କ୍ଲୋନ TTS।
ଭାଷା: en, zh
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
GPT-SoVITS
କିଛି-ଶଟ ସ୍ୱର କ୍ଲୋନ TTS ଯାହାକି କେବଳ5ସେକେଣ୍ଡ ଧ୍ୱନିରୁ ଯେକୌଣସି ସ୍ୱରକୁ ନକଲ କରିଥାଏ।
ଭାଷା: en, zh, ja, ko
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Chatterbox
Resemble AI ଠାରୁ ଆବେଗ ନିୟନ୍ତ୍ରଣ ସହିତ state-of-the-art ଶୂନ୍ୟ-ଶଟ ସ୍ୱର କ୍ଲୋନିଂ ।
ଭାଷା: en
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Tortoise TTS
ବହୁ-ଭାଷା ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ଗୁଣବତ୍ତା ଉପରେ ଆଧାରିତ ଅଟୋ-ରିଗ୍ରେସିଭ ଢାଞ୍ଚା ସହିତ ।
ଭାଷା: en
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
OpenVoice
ଶୈଳୀ, ଅନୁଭୂତି ଏବଂ ଉଚ୍ଚାରଣ ଉପରେ ଗ୍ରେନାଲ ନିୟନ୍ତ୍ରଣ ସହିତ ତୁରନ୍ତ ସ୍ୱର କ୍ଲୋନିଂ।
ଭାଷା: en, zh, ja, ko, fr, de, es, it
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Qwen3 TTS
ଆଲିବାବାର ବହୁଭାଷୀ TTS ଧ୍ୱନି କ୍ଲୋନିଂ ସହିତ, ପୂର୍ବନିର୍ଦ୍ଧାରିତ ଧ୍ୱନି, ଏବଂ ପାଠ୍ୟରୁ ଧ୍ୱନି ଡିଜାଇନ।
ଭାଷା: en, zh, ja, ko, de, fr, ru, pt, es, it
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Chatterbox Turbo
ଦ୍ରୁତ ଚାଟରବକ୍ସ ଅଧି-200ms ଲାଟେନସି ଏବଂ ହସ, କାଶି ଏବଂ ଅଧିକ ପାଇଁ ପାରାଲିଙ୍ଗୁଇଷ୍ଟିକ ଟ୍ୟାଗ ସହିତ।
ଭାଷା: en
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
VoxCPM
Tokenizer-ମୁକ୍ତ TTS 44.1kHz ଧ୍ୱନି ଉତ୍ପାଦନ କରୁଅଛି ଯାହାର ପ୍ରସଙ୍ଗ-ସଚେତନ ଅନୁଚ୍ଛେଦ ସ୍ଥିରତା ଅଛି।
ଭାଷା: en, zh
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
OuteTTS
LLM-ଆଧାରିତ TTS ଯାହାକି CPU, GPU, କିମ୍ବା lama.cpp ଏବଂ Transformers.js ମାଧ୍ୟମରେ ବ୍ରାଉଜରରେ ଚଲାଇଥାଏ।
ଭାଷା: en
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Pocket TTS
ଗୋଟିଏ ନମୁନାରୁ ସ୍ୱର କ୍ଲୋନିଂ ସହିତ Kyutai ଦ୍ୱାରା ହଳଦିଆ 100M ପରିମାପକ ମଡେଲ ।
ଭାଷା: en, fr
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
CosyVoice3
Next-generation multilingual TTS with bi-streaming, emotion control, and zero-shot voice cloning.
ଭାଷା: en, zh, ja, ko, de, es, fr, it, ru
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
MOSS-TTS
Ultra-long 20-language TTS supporting up to 1 hour of continuous generation with phoneme-level control.
ଭାଷା: en, zh, de, es, fr, ja, it, hu, ko, ru, fa, ar, pl, pt, cs, da, sv, el, tr
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
MegaTTS3
ByteDance's sparse alignment TTS with adjustable intelligibility vs. speaker similarity.
ଭାଷା: en, zh
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁବିକାଶକାରୀ- ପ୍ରଥମ API
OpenAI-ସହଜ REST API. ଗୋଟିଏ ଶେଷ ବିନ୍ଦୁ, 22+ ନମୂନା. ରିୟଲ-ଟାଇମ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଷ୍ଟ୍ରିମିଂ ସମର୍ଥନ।
- OpenAI- ସୁସଂଗତ ଶୈଳୀ
- ରିଅଲ-ଟାଇମ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ TTS ପ୍ରବାହ
- ବଡ଼ କାର୍ଯ୍ୟଗୁଡ଼ିକ ପାଇଁ ବ୍ୟାଚ ପ୍ରକ୍ରିୟାକରଣ
- Webhook ବିଜ୍ଞପ୍ତିଗୁଡ଼ିକ
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
ସରଳ, ପାରଦର୍ଶୀ ମୂଲ୍ୟାଙ୍କନ
ମୁକ୍ତ ଭାବରେ ଆରମ୍ଭ କରନ୍ତୁ । ଆପଣ ବଢିବା ସମୟରେ ମାପନ୍ତୁ ।
ମୁକ୍ତ
15 କ୍ରିଡ଼େଟ
- Kokoro, Piper, VITS, MeloTTS
- 500 ଅକ୍ଷର ସୀମା
- 3 ଜେନ/ଘଣ୍ଟା (କୌଣସି ଖାତା ନାହିଁ)
ଆରମ୍ଭକର୍ତ୍ତା
500 ଋଣ/ମାସ
- ସମସ୍ତ 22+ ଆକାର
- ପ୍ରତି ଉତ୍ପତ୍ତିରେ 100,000 ଅକ୍ଷର
- ଧ୍ୱନି କ୍ଲୋନିଂName
ପ୍ରୋ
2,000 ଋଣ/ମାସ
- ଆରମ୍ଭକର୍ତ୍ତାରେ ସବୁକିଛି
- API ସୁଗମତା
- ପ୍ରାଥମିକତା ପ୍ରକ୍ରିୟାକରଣ
ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName
ଆମେ କଣ ସୁଧାରିପାରିବା? ଆପଣଙ୍କର ପ୍ରତିକ୍ରିୟା ଆମକୁ ସମସ୍ୟାର ସମାଧାନ କରିବାରେ ସହାୟକ ହୋଇଥାଏ ।
AI ଧ୍ୱନି ବ୍ୟବହାର କରିବା ଆଜି ଆରମ୍ଭ କରନ୍ତୁ
TTS.ai ବ୍ୟବହାର କରି ନିର୍ମାତା, ବିକାଶକାରୀ ଏବଂ ବ୍ୟବସାୟରେ ଯୋଗ ଦିଅନ୍ତୁ