ମୁକ୍ତ AI ପାଠ୍ୟରୁ ବାକ୍ୟName
22+ ମୁକ୍ତ ଉତ୍ସ ମଡେଲ, 100+ ସ୍ୱର, 32+ କୌଣସି ଖାତା ଆବଶ୍ୟକ ନାହିଁ ।
ସ୍ୱର AI ପାଇଁ ଆପଣଙ୍କୁ ଆବଶ୍ୟକୀୟ ସବୁକିଛିName
24+ ମୁକ୍ତ ଉତ୍ସ ଏଆଇ ମଡେଲ ଦ୍ୱାରା 26ଟି ଉପକରଣ
22+ AI ଧ୍ୱନି ନମୂନାName
ଗୋଟିଏ ପ୍ଲାଟଫର୍ମରେ ମୁକ୍ତ ଉତ୍ସ TTS ମଡେଲର ସବୁଠାରୁ ବ୍ୟାପକ ସଂଗ୍ରହ
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
ଏହା ପାଇଁ ଉତ୍ତମ: High-quality TTS with minimal latency, streaming applications
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
ଏହା ପାଇଁ ଉତ୍ତମ: Quick previews, accessibility, and embedded applications
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
ଏହା ପାଇଁ ଉତ୍ତମ: General-purpose text-to-speech with natural prosody
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
ଏହା ପାଇଁ ଉତ୍ତମ: ଉତ୍ପାଦନ ପ୍ରୟୋଗଗୁଡ଼ିକୁ ଦ୍ରୁତ, ବହୁଭାଷୀ TTS ଆବଶ୍ୟକ
ମୁକ୍ତ ଭାବରେ ଚେଷ୍ଟାକରନ୍ତୁ
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
ବିକାଶକାରୀ: Suno · ଅନୁମତିପତ୍ର: MIT
ଚେଷ୍ଟାକରନ୍ତୁ
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
ବିକାଶକାରୀ: Suno · ଅନୁମତିପତ୍ର: MIT
ଚେଷ୍ଟାକରନ୍ତୁ
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ବିକାଶକାରୀ: Alibaba (Tongyi Lab) · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
Dia TTS Standard
ବହୁ-ବକ୍ତା ସଂଳାପ ନିର୍ମାଣ ମଡେଲ ଯାହା ବକ୍ତାମାନଙ୍କ ମଧ୍ୟରେ ପ୍ରାକୃତିକ କଥାବାର୍ତ୍ତା ସୃଷ୍ଟି କରେ।
ବିକାଶକାରୀ: Nari Labs · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
ବିକାଶକାରୀ: Hugging Face · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
ବିକାଶକାରୀ: Index Team · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
ବିକାଶକାରୀ: SparkAudio · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
ବିକାଶକାରୀ: RVC-Boss · ଅନୁମତିପତ୍ର: MIT
ଚେଷ୍ଟାକରନ୍ତୁ
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
ବିକାଶକାରୀ: Canopy Labs · ଅନୁମତିପତ୍ର: Llama 3.2 Community
ଚେଷ୍ଟାକରନ୍ତୁ
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
ବିକାଶକାରୀ: Alibaba (Qwen) · ଅନୁମତିପତ୍ର: Apache 2.0
ଚେଷ୍ଟାକରନ୍ତୁ
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ଭାଷା: en, zh, ja, ko, fr, de, it, es
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
ଭାଷା: en, zh
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
ଭାଷା: en, zh
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
ଭାଷା: en, zh, ja, ko
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Chatterbox
Resemble AI ଠାରୁ ଭାବନା ନିୟନ୍ତ୍ରଣ ସହିତ state-of-the-art ଶୂନ୍ୟ-ଶଟ ସ୍ୱର କ୍ଲୋନିଂ ।
ଭାଷା: en
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Tortoise TTS
ବହୁ-ଭାଷା ପାଠ୍ୟ-ରୁ-ବାକ୍ୟ ଗୁଣବତ୍ତା ଉପରେ ଆଧାରିତ ଅଟୋ-ରିଗ୍ରେସିଭ ଢାଞ୍ଚା ସହିତ ।
ଭାଷା: en
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
OpenVoice
ଶୈଳୀ, ଅନୁଭୂତି, ଏବଂ ଉଚ୍ଚାରଣ ଉପରେ ଗ୍ରାନୁଲାର ନିୟନ୍ତ୍ରଣ ସହିତ ତୁରନ୍ତ ସ୍ୱର କ୍ଲୋନିଂ।
ଭାଷା: en, zh, ja, ko, fr, de, es, it
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁ
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
ଭାଷା: en, zh, ja, ko, de, fr, ru, pt, es, it
ଧ୍ୱନିକୁ କ୍ଲୋନ କରନ୍ତୁବିକାଶକାରୀ- ପ୍ରଥମ API
OpenAI-ସହଜ REST API. ଗୋଟିଏ ଶେଷ ବିନ୍ଦୁ, 22+ ନମୂନା. ରିୟଲ-ଟାଇମ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ ଷ୍ଟ୍ରିମିଂ ସମର୍ଥନ।
- OpenAI- ସୁସଂଗତ ଶୈଳୀ
- ରିଅଲ-ଟାଇମ ପ୍ରୟୋଗଗୁଡ଼ିକ ପାଇଁ TTS ପ୍ରବାହ
- ବଡ଼ କାର୍ଯ୍ୟଗୁଡ଼ିକ ପାଇଁ ବ୍ୟାଚ ପ୍ରକ୍ରିୟାକରଣ
- Webhook ବିଜ୍ଞପ୍ତିଗୁଡ଼ିକ
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
ସରଳ, ସ୍ୱଚ୍ଛ ମୂଲ୍ୟ ନିର୍ଦ୍ଧାରଣ
ମୁକ୍ତ ଭାବରେ ଆରମ୍ଭ କରନ୍ତୁ । ଆପଣ ବଢିବା ସମୟରେ ମାପନ୍ତୁ ।
ମୁକ୍ତ
୫୦ ୟୁରୋ
- Kokoro, Piper, VITS, MeloTTS
- 500 ଅକ୍ଷର ସୀମା
- 3 ଜେନ/ଘଣ୍ଟା (କୌଣସି ଖାତା ନାହିଁ)
ପ୍ରୋ
2,000 ଋଣ/ମାସ
- ଆରମ୍ଭକର୍ତ୍ତାରେ ସବୁକିଛି
- API ସୁଗମତା
- ପ୍ରାଥମିକତା ପ୍ରକ୍ରିୟାକରଣ
ପ୍ରାୟ ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନName
ଆଜି AI ଧ୍ୱନି ବ୍ୟବହାର କରିବା ଆରମ୍ଭ କରନ୍ତୁName
TTS.ai ବ୍ୟବହାର କରି ନିର୍ମାତା, ବିକାଶକାରୀ ଏବଂ ବ୍ୟବସାୟରେ ସାମିଲ ହୁଅନ୍ତୁ