Free AIName Матн ба талаффузComment
22+ намунаҳои манбаи кушод, 100+ овозҳо, 32+ забонҳо. Ҳисоб талаб карда намешавад.
Ҳама чизе, ки ба шумо барои овози AI лозим аст
26 асбоб, ки аз ҷониби 24+ моделҳои AI-и манбаи кушода кор мекунанд
22+ намунаҳои овози AI
Ҷамъоварии пурраи моделҳои TTS-и манбаи кушод дар як платформа
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Беҳтарин барои: High-quality TTS with minimal latency, streaming applications
Санҷиши ройгон
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Беҳтарин барои: Quick previews, accessibility, and embedded applications
Санҷиши ройгон
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Беҳтарин барои: General-purpose text-to-speech with natural prosody
Санҷиши ройгон
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Беҳтарин барои: Барномаҳои истеҳсолӣ, ки ба TTS-и тез ва бисёрзабон ниёз доранд
Санҷиши ройгон
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Тайёркунанда: Suno · Иҷозатнома: MIT
Кӯшиш кунед
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Тайёркунанда: Suno · Иҷозатнома: MIT
Кӯшиш кунед
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Тайёркунанда: Alibaba (Tongyi Lab) · Иҷозатнома: Apache 2.0
Кӯшиш кунед
Dia TTS Standard
Мувофиқи ин назария, раванди эҷодкорӣ равандест, ки дар натиҷаи мубодилаи иттилоот ба вуҷуд меояд.
Тайёркунанда: Nari Labs · Иҷозатнома: Apache 2.0
Кӯшиш кунед
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Тайёркунанда: Hugging Face · Иҷозатнома: Apache 2.0
Кӯшиш кунед
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Тайёркунанда: Index Team · Иҷозатнома: Apache 2.0
Кӯшиш кунед
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Тайёркунанда: SparkAudio · Иҷозатнома: Apache 2.0
Кӯшиш кунед
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Тайёркунанда: RVC-Boss · Иҷозатнома: MIT
Кӯшиш кунед
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Тайёркунанда: Canopy Labs · Иҷозатнома: Llama 3.2 Community
Кӯшиш кунед
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Тайёркунанда: Alibaba (Qwen) · Иҷозатнома: Apache 2.0
Кӯшиш кунед
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Забонҳо: en, zh, ja, ko, fr, de, it, es
Намунаи овоз
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Забонҳо: en, zh
Намунаи овоз
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Забонҳо: en, zh
Намунаи овоз
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Забонҳо: en, zh, ja, ko
Намунаи овоз
Chatterbox
Aérospatiale Alouette III (англ. Alouette III) — як ҳавогарди сохтаи Aérospatiale аст.
Забонҳо: en
Намунаи овоз
OpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
Забонҳо: en, zh, ja, ko, fr, de, es, it
Намунаи овоз
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Забонҳо: en, zh, ja, ko, de, fr, ru, pt, es, it
Намунаи овозБарномасозон
OpenAI-совместимый REST API. Одна конечная точка, 22+ моделей. Поддержка потока для приложений реального времени.
- Андозаи мувофиқи OpenAI
- Stream TTS барои барномаҳои вақти воқеӣ
- Обработка пакетов для больших заданий
- Огоҳиномаҳои Webhook
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Нархгузории оддӣ ва шаффоф
Бепул оғоз кунед. Ҳангоми афзоиш андоза кунед.
Озод
50 кредит
- Kokoro, Piper, VITS, MeloTTS
- Маҳдудияти аломат:
- 3 ген/ соат (бе ҳисоб)
Оғозкунанда
500 кредит/моҳ
- Ҳамаи 22+ моделҳо
- Маҳдудияти 5000 аломат
- Тасвири овоз
Про
2,000 кредит/моҳ
- Ҳама чиз дар оғозкунанда
- Дастрасии API
- Аҳамиятдиҳии коркард
Корхона
10,000 кредит/моҳа
- Ҳама чиз дар Pro
- API- и маҷмӯӣ
- Навбати пешрафта
Саволҳои пурсидашаванда
Имрӯз истифода бурдани овози AI- ро оғоз кунед
Ба эҷодкорон, таҳиягарон ва тиҷорат бо истифода аз TTS.ai ҳамроҳ шавед