Free AIName Мәтінді сөйлеугеName
22+ ашық модель, 100+ дауыс, 32+ тілдер. Тіркелгі керек емес.
Дыбыстық жасанды интеллект үшін қажет барлық нәрсеName
26 құрал, 24+ ашық кодты ДЖ моделімен жұмыс істейді
22+ AI дауыс үлгілеріName
Бір платформадағы ашық кодты TTS үлгілерінің ең толық жинағыName
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Артықшылығы: High-quality TTS with minimal latency, streaming applications
Тегін сынау
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Артықшылығы: Quick previews, accessibility, and embedded applications
Тегін сынау
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Артықшылығы: General-purpose text-to-speech with natural prosody
Тегін сынау
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Артықшылығы: Жедел, көп тілді TTS қажет ететін өндірістік қолданбаларName
Тегін сынау
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Жасаушы: Suno · Лицензиясы: MIT
Сынап көру
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Жасаушы: Suno · Лицензиясы: MIT
Сынап көру
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Жасаушы: Alibaba (Tongyi Lab) · Лицензиясы: Apache 2.0
Сынап көру
Dia TTS Standard
Multi-speaker dialog generation model) — сөйлеушілер арасындағы табиғи диалогты құру үшін қолданылатын модель.
Жасаушы: Nari Labs · Лицензиясы: Apache 2.0
Сынап көру
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Жасаушы: Hugging Face · Лицензиясы: Apache 2.0
Сынап көру
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Жасаушы: Index Team · Лицензиясы: Apache 2.0
Сынап көру
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Жасаушы: SparkAudio · Лицензиясы: Apache 2.0
Сынап көру
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Жасаушы: RVC-Boss · Лицензиясы: MIT
Сынап көру
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Жасаушы: Canopy Labs · Лицензиясы: Llama 3.2 Community
Сынап көру
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Жасаушы: Alibaba (Qwen) · Лицензиясы: Apache 2.0
Сынап көру
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Тілдер: en, zh, ja, ko, fr, de, it, es
Дыбысты көшірмелеу
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Тілдер: en, zh
Дыбысты көшірмелеу
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Тілдер: en, zh
Дыбысты көшірмелеу
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Тілдер: en, zh, ja, ko
Дыбысты көшірмелеу
Chatterbox
1997 жылдан - ҚР Ұлттық қауіпсіздік комитеті төрағасының бірінші орынбасарының орынбасары.
Тілдер: en
Дыбысты көшірмелеу
Tortoise TTS
Компьютерлік графика — компьютерлік графиканың бір саласы болып табылады.
Тілдер: en
Дыбысты көшірмелеу
OpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
Тілдер: en, zh, ja, ko, fr, de, es, it
Дыбысты көшірмелеу
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Тілдер: en, zh, ja, ko, de, fr, ru, pt, es, it
Дыбысты көшірмелеуЖасаушылар үшін API
OpenAI-ге үйлесімді REST API. Бір консоль, 22+ үлгісі. Реал уақыт қолданбаларын тасымалдауды қолдау.
- OpenAI үйлесімді пішімі
- TTS-ті тікелей қолданбалар үшін тасымалдау
- Үлкен тапсырмаларды дестелеу
- Webhook құлақтандырулары
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Қарапайым, мөлдір бағалау
Еркін бастаңыз. Өсе келе масштабтаңыз.
Профиль
2000 кредит/ ай
- Бастауыштағы барлығы
- API қатынау
- Артықшылықты өңдеу
Жиі қойылатын сұрақтар
AI дыбысын бүгін қолдана бастаңыз
TTS.ai қолданатын шығарушыларға, бағдарламалаушыларға және кәсіпорындарға қосылыңыз