Свободный IA Текст к речи
22+ модели с открытым исходным кодом, 100+ голоса, 32+ Не требуется никаких счетов.
Все, что вам нужно для Голоса AI
26 инструментов, оснащенных моделями АИ 24+ с открытыми исходными кодами
22+ модели голоса AI
Наиболее полный набор моделей ТТС с открытыми исходными кодами на одной платформе
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Лучший для: High-quality TTS with minimal latency, streaming applications
Попробуй освободитьсяPiper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Лучший для: Quick previews, accessibility, and embedded applications
Попробуй освободитьсяVITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Лучший для: General-purpose text-to-speech with natural prosody
Попробуй освободитьсяMeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Лучший для: Производственные приложения, требующие быстрых, многоязычных ТТС
Попробуй освободитьсяBark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Разработчик: Suno · Лицензия: MIT
Попробуй.Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Разработчик: Suno · Лицензия: MIT
Попробуй.CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Разработчик: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0
Попробуй.Dia TTS Standard
Модель создания диалогов с участием нескольких ораторов, которая создает естественный диалог между ораторами.
Разработчик: Nari Labs · Лицензия: Apache 2.0
Попробуй.Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Разработчик: Hugging Face · Лицензия: Apache 2.0
Попробуй.IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Разработчик: Index Team · Лицензия: Apache 2.0
Попробуй.Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Разработчик: SparkAudio · Лицензия: Apache 2.0
Попробуй.GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Разработчик: RVC-Boss · Лицензия: MIT
Попробуй.Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Разработчик: Canopy Labs · Лицензия: Llama 3.2 Community
Попробуй.Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Разработчик: Alibaba (Qwen) · Лицензия: Apache 2.0
Попробуй.CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Языки: en, zh, ja, ko, fr, de, it, es
Голос клоновIndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Языки: en, zh
Голос клоновSpark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Языки: en, zh
Голос клоновGPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Языки: en, zh, ja, ko
Голос клоновChatterbox
Современное клонирование с нулевым голосом с эмоциональным контролем из Resemble AI.
Языки: en
Голос клоновTortoise TTS
Текст-пик с несколькими счетами был сосредоточен на качестве с авторегрессивной архитектурой.
Языки: en
Голос клоновOpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
Языки: en, zh, ja, ko, fr, de, es, it
Голос клоновQwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Языки: en, zh, ja, ko, de, fr, ru, pt, es, it
Голос клоновРазработчик - первый API
OpenAI-совместимый REST API. Одна конечная точка, 22+ модели. Стремительная поддержка для приложений в режиме реального времени.
- OpenAI-совместимый формат
- Скачок TTS для приложений в режиме реального времени
- Обработка партии для выполнения крупных работ
- Уведомления в сети < < Уэбхук > >
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Простое, прозрачное ценообразование
Начинай свободно, по мере роста.
Свободные
50 кредитов
- Kokoro, Piper, VITS, MeloTTS
- Предел в 500 знаков
- 3 г/час (без учета)
Запуск
500 кредитов в месяц
- Все 22+ модели
- Предельное значение 5 000 знаков
- Клонирование голоса
Про
2000 кредитов в месяц
- Всё в стартере
- Доступ к API
- Приоритетная обработка
Предприятие
10 000 кредитов в месяц
- Всё в про
- Налив API
- Приоритетная очередь
Часто задаваемые вопросы
Начните использовать AI Voice сегодня
Присоединяйтесь к создателям, разработчикам и предприятиям, использующим TTS.ai