Вільний комп' ютер Текст для мовлення
22+ моделі з відкритим кодом, 100+ голосів, 32+ Не потрібен рахунок.
Усе, що потрібно для голосу
26 інструментів, що працюють 24+ з відкритим кодом
22+ Моделі комп' ютерного гравця
Найрозширеніша збірка моделей TTS з відкритим кодом на одній платформі
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Найкраще для: High-quality TTS with minimal latency, streaming applications
Спробувати вільно
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Найкраще для: Quick previews, accessibility, and embedded applications
Спробувати вільно
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Найкраще для: General-purpose text-to-speech with natural prosody
Спробувати вільно
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Найкраще для: Програми для виробництва, які потребують швидкого, багатомовного TTS
Спробувати вільно
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Розробник: Suno · Ліцензія: MIT
Спробуй.
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Розробник: Suno · Ліцензія: MIT
Спробуй.
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Розробник: Alibaba (Tongyi Lab) · Ліцензія: Apache 2.0
Спробуй.
Dia TTS Standard
Модель створення діалогового вікна синтезу мовлення, яка створює натуральні розмови між промовцями.
Розробник: Nari Labs · Ліцензія: Apache 2.0
Спробуй.
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Розробник: Hugging Face · Ліцензія: Apache 2.0
Спробуй.
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Розробник: Index Team · Ліцензія: Apache 2.0
Спробуй.
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Розробник: SparkAudio · Ліцензія: Apache 2.0
Спробуй.
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Розробник: RVC-Boss · Ліцензія: MIT
Спробуй.
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Розробник: Canopy Labs · Ліцензія: Llama 3.2 Community
Спробуй.
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Розробник: Alibaba (Qwen) · Ліцензія: Apache 2.0
Спробуй.
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Мови: en, zh, ja, ko, fr, de, it, es
Клонувати голос
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Мови: en, zh
Клонувати голос
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Мови: en, zh
Клонувати голос
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Мови: en, zh, ja, ko
Клонувати голос
Chatterbox
Державне непродуктивне клонування голосу з емоційною контролею Resemble AI.
Мови: en
Клонувати голос
Tortoise TTS
Багатоголосовий текстовий синтез фокусувався на якості з автоматичною архітектурою.
Мови: en
Клонувати голос
OpenVoice
Миттєве клонування голосу з гранулярним контролем над стилем, емоціями та акцентом.
Мови: en, zh, ja, ko, fr, de, es, it
Клонувати голос
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Мови: en, zh, ja, ko, de, fr, ru, pt, es, it
Клонувати голосРозробник- перший API
Сумісний з OpenAI API REST. Одна точка кінця, 22 моделі. Підтримка потоку для програм у режимі реального часу.
- Сумісний з OpenAI формат
- Потік TTS для програм у режимі реального часу
- Пакетна обробка для великих завдань
- Сповіщення веб- сторінокComment
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Просте, прозоре розташування
Почніть вільно. Масштабуйте зі зростанням.
Вільно
50 кредитів
- Kokoro, Piper, VITS, MeloTTS
- 500 меж символів
- 3 gen/година (без облікового запису)
Започаткування
500 кредитів/ місяців
- Всі моделі 22+
- 5 000 символів обмеження
- Клонування голосу
Pro
2000 кредитів/ місяців
- Все в старті
- Доступ до API
- Обробка пріоритету
Підприємство
10 000 кредитів на місяць
- Все в Pro
- Місткий API
- Черга пріоритету
Часті запитання
Почати використання комп' ютерного голосу сьогодні
Приєднуйтеся до творців, розробників і підприємств за допомогою TTS.ai