Свободный IA Текст к речи

22+ модели с открытым исходным кодом, 100+ голоса, 32+ Не требуется никаких счетов.

0/500 символы Свободные
Нет кредитной карты 50 бесплатных кредитов 32+ языков Коммерческое использование
0:00 / 0:00
Загрузить звук Ссылка истекает в 24 ч.
Расскажи своим друзьям!

Все, что вам нужно для Голоса AI

26 инструментов, оснащенных моделями АИ 24+ с открытыми исходными кодами

22+ модели голоса AI

Наиболее полный набор моделей ТТС с открытыми исходными кодами на одной платформе

Kokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Лучший для: High-quality TTS with minimal latency, streaming applications

Попробуй освободиться

Piper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Лучший для: Quick previews, accessibility, and embedded applications

Попробуй освободиться

VITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Лучший для: General-purpose text-to-speech with natural prosody

Попробуй освободиться

MeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Лучший для: Производственные приложения, требующие быстрых, многоязычных ТТС

Попробуй освободиться

Bark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Разработчик: Suno · Лицензия: MIT

Попробуй.

Bark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Разработчик: Suno · Лицензия: MIT

Попробуй.

CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Разработчик: Alibaba (Tongyi Lab) · Лицензия: Apache 2.0

Попробуй.

Dia TTS Standard

Модель создания диалогов с участием нескольких ораторов, которая создает естественный диалог между ораторами.

Разработчик: Nari Labs · Лицензия: Apache 2.0

Попробуй.

Parler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Разработчик: Hugging Face · Лицензия: Apache 2.0

Попробуй.

IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Разработчик: Index Team · Лицензия: Apache 2.0

Попробуй.

Spark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Разработчик: SparkAudio · Лицензия: Apache 2.0

Попробуй.

GPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Разработчик: RVC-Boss · Лицензия: MIT

Попробуй.

Orpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Разработчик: Canopy Labs · Лицензия: Llama 3.2 Community

Попробуй.

Qwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Разработчик: Alibaba (Qwen) · Лицензия: Apache 2.0

Попробуй.

Chatterbox Premium

Современное клонирование с нулевым голосом с эмоциональным контролем из Resemble AI.

Качество:

Попробуй.

Tortoise TTS Premium

Текст-пик с несколькими счетами был сосредоточен на качестве с авторегрессивной архитектурой.

Качество:

Попробуй.

StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Качество:

Попробуй.

OpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Качество:

Попробуй.

CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Языки: en, zh, ja, ko, fr, de, it, es

Голос клонов

IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Языки: en, zh

Голос клонов

Spark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Языки: en, zh

Голос клонов

GPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Языки: en, zh, ja, ko

Голос клонов

Chatterbox

Современное клонирование с нулевым голосом с эмоциональным контролем из Resemble AI.

Языки: en

Голос клонов

Tortoise TTS

Текст-пик с несколькими счетами был сосредоточен на качестве с авторегрессивной архитектурой.

Языки: en

Голос клонов

OpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Языки: en, zh, ja, ko, fr, de, es, it

Голос клонов

Qwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Языки: en, zh, ja, ko, de, fr, ru, pt, es, it

Голос клонов

Разработчик - первый API

OpenAI-совместимый REST API. Одна конечная точка, 22+ модели. Стремительная поддержка для приложений в режиме реального времени.

  • OpenAI-совместимый формат
  • Скачок TTS для приложений в режиме реального времени
  • Обработка партии для выполнения крупных работ
  • Уведомления в сети < < Уэбхук > >
Вид Docs API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Простое, прозрачное ценообразование

Начинай свободно, по мере роста.

Свободные

$0

50 кредитов

  • Kokoro, Piper, VITS, MeloTTS
  • Предел в 500 знаков
  • 3 г/час (без учета)
Не подписываться

Запуск

$9/м.

500 кредитов в месяц

  • Все 22+ модели
  • Предельное значение 5 000 знаков
  • Клонирование голоса
Начните
Самые популярные

Про

$29/м.

2000 кредитов в месяц

  • Всё в стартере
  • Доступ к API
  • Приоритетная обработка
Найти про

Предприятие

$99/м.

10 000 кредитов в месяц

  • Всё в про
  • Налив API
  • Приоритетная очередь
Продажа контактных документов

View all plans including credit packs →

Часто задаваемые вопросы

TTS.ai является самой всеобъемлющей платформой АИ, предлагающей 22+ модели, клонирование голоса, речевые речи к тексту и аудиоинструменты. Все модели являются открытым источником без подключения поставщика.

Да! TTS.ai предлагает бесплатный текст-пик с моделями Kokoro, Piper, VITS и MeloTS. Никаких счетов не требуется. Запишитесь для получения 50 бесплатных кредитов и доступа ко всем моделям. Выплаченные планы начинаются с 9 долларов в месяц.

Для скорости используйте Kokoro или Piper. Для целей качества попробуйте KosyVoice 2 или StyleTTS 2. Для клонирования к голосу используйте Chatterbox или GPT-SOVITS. Для диалога используйте Dia TTS. Попробуйте несколько моделей на одном и том же тексте для сравнения.

Да. OpenAI-совместимый REST API для TTS, STT, клонирования голоса и аудиоинструментов. Имеется на Pro (29/mo) и Enterprise (99/mo). Просмотр документации на tts.ai/api/.

Качество голоса варьируется в зависимости от модели. Такие премиальные модели, как CosyVoice 2, StyleTTS 2 и Chatterbox, производят почти человеческую речь с естественным интонацией и эмоциями. Свободные модели, такие как Kokoro, предлагают прекрасное качество для большинства случаев использования.

TTS.ai поддерживает 30+ языков в своей образцовой библиотеке. Английский имеет самую широкую модельную поддержку, но модели, такие как CosyVoice 2, охватывают китайский, японский и корейский языки; GPT-SOVITS занимается китайским, японским, корейским и английским языками; и MeloTTS поддерживает английский, испанский, французский, китайский, японский и корейский языки.

Да. Вся обработка происходит на наших специально предназначенных серверах GPU. Мы не храним ваш текст или генерируем звук после доставки. Загруженные пробы голоса для клонирования используются только для текущей сессии и не сохраняются. Мы никогда не делимся вашими данными с третьими сторонами или используем их для обучения моделей.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS.ai генерирует звук в формате WAV по умолчанию для максимального качества. Вы можете преобразовываться в MP3, FLAC, OGG или M4A с помощью нашего свободного инструмента Audio преобразователя. API поддерживает указание выбранного формата вывода непосредственно в запросе.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Бесплатные модели (Kokoro, Piper, VITS, MeloTTS) не требуют никаких счетов и нулевых затрат. Стандартные модели (2 micles/1K персонажа) включают Bark, CosyVoice 2, F5-TTS и Dia. Премиальные модели (4 messer/1K символов) включают OpenVoice, Chatterbox, StyleTS 2 и Tortoise. Оплаченные модели, как правило, предлагают более высокое качество, больше голосов и дополнительные функции, такие как клонирование голоса.

API поддерживает процесс пакетной обработки для преобразования больших объемов текстов в речь. Подача многочисленных запросов и получение результатов асинхронно с использованием UDUID. Планы предприятий (99/Mo) предусматривают приоритетный доступ для ускоренной обработки партий. Идеал для производства аудиокниги, содержания курсов и крупномасштабных проектов голосовой огласки.
5.0/5 (1)

Начните использовать AI Voice сегодня

Присоединяйтесь к создателям, разработчикам и предприятиям, использующим TTS.ai