О том, что
Самая всеобъемлющая платформа AI с открытым исходным кодом. 20+ модели, 100+ голоса, все в одном месте.
Создаваемый
TTS.ai был создан John Nader (nadermx), TTS.ai является частью миссии, направленной на то, чтобы сделать передовую технологию АИ доступной для всех — без запертия продавца, без сбора данных, просто мощную голосовую технологию по справедливым ценам.
Наша миссия
TTS.ai был построен на простой вере: наилучшая технология голосовой связи с АИ должна быть доступна для всех. В то время как запатентованные услуги взимают премиальные цены за базовые текстовые услуги, сообщество с открытыми исходными кодами разработало модели, которые соответствуют или превышают коммерческое качество.
Мы объединяем лучшие модели голосовой АИ с открытым исходным кодом в единую, легко используемую платформу. Ни одного поставщика. Никакого сбора данных. Просто мощная голосовая технология по справедливым ценам.
Что мы предлагаем
Текст к речи
20+ модели, включая Kokoro, Chatterbox, Bark и более. От быстрого синтеза в легком весе до выпуска студийного качества.
Выступление с текстом
С помощью Везера, Быстрее Шепца и SenseVoice.
Клонирование голоса
Скопируйте любой голос из 5-секундного образца, чаттербокс, GPT-SOVITS, CosyVoice 2 и более. Создайте заказные голоса для ваших проектов.
Аудиовизуальная обработка
Усилить звук, удалить вокальные, разделенные стебли, удалить эхо/реверб, обнаружить ключ/БПМ и конвертировать форматы.
Голосовой разговор
Голосовые разговоры в режиме реального времени с AI. Выберите свою модель и голос для интерактивного чата.
Разработчик API
OpenAI-совместимый REST API, Python SDK, примеры кодов и всеобъемлющую документацию.
Open Source First
Каждая модель на TTS.ai - это открытый источник, лицензированный в соответствии с MIT или Apache 2.0. Мы верим в прозрачность и инновации на базе общин.
У нас есть
Все веса модели загружаются из их официальных хранилищ. Мы не добавляем запатентованных модификаций.
Инфраструктура
TTS.ai работает на специальных серверах GPU с NVIDIA Tesla P40 GPU (всего 96GB VRAM). Наша инфраструктура предназначена для низкого уровня запоздалости и высокой пропускной способности:
- Целевые кластеры ГПС для вывода - отсутствие общих ресурсов
- Динамическое распределение GPU на основе требований модели VRAM
- 5-качественная система приоритетности для обеспечения оптимальной пропускной способности
- Модели, предварительно загруженные в VRAM для мгновенного вывода
- С помощью CDN аудиодоставка для быстрых скачиваний
Обеспечение конфиденциальности
- Подготовка данных отсутствует: Мы никогда не используем ваш звук или текст для тренировки моделей
- Автосъемка: Генерированный звук автоматически удаляется через 24 часа
- Шифрование: Все данные зашифрованы в пути (TLS 1.2+) и находятся в отключке
- Отслеживание отсутствует: У нас есть
- Совместимость с ВВПР: Запросите свои данные или удалите их в любое время