Открытый исходный текст для моделей речей
Каждая модель TTS на нашей платформе является открытым источником с коммерчески удобными лицензиями. MIT, Apache 2.0 — нет патентов, никаких ограничений на использование, нет неожиданных лицензионных сборов. Используйте их через наш хозяйственный API, или самоуправляйтесь на своей собственной инфраструктуре с полным контролем.
Попробуй сейчас.
Преимущества TTS с открытым исходным кодом
Почему модели с открытым исходным кодом важны для ваших проектов
Все открытые источники лицензированы
Каждая модель на TTS.ai использует разрешительную лицензию с открытым исходным кодом.
MIT/Apache 2.0
Модели лицензируются в соответствии с MIT или Apache 2.0, наиболее допустимыми лицензиями с открытыми исходными кодами.
Самонаходящееся
Загрузите любую модель и запустите её на ваше собственное оборудование. Полный контроль за вашими данными, латентностью и инфраструктурой. Не требуется облачной зависимости.
Оптимизация GPU
Модели оптимизированы для NVIDIA GPU при поддержке CUDA. Piper работает только на процессоре. Большинство моделей нуждаются в 2-8GB VRAM для эффективного вывода.
Обслуживание общин
Активные сообщества с открытыми исходными кодами поддерживают и совершенствуют эти модели.
Коммерческое использование OK
Все модели допускают коммерческое использование в соответствии с их лицензиями.
Каталог нашей модели с открытым исходным кодом
Каждая модель, ее лицензия и то, что она делает лучше всего
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Лучший для: Apache 2.0 — лучшая бесплатная модель, 82M парамс, легкая для себя
Попробуй Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Лучший для: МТИ — только процессор, идеальный для кабельных устройств и встроенного самозавода
Попробуй Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Лучший для: MIT — базовая архитектура, используемая многими моделями ниже по течению
Попробуй VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Лучший для: MIT — уникальные возможности для производства аудиоаппаратуры, выходящие за рамки стандартных TTS
Попробуй Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Лучший для: Apache 2.0 — максимальное качество, широко изученное использование справочных материалов
Попробуй Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Лучший для: MIT — клонирование с открытым исходным кодом с гранулальным стилем
Попробуй OpenVoiceКак использовать ТТС с открытым исходным кодом
Используйте наши API или сами запускайте модели.
Изучение моделей с открытыми исходными кодами
Просмотр каталога моделей TTS с открытым исходным кодом 20+. Каждая страница модели показывает права, архитектуру, возможности и требования к самостоятельной приемке.
Попробуй в "Взгляни"
Проверьте любую модель непосредственно на TTS.ai, не устанавливая ничего. Наши серверы GPU работают над обработкой, чтобы вы могли оценить качество перед тем, как взять на себя обязательство вести себя самостоятельно.
Сами по себе или используйте нашу ИПЦ
Клоновая модель репродукции из GitHub и работает на местном уровне, или использует для производства наш принимающий API. Самоуправляемость дает полный контроль; наш API обеспечивает управляемую инфраструктуру.
Построить свое применение
Инкорпорировать TTS в свой продукт с использованием самоуправляемых моделей или REST API. Все модели используются на коммерческой основе без лицензионных сборов или роялти.
Лицензионное сопоставление
Для всех моделей на TTS.ai используются лицензии с открытыми исходными кодами, удобные для использования в коммерческих целях
| Модель | Лицензия | Коммерческое использование | Изменение | Самопоселение | Присвоение |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Требуемо | |||
| Piper | MIT | Факультативная | |||
| VITS | MIT | Факультативная | |||
| MeloTTS | MIT | Факультативная | |||
| Chatterbox | MIT | Факультативная | |||
| Tortoise TTS | Apache 2.0 | Требуемо | |||
| StyleTTS 2 | MIT | Факультативная | |||
| OpenVoice | MIT | Факультативная | |||
| Sesame CSM | Apache 2.0 | Требуемо | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Самосохранение против хост-компьютерного API
Запустите модели сами или позволь нам управлять инфраструктурой.
Самоуправляемость в вашем аппарате
Каждая модель на TTS.ai доступна в качестве проекта с открытым исходным кодом на GitHub или Hugging Face. Загрузить весы, установить зависимости и сделать вывод на собственных GPU. Вы имеете полный контроль над латентностью, конфиденциальностью и масштабированием.
- Полная конфиденциальность данных — звук никогда не покидает ваш сервер
- Отсутствие расходов по каждому запросу после первоначальной установки
- Упорядочение ваших собственных данных
- Требует аппаратного обеспечения GPU (рекомендуется NVIDIA)
- Вы управляете обновлением, масштабированием и зависимостью
Использовать TTS.ai приемных API
Получите мгновенный доступ ко всем моделям 20+ с помощью единого REST API. Мы занимаемся обеспечением GPU, обновлением моделей, управлением очереди и масштабированием. Один ключ API дает вам доступ к каждой модели — нет необходимости управлять отдельными развертываниями.
- Нет необходимости в аппаратных средствах GPU
- Все модели 20+ через одну API
- Автоматическое обновление и совершенствование моделей
- 99,9% рабочего времени с избыточной инфраструктурой
- Заплатите только за то, что вы используете
Быстрый запуск: API или самозадание
Воспользуйся нашим ведущим API или установи Кокоро на месте в минутах.
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Открытый источник, доступный ценообразование
Наша компания API делает доступ к ТТС с открытым исходным кодом без управления GPU.
Свободный цвет
$0
15 кредитов при регистрации
- 4 модели с открытым исходным кодом
- Записи для основного использования отсутствуют
- Допускается коммерческое использование
Запуск
$9
500 000 знаков в месяц
- Все модели с открытым исходным кодом " 20+ "
- Клонирование голоса
- Доступ к API
Про
$29
2 000 000 знаков в месяц
- Обработка приоритетных ГПСП
- Все модели премиальных выплат
- Общеорганизационная поддержка
Часто задаваемые вопросы
Общие вопросы, касающиеся текста с открытым исходным кодом для речи
Твоя обратная связь помогает нам решать проблемы.
Попробуйте TTS с открытым исходным кодом
20+ модели с открытым исходным кодом, все коммерческие лицензии. Используйте наш API или самоуправляемый — выбор за вами.