Відкрити текст джерела для моделей мовлення
Кожна модель TTS на нашій платформі є відкритим кодом з комерційно дружніми ліцензіями. МІТ, апачі 2.0 не блокують, без обмежень використання, без несподіваних ліцензійних внесків. Використовуйте їх за допомогою нашого програмного інтерфейсу або самостійно залучайте їх до вашої інфраструктури з повним контролем.
Спробуйте зараз
Користі для синтезу TTS з відкритим кодом
Чому моделі з відкритим кодом мають значення для ваших проектів
Всі відкриті ліцензування
Кожна модель на TTS.ai використовує дозвіл на доступне з відкритим кодом. Жодних комерційних чорних коробок, ніяких постачальників, ніяких неочікуваних ліцензійних внесків.
MIT / Apache 2. 0
Моделі мають ліцензію на MIT або Apache 2.0, найприбутковіші ліцензії з відкритим кодом. Використовуйте комерційні, модифіковані, перерозподіл без обмежень.
Self- Hostable
Звантажте будь- яку модель і запустіть її на вашому комп' ютері. Повноцінне керування вашими даними, запізненням та інфраструктурою. Не потрібно залежних від хмар.
Оптимізовано GPU
Моделі оптимізовано для NVIDIA GPU з підтримкою CUDA. Piper запущено лише для процесора. Для ефективного обчислення більшості моделей потрібно 2- 8GB VRAM.
Підтримують суспільство
Активні спільноти з відкритим кодом підтримують і покращують ці моделі. Внески вітають помилки, покращення і нові голоси на GitHub.
Комерційне використання гаразд
На всіх моделях можна використовувати комерційні товари за умов дотримання ліцензії, збирати продукти, продавати і створювати комерційний контент без жодних прав власності чи платні за використання.
Наш каталог з відкритим кодом моделі
Кожна модель, її ліцензія і те, що вона робить найкраще
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Найкраще для: Apache 2.0 } Найкраща якість безкоштовна модель, 82Мпараметри, простий для самостійного вузла
Спробувати Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Найкраще для: Тільки MIT, ідеальна для пристроїв меж і вбудована самопідтримка
Спробувати Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Найкраще для: MIT ⇩ базова архітектура, що використовується багатьма нижніми моделями.
Спробувати VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Найкраще для: MIT ⇩ unique audio general general generications out of стандартні TTS
Спробувати Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Найкраще для: Apache 2.0 ⇩ Максимальна якість, широко досліджена довідкова реалізація
Спробувати Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Найкраще для: MIT ⇩ open-source голос клонування з керуванням у вигляді гранулярного стилю
Спробувати OpenVoiceЯк користуватися відкритим кодом TTS
Використовувати наш програмний інтерфейс або самостійно запускати моделі
Видиступні моделі Open- Source
Переглядати наш каталог з 20+ з відкритим кодом моделей TTS. На кожній з моделей буде показано ліцензію, архітектуру, можливості і вимоги для самоутвердження.
Спробуйте у переглядачі
Перевіряйте будь- яку модель безпосередньо на TTS.ai без встановлення нічого. Наші сервери GPU працюють з обробкою так, щоб ви могли оцінити якість перед виконанням самовпорядкування.
Сам- Хост або використовуйте наш API
Клонувати моделі експропріаторів з GitHub і працювати локально, або використовувати & imported API для виробництва. Самопідтримка надає повний контроль; наш API надає можливість керувати інфраструктурою.
Будуйте вашу програму
Інтегрувати TTS у ваш продукт за допомогою самоутверджених моделей або нашого REST API. Всі моделі комерційно придатні для використання без ліцензійних внесків або прав.
Порівняння ліцензії
Всі моделі на TTS.ai використовують комерційно дружні ліцензії з відкритим кодом
| Модель | Ліцензія | Комерційне використання | Зміна | Сам- ХостCity in Quebec Canada | Прибуток |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Обов' язково | |||
| Piper | MIT | Необов' язкове | |||
| VITS | MIT | Необов' язкове | |||
| MeloTTS | MIT | Необов' язкове | |||
| Chatterbox | MIT | Необов' язкове | |||
| Tortoise TTS | Apache 2.0 | Обов' язково | |||
| StyleTTS 2 | MIT | Необов' язкове | |||
| OpenVoice | MIT | Необов' язкове | |||
| Sesame CSM | Apache 2.0 | Обов' язково | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Само- готування/ Вузлий API
Виконуйте моделі самі або дозвольте нам працювати з інфраструктурою.
Сам- Хост на вашому апараті
Будь- яку модель на TTS.ai можна використовувати як проект з відкритим кодом на GitHub або Hback Face. Звантажте ваги, встановіть залежності і запустіть власні GPU. Повноцінний контроль за запізненням, конфіденційністю і масштабуванням.
- Повна конфіденційність даних ♫ Звук ніколи не виходить з вашого сервера
- Немає витрат на отримання після початкового налаштування
- Нетипове налаштування для ваших власних даних
- Потрібне обладнання GPU (рекомендовано NVIDIA)
- Ви керуєте оновленнями, масштабуванням і залежностями
Використовувати API TTS.ai вузлів
Отримати безпосередній доступ до всіх моделей 20+ через єдиний API REST. Ми керуємо можливостями GPU, оновленням моделей, керування чергою і масштабуванням. Одна клавіша API надає вам доступ до кожної моделі ⇩ не потрібно керувати окремими версіями.
- Обладнання GPU не потрібне
- Всі 20 моделей за одним API
- Автоматичне оновлення і вдосконалення моделей
- 99. 9% наднормової інфраструктури
- Плати лише за те, що ти використовуєш.
Швидкий запуск: API або само- Host
Використовувати локальний інтерфейс користувача Koro у хвилинах
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Відкритий код, економний Прибуток
Наш програмный API делает программы с открытым кодом доступными без управления GPU.
Вільний в' язк
$0
15 кредитів при підписуванні
- 4 моделі з відкритим кодом вільні
- Без підписок для базового використання
- Дозволене комерційне використання
Започаткування
$9
500 000 символів/ місяців
- Всі 20 моделей з відкритим кодом
- Клонування голосів
- Доступ до API
Pro
$29
2 000 000 символів/місяців
- Обробка GPU пріоритету
- Всі внескові моделі
- Підтримка підприємництва
Часті запитання
Поширені питання щодо відкритого вихідного тексту у мовлення
Ваші відгуки допомагають нам вирішити проблеми.
Спробуйте відкрити код TTS сьогодні
20+ Моделі з відкритим кодом, всі комерційні. Використовуйте наш API або сам- вузол ⇩ Вибрання є вашим.