Надіслати звіт про помилку / запит на можливості

Відкрити текст джерела для моделей мовлення

Кожна модель TTS на нашій платформі є відкритим кодом з комерційно дружніми ліцензіями. МІТ, апачі 2.0 не блокують, без обмежень використання, без несподіваних ліцензійних внесків. Використовуйте їх за допомогою нашого програмного інтерфейсу або самостійно залучайте їх до вашої інфраструктури з повним контролем.

Відкрити джерело Ліцензія MIT Apache 2. 0 Self- Hostable GitHub

Повноцінний редактор TTS Документи API

Спробуйте зараз

0/500

Вільно з Kokro, Piper, VITS, MeloTTS

Тут буде показано ваш створений звуковий файл

Відкрити повний редактор TTS

Користі для синтезу TTS з відкритим кодом

Чому моделі з відкритим кодом мають значення для ваших проектів

Всі відкриті ліцензування

Кожна модель на TTS.ai використовує дозвіл на доступне з відкритим кодом. Жодних комерційних чорних коробок, ніяких постачальників, ніяких неочікуваних ліцензійних внесків.

MIT / Apache 2. 0

Моделі мають ліцензію на MIT або Apache 2.0, найприбутковіші ліцензії з відкритим кодом. Використовуйте комерційні, модифіковані, перерозподіл без обмежень.

Self- Hostable

Звантажте будь- яку модель і запустіть її на вашому комп' ютері. Повноцінне керування вашими даними, запізненням та інфраструктурою. Не потрібно залежних від хмар.

Оптимізовано GPU

Моделі оптимізовано для NVIDIA GPU з підтримкою CUDA. Piper запущено лише для процесора. Для ефективного обчислення більшості моделей потрібно 2- 8GB VRAM.

Підтримують суспільство

Активні спільноти з відкритим кодом підтримують і покращують ці моделі. Внески вітають помилки, покращення і нові голоси на GitHub.

Комерційне використання гаразд

На всіх моделях можна використовувати комерційні товари за умов дотримання ліцензії, збирати продукти, продавати і створювати комерційний контент без жодних прав власності чи платні за використання.

Наш каталог з відкритим кодом моделі

Кожна модель, її ліцензія і те, що вона робить найкраще

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Швидка 5/5

Найкраще для: Apache 2.0 } Найкраща якість безкоштовна модель, 82Мпараметри, простий для самостійного вузла

Спробувати Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Швидка 3/5

Найкраще для: Тільки MIT, ідеальна для пристроїв меж і вбудована самопідтримка

Спробувати Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Швидка 3/5

Найкраще для: MIT ⇩ базова архітектура, що використовується багатьма нижніми моделями.

Спробувати VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Повільно 4/5

Найкраще для: MIT ⇩ unique audio general general generications out of стандартні TTS

Спробувати Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Повільно 5/5 Клонування голосу

Найкраще для: Apache 2.0 ⇩ Максимальна якість, широко досліджена довідкова реалізація

Спробувати Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Середній 4/5 Клонування голосу

Найкраще для: MIT ⇩ open-source голос клонування з керуванням у вигляді гранулярного стилю

Спробувати OpenVoice

Як користуватися відкритим кодом TTS

Використовувати наш програмний інтерфейс або самостійно запускати моделі

Видиступні моделі Open- Source

Переглядати наш каталог з 20+ з відкритим кодом моделей TTS. На кожній з моделей буде показано ліцензію, архітектуру, можливості і вимоги для самоутвердження.

Спробуйте у переглядачі

Перевіряйте будь- яку модель безпосередньо на TTS.ai без встановлення нічого. Наші сервери GPU працюють з обробкою так, щоб ви могли оцінити якість перед виконанням самовпорядкування.

Сам- Хост або використовуйте наш API

Клонувати моделі експропріаторів з GitHub і працювати локально, або використовувати & imported API для виробництва. Самопідтримка надає повний контроль; наш API надає можливість керувати інфраструктурою.

Будуйте вашу програму

Інтегрувати TTS у ваш продукт за допомогою самоутверджених моделей або нашого REST API. Всі моделі комерційно придатні для використання без ліцензійних внесків або прав.

Порівняння ліцензії

Всі моделі на TTS.ai використовують комерційно дружні ліцензії з відкритим кодом

Модель	Ліцензія	Прибуток
Kokoro	Apache 2.0	Обов' язково
Piper	MIT	Необов' язкове
VITS	MIT	Необов' язкове
MeloTTS	MIT	Необов' язкове
Chatterbox	MIT	Необов' язкове
Tortoise TTS	Apache 2.0	Обов' язково
StyleTTS 2	MIT	Необов' язкове
OpenVoice	MIT	Необов' язкове
Sesame CSM	Apache 2.0	Обов' язково
Orpheus	Llama 3.2	"Built with Llama"

Спробуйте ці моделі безкоштовно

Само- готування/ Вузлий API

Виконуйте моделі самі або дозвольте нам працювати з інфраструктурою.

Сам- Хост на вашому апараті

Будь- яку модель на TTS.ai можна використовувати як проект з відкритим кодом на GitHub або Hback Face. Звантажте ваги, встановіть залежності і запустіть власні GPU. Повноцінний контроль за запізненням, конфіденційністю і масштабуванням.

Повна конфіденційність даних ♫ Звук ніколи не виходить з вашого сервера
Немає витрат на отримання після початкового налаштування
Нетипове налаштування для ваших власних даних
Потрібне обладнання GPU (рекомендовано NVIDIA)
Ви керуєте оновленнями, масштабуванням і залежностями

Використовувати API TTS.ai вузлів

Отримати безпосередній доступ до всіх моделей 20+ через єдиний API REST. Ми керуємо можливостями GPU, оновленням моделей, керування чергою і масштабуванням. Одна клавіша API надає вам доступ до кожної моделі ⇩ не потрібно керувати окремими версіями.

Обладнання GPU не потрібне
Всі 20 моделей за одним API
Автоматичне оновлення і вдосконалення моделей
99. 9% наднормової інфраструктури
Плати лише за те, що ти використовуєш.

Використовувати API з вузлами замість

Швидкий запуск: API або само- Host

Використовувати локальний інтерфейс користувача Koro у хвилинах

Параметр 1: TTS.ai Вузловий API Найлегший

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

Варіант 2: само- Гост з піком Повне керування

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Перегляд Документація API

Відкритий код, економний Прибуток

Наш програмный API делает программы с открытым кодом доступными без управления GPU.

Вільний в' язк

15 кредитів при підписуванні

4 моделі з відкритим кодом вільні
Без підписок для базового використання
Дозволене комерційне використання

Започаткування

500 000 символів/ місяців

Всі 20 моделей з відкритим кодом
Клонування голосів
Доступ до API

Pro

$29

2 000 000 символів/місяців

Обробка GPU пріоритету
Всі внескові моделі
Підтримка підприємництва

Перегляд Повне приєднання

Часті запитання

Поширені питання щодо відкритого вихідного тексту у мовлення

Так. Кожна модель на TTS.ai використовує дозвільну ліцензію з відкритим кодом або MIT або Apache 2. 0. Ми конкретно виключаємо моделі з обмежуючими ліцензіями (на зразок CPML CPM або некомерційного CC- WI- NC). Ви можете перевірити ліцензію кожної з моделей на сховище GitHub.

Обидва ці програми є дозвільними ліцензіями на доступ до комерційного використання, модифікації і перерозподілу. Apache 2. 0 додає явні патентні гранти і вимагає складання змін, якщо ви змінюєте код. MIT спрощується з меншою кількістю вимог. Обидва способи є діловими.

Так. Будь- яка модель може бути самостійною. Клонувати сховище моделей з GitHub, встановити залежності, звантажити моделі і виконати висновки. У програмі передбачено документацію щодо вимог до розпізнавання для кожної з моделей, зокрема версії GPU, RAM і Python.

Вимоги можуть змінюватися за моделлю. Piper не потребує GPU (лише CPU). Kokro і MloTTS потребують 1- 2GB VRAM. Більшості стандартних моделей потрібно 4GB VRAM. Tortose і Sesame CSM потребують 8GB. NVIDIA RTX 3060 (12GB) може запускати моделі комфортно.

Так. Ліцензії з відкритим кодом надають змогу змінювати, зокрема, дрібні звуки. Моделі на зразок GPT- SoVITS і Bark надають змогу створювати скрипти з рівнем складності. Ви можете навчати моделі за вашими власними даними голосу, щоб створювати власні голоси або покращувати швидкодію для окремих мов.

Моделі з найвищим відкритим кодом (Kokoro, StyleTTS 2, Chatterbox) тепер відповідають або перевищують комерційні послуги на зразок 11,6Labs і Google TTS у якісних лавках. Основною перевагою комерційних служб є керування інфраструктурою і підтримка, а не якість звуку.

We have already excluded them. XTTS/XTTS-v2 (Coqui's CPML — non-commercial), F5-TTS (CC-BY-NC — non-commercial), and Higgs-v2 (Boson License — restrictive) were all removed. Every model on TTS.ai is verified commercial-use safe.

Так. Більшість моделей приймають внески у спільноту за допомогою GitHub. Ви можете надсилати звіти про помилки, записи голосових повідомлень для нових мов, покращення коду і документацію до кожної з моделей щодо рекомендацій щодо внесків та активних проблем.

Завантажувати моделі на комп' ютері і вивантажувати, якщо вони не працюють, щоб спільно використовувати пам' ять GPU. Наш сервер GPU запускає 20 моделей на 4x Tesla P40 (96GB загальний VRAM) за допомогою динамічного завантаження. Для самовпорядкування 24GB GPU може одночасно служити 3- 5 моделями.

У багатьох моделях передбачено офіційні зображення Docker або Dockerfiles. Для запуску декількох моделей ви можете створити нетиповий набір інструментів Docker за допомогою інструменту контейнера NVIDIA для доступу до GPU. Архітектура сервера API може слугувати еталонною реалізацією.

Для більшості моделей слід використовувати Python 3. 10- 3. 12. Для того, щоб отримати точну сумісність з версіями, слід використовувати Python 3. 11. Ми рекомендуємо вам використовувати Python 3. 12 для більшості моделей. Перевірте вимоги кожної з моделей. txt.

Так. MIT і Apache 2. 0 дозволяють використання у комерційних цілях. Ви можете будувати продукти SaaS, мобільні програми, ігри та служби за допомогою цих моделей без ліцензійних внесків, авторських прав або потреб у надсиланні.

5.0/5 (1)

Спробуйте відкрити код TTS сьогодні

20+ Моделі з відкритим кодом, всі комерційні. Використовуйте наш API або сам- вузол ⇩ Вибрання є вашим.

Вільний підпис Перегляд Приоритет

Відкрити текст джерела для моделей мовлення

Спробуйте зараз

Любити TTS.ai?

Користі для синтезу TTS з відкритим кодом

Всі відкриті ліцензування

MIT / Apache 2. 0

Self- Hostable

Оптимізовано GPU

Підтримують суспільство

Комерційне використання гаразд

Наш каталог з відкритим кодом моделі

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Як користуватися відкритим кодом TTS

Видиступні моделі Open- Source

Спробуйте у переглядачі

Сам- Хост або використовуйте наш API

Будуйте вашу програму

Порівняння ліцензії

Само- готування/ Вузлий API

Сам- Хост на вашому апараті

Використовувати API TTS.ai вузлів

Швидкий запуск: API або само- Host

Відкритий код, економний Прибуток

Вільний в' язк

Започаткування

Pro

Часті запитання

Чи всі TTS.ai моделей дійсно відкриті?

Яка різниця між ліцензією на МТІ та Apache 2.0?

Чи можу я самостійно взяти ці моделі на мій власний сервер?

Який GPU мені потрібні моделі TTS?

Чи можу я отримати додаткове налаштування моделей TTS з відкритим кодом?

Як можна порівняти моделі TTS з відкритим кодом до комерційних послуг?

Чи є якісь моделі з обмежуючими ліцензіями, яких мені слід уникати?

Чи можу я зробити внесок у ці моделі з відкритим кодом?

Як запустити декілька моделей на одному сервері GPU?

Чи є картинка Докера для самообслуговування?

Яку версію Python мені потрібно для самостійності?

Чи можу я створити комерційний продукт, використовуючи ці моделі?

Спробуйте відкрити код TTS сьогодні