Відкрити текст джерела для моделей мовлення

Кожна модель TTS на нашій платформі є відкритим кодом з комерційно дружніми ліцензіями. МІТ, апачі 2.0 не блокують, без обмежень використання, без несподіваних ліцензійних внесків. Використовуйте їх за допомогою нашого програмного інтерфейсу або самостійно залучайте їх до вашої інфраструктури з повним контролем.

Відкрити джерело Ліцензія MIT Apache 2. 0 Self- Hostable GitHub

Спробуйте зараз

Вільно з Kokro, Piper, VITS, MeloTTS
Тут буде показано ваш створений звуковий файл
Створено
Звантажити
Любити TTS.ai?

Користі для синтезу TTS з відкритим кодом

Чому моделі з відкритим кодом мають значення для ваших проектів

Всі відкриті ліцензування

Кожна модель на TTS.ai використовує дозвіл на доступне з відкритим кодом. Жодних комерційних чорних коробок, ніяких постачальників, ніяких неочікуваних ліцензійних внесків.

MIT / Apache 2. 0

Моделі мають ліцензію на MIT або Apache 2.0, найприбутковіші ліцензії з відкритим кодом. Використовуйте комерційні, модифіковані, перерозподіл без обмежень.

Self- Hostable

Звантажте будь- яку модель і запустіть її на вашому комп' ютері. Повноцінне керування вашими даними, запізненням та інфраструктурою. Не потрібно залежних від хмар.

Оптимізовано GPU

Моделі оптимізовано для NVIDIA GPU з підтримкою CUDA. Piper запущено лише для процесора. Для ефективного обчислення більшості моделей потрібно 2- 8GB VRAM.

Підтримують суспільство

Активні спільноти з відкритим кодом підтримують і покращують ці моделі. Внески вітають помилки, покращення і нові голоси на GitHub.

Комерційне використання гаразд

На всіх моделях можна використовувати комерційні товари за умов дотримання ліцензії, збирати продукти, продавати і створювати комерційний контент без жодних прав власності чи платні за використання.

Наш каталог з відкритим кодом моделі

Кожна модель, її ліцензія і те, що вона робить найкраще

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Найкраще для: Apache 2.0 } Найкраща якість безкоштовна модель, 82Мпараметри, простий для самостійного вузла

Спробувати Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Найкраще для: Тільки MIT, ідеальна для пристроїв меж і вбудована самопідтримка

Спробувати Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Найкраще для: MIT ⇩ базова архітектура, що використовується багатьма нижніми моделями.

Спробувати VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Найкраще для: MIT ⇩ unique audio general general generications out of стандартні TTS

Спробувати Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Клонування голосу

Найкраще для: Apache 2.0 ⇩ Максимальна якість, широко досліджена довідкова реалізація

Спробувати Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Клонування голосу

Найкраще для: MIT ⇩ open-source голос клонування з керуванням у вигляді гранулярного стилю

Спробувати OpenVoice

Як користуватися відкритим кодом TTS

Використовувати наш програмний інтерфейс або самостійно запускати моделі

1

Видиступні моделі Open- Source

Переглядати наш каталог з 20+ з відкритим кодом моделей TTS. На кожній з моделей буде показано ліцензію, архітектуру, можливості і вимоги для самоутвердження.

2

Спробуйте у переглядачі

Перевіряйте будь- яку модель безпосередньо на TTS.ai без встановлення нічого. Наші сервери GPU працюють з обробкою так, щоб ви могли оцінити якість перед виконанням самовпорядкування.

3

Сам- Хост або використовуйте наш API

Клонувати моделі експропріаторів з GitHub і працювати локально, або використовувати & imported API для виробництва. Самопідтримка надає повний контроль; наш API надає можливість керувати інфраструктурою.

4

Будуйте вашу програму

Інтегрувати TTS у ваш продукт за допомогою самоутверджених моделей або нашого REST API. Всі моделі комерційно придатні для використання без ліцензійних внесків або прав.

Порівняння ліцензії

Всі моделі на TTS.ai використовують комерційно дружні ліцензії з відкритим кодом

Модель Ліцензія Комерційне використання Зміна Сам- ХостCity in Quebec Canada Прибуток
Kokoro Apache 2.0 Обов' язково
Piper MIT Необов' язкове
VITS MIT Необов' язкове
MeloTTS MIT Необов' язкове
Chatterbox MIT Необов' язкове
Tortoise TTS Apache 2.0 Обов' язково
StyleTTS 2 MIT Необов' язкове
OpenVoice MIT Необов' язкове
Sesame CSM Apache 2.0 Обов' язково
Orpheus Llama 3.2 "Built with Llama"

Само- готування/ Вузлий API

Виконуйте моделі самі або дозвольте нам працювати з інфраструктурою.

Сам- Хост на вашому апараті

Будь- яку модель на TTS.ai можна використовувати як проект з відкритим кодом на GitHub або Hback Face. Звантажте ваги, встановіть залежності і запустіть власні GPU. Повноцінний контроль за запізненням, конфіденційністю і масштабуванням.

  • Повна конфіденційність даних ♫ Звук ніколи не виходить з вашого сервера
  • Немає витрат на отримання після початкового налаштування
  • Нетипове налаштування для ваших власних даних
  • Потрібне обладнання GPU (рекомендовано NVIDIA)
  • Ви керуєте оновленнями, масштабуванням і залежностями

Використовувати API TTS.ai вузлів

Отримати безпосередній доступ до всіх моделей 20+ через єдиний API REST. Ми керуємо можливостями GPU, оновленням моделей, керування чергою і масштабуванням. Одна клавіша API надає вам доступ до кожної моделі ⇩ не потрібно керувати окремими версіями.

  • Обладнання GPU не потрібне
  • Всі 20 моделей за одним API
  • Автоматичне оновлення і вдосконалення моделей
  • 99. 9% наднормової інфраструктури
  • Плати лише за те, що ти використовуєш.

Швидкий запуск: API або само- Host

Використовувати локальний інтерфейс користувача Koro у хвилинах

Параметр 1: TTS.ai Вузловий API Найлегший
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Варіант 2: само- Гост з піком Повне керування
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Відкритий код, економний Прибуток

Наш програмный API делает программы с открытым кодом доступными без управления GPU.

Вільний в' язк

$0

15 кредитів при підписуванні

  • 4 моделі з відкритим кодом вільні
  • Без підписок для базового використання
  • Дозволене комерційне використання

Започаткування

$9

500 000 символів/ місяців

  • Всі 20 моделей з відкритим кодом
  • Клонування голосів
  • Доступ до API

Pro

$29

2 000 000 символів/місяців

  • Обробка GPU пріоритету
  • Всі внескові моделі
  • Підтримка підприємництва
Перегляд Повне приєднання

Часті запитання

Поширені питання щодо відкритого вихідного тексту у мовлення

Так. Кожна модель на TTS.ai використовує дозвільну ліцензію з відкритим кодом або MIT або Apache 2. 0. Ми конкретно виключаємо моделі з обмежуючими ліцензіями (на зразок CPML CPM або некомерційного CC- WI- NC). Ви можете перевірити ліцензію кожної з моделей на сховище GitHub.

Обидва ці програми є дозвільними ліцензіями на доступ до комерційного використання, модифікації і перерозподілу. Apache 2. 0 додає явні патентні гранти і вимагає складання змін, якщо ви змінюєте код. MIT спрощується з меншою кількістю вимог. Обидва способи є діловими.

Так. Будь- яка модель може бути самостійною. Клонувати сховище моделей з GitHub, встановити залежності, звантажити моделі і виконати висновки. У програмі передбачено документацію щодо вимог до розпізнавання для кожної з моделей, зокрема версії GPU, RAM і Python.

Вимоги можуть змінюватися за моделлю. Piper не потребує GPU (лише CPU). Kokro і MloTTS потребують 1- 2GB VRAM. Більшості стандартних моделей потрібно 4GB VRAM. Tortose і Sesame CSM потребують 8GB. NVIDIA RTX 3060 (12GB) може запускати моделі комфортно.

Так. Ліцензії з відкритим кодом надають змогу змінювати, зокрема, дрібні звуки. Моделі на зразок GPT- SoVITS і Bark надають змогу створювати скрипти з рівнем складності. Ви можете навчати моделі за вашими власними даними голосу, щоб створювати власні голоси або покращувати швидкодію для окремих мов.

Моделі з найвищим відкритим кодом (Kokoro, StyleTTS 2, Chatterbox) тепер відповідають або перевищують комерційні послуги на зразок 11,6Labs і Google TTS у якісних лавках. Основною перевагою комерційних служб є керування інфраструктурою і підтримка, а не якість звуку.

Ми вже виключили їх. XTTS/ XTTS- v2 (Coqui's CPML } некомерціальний), F5- TTS (CCC- WY- NC- NC- NC) і Хіггса- v2 (Boson License } License) всі були вилучені. Кожна модель на TTS.ai перевірена комерційно- use security- use security.

Так. Більшість моделей приймають внески у спільноту за допомогою GitHub. Ви можете надсилати звіти про помилки, записи голосових повідомлень для нових мов, покращення коду і документацію до кожної з моделей щодо рекомендацій щодо внесків та активних проблем.

Завантажувати моделі на комп' ютері і вивантажувати, якщо вони не працюють, щоб спільно використовувати пам' ять GPU. Наш сервер GPU запускає 20 моделей на 4x Tesla P40 (96GB загальний VRAM) за допомогою динамічного завантаження. Для самовпорядкування 24GB GPU може одночасно служити 3- 5 моделями.

У багатьох моделях передбачено офіційні зображення Docker або Dockerfiles. Для запуску декількох моделей ви можете створити нетиповий набір інструментів Docker за допомогою інструменту контейнера NVIDIA для доступу до GPU. Архітектура сервера API може слугувати еталонною реалізацією.

Для більшості моделей слід використовувати Python 3. 10- 3. 12. Для того, щоб отримати точну сумісність з версіями, слід використовувати Python 3. 11. Ми рекомендуємо вам використовувати Python 3. 12 для більшості моделей. Перевірте вимоги кожної з моделей. txt.

Так. MIT і Apache 2. 0 дозволяють використання у комерційних цілях. Ви можете будувати продукти SaaS, мобільні програми, ігри та служби за допомогою цих моделей без ліцензійних внесків, авторських прав або потреб у надсиланні.
5.0/5 (1)

Ваші відгуки допомагають нам вирішити проблеми.

Спробуйте відкрити код TTS сьогодні

20+ Моделі з відкритим кодом, всі комерційні. Використовуйте наш API або сам- вузол ⇩ Вибрання є вашим.