Про програму

Найбільш комплексна голосова платформа з відкритим кодом. 20+моделі, 100+голів, все в одному місці.

Створено

TTS.ai було створено John Nader (nadermx), Незалежний розробник, який створює інструменти комп' ютерного зв' язку з відкритим кодом. TTS.ai є частиною місії для того, щоб зробити найкращу комп' ютерно- голосову технологію доступною для кожного ♫ Не потрібно блокувати виробників, не збирати даних, просто потужні голосові технології за справедливими цінами.

Наша місія

TTS.ai було збудовано на простому переконанні: Лучшая ШІ голосовая технология должна быть доступна всем. У той час як пропріетарні сервіси сплачують внескові ціни на базові текстові повідомлення, спільнота з відкритим кодом створила моделі, які відповідають чи перевищують комерційну якість.

Ми об'єднуємо найкращі моделі комп'ютерного програмного забезпечення в одну, легкодоступну платформу, без замків постачальника, без збору даних, просто потужну голосову технологію за справедливими цінами.

Що ми пропонуємо

Текст для мовлення

20 моделей+, зокрема, Kokro, Chatterbox, Bark тощо. Від швидкого легкого синтезу до виведених у студії даних.

Мова до тексту

Влаштовуючись Whsper, Fast-Whisper, і сенсорно, записуйте аудіо на 100+ мов з часовими штампами і виявленням промовця.

Клонування голосу

Клонувати будь- який голос з зразок п' яти секунд. Створіть власні голоси для ваших проектів, GPT- SoviTS, ComyWoom 2, тощо.

Обробка аудіо

Покращення звуку, вилучення голосів, розбиття стебел, вилучення ехо- ревергатора, виявлення ключа/ BPM і перетворення форматів. Всі ці формати надано комп' ютерним інтерфейсом.

Голосова балачка

Вибери модель і голос для інтерактивного спілкування.

Розробник API

Сумісний з OpenAI REST API. Python SDK, приклади коду і комплексна документація. Створіть можливості голосу у ваших програмах.

Відкрити перше джерело

Кожна модель на TTS.ai - відкритий код, випущений за допомогою MIT або Apache 2.0. Ми віримо в інновації, що керують громадськістю і прозорість.

Нам потрібні

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
І ще...

Всі моделі ваги було звантажено з офіційних сховищ. Ми не додаємо жодних змін у пакунку.

Інфраструктура

TTS.ai працює на спеціальних серверах GPU за допомогою NVIDIA Tesa P40 GPU (загалом 96GB VRAM). Наша інфраструктура розроблена для низької пізності і високої перестановки:

  • Зарезервовані скупчення GPU для підрахунку - без спільних ресурсів
  • Динамічне розподілення GPU на основі моделей вимог VRAM
  • П' ятова система пріоритету для оптимального проходження
  • Моделі попередньо завантажені у VRAM для миттєвого обчислення
  • Доставка звукових даних зі зворотним доступом для швидкого звантаження CDN

Конфіденційна і безпека

  • Без тренування даних: Ми ніколи не користуємося вашим аудіо чи текстом для тренувань моделей
  • Автоз' єднання: Створений аудіо буде автоматично вилучено через 24 години
  • Шифрування: Всі дані зашифровано в транзисторі (TLS 1. 2+) і у стані спокою
  • Без стеження: Нам потрібні
  • Сумісний з GDR: Запитувати ваші дані або вилучати будь- коли

Про ЧаП TTS.ai

TTS.ai було створено Джоном Надером (надермсом), незалежним розробником, який прагне зробити голосову технологію комп' ютерного гравця доступною для всіх. Ми використовуємо і слугуємо найкращими модельми з відкритим кодом від суспільства, замість того, щоб навчати пропатентовані.

Наша інфраструктура працює на відданих серверах з NVIDIA Tella P40 GPUs, що забезпечує 96GB VRAM. Сервери веб- оболонки і GPU зберігаються у надійних центрах даних з низькою частотою зв' язку.

Ми мінімізуємо зберігання даних. Вхідні дані обробляються у режимі реального часу і не зберігаються назавжди. Всі вивантажені і створені звукові файли буде автоматично вилучено протягом 24 годин. Ми ніколи не використовуємо ваші дані для тренування моделей комп' ютерного інтелекту.

TTS.ai - це зростаюча спільнота розробників, творців контенту та підприємств по всьому світі.

Ми прагнемо високої доступності за допомогою призначеної нам інфраструктури процесора та системи пріоритетного пріоритету з 5 питань, хоча ми не пропонуємо офіційного SLA для користувачів з вільною доступністю, оплачені плани отримують вигоду від обробки пріоритетів та вищої надійності.

Так. Кожна модель на TTS.ai має відкритий код, випущений у MIT або Apache 2. 0. Ми активно підтримуємо спільноту голосових служб з відкритим кодом і сприяємо оптимізації та інтеграції в екосистему.

Наша карта доріг включає в себе додавання нових найсучасніших моделей під час вивільнення, розширення підтримки мови, покращення можливостей голосового спілкування у режимі реального часу та створення нових інструментів обробки звуку. Ми постійно інтегруємо найсвіжіший набір голосів з відкритим кодом.

TTS.ai побудовано і підтримується розробником- соло, отже не існує відкритих позицій. Але внески з відкритим кодом завжди є бажаними для будь- яких випадків, якщо ви перейдете через сторінку контактів або GitHub.

Так, ми вітаємо партнерство з розробниками, компаніями та організаціями, які намагаються вбудувати в свої продукти голосовий інтелект. Зв'яжіться з нами для обговорення інтеграції програмного інтерфейсу, об'ємного ціноутворення або нетипової моделі.

Ми проводимо регулярні перевірки безпеки нашої інфраструктури. Всі дані зашифровано за допомогою TLS 1. 2+, паролі накладаються на індустріалізовані алгоритми, а ключі API використовують хешування на один шлях. Доступ до сервера обмежено дозволеними персоналами за допомогою ключів SSH.

TTS.ai є сумісними з GDAR і дотримуються принципів мінімізації даних. Ми не зберігаємо особисті дані протягом 24 годин, не використовуємо дані клієнтів для тренування, а також забезпечуємо повний доступ до даних, виправлення і вилучення прав при запиті.

Ми постійно стежимо за пейзажем комп' ютерного зв' язку з відкритим кодом і додаємо нові моделі, коли вони стають доступними і доводимо свою якість. Основні оновлення моделей, зазвичай, відбуваються щомісяця, з невеликими оптимізаціями, встановленими на постійній основі.

Питання чи відгуки?

Зв' язок з нами Документи API