Про програму
Найбільш комплексна голосова платформа з відкритим кодом. 20+моделі, 100+голів, все в одному місці.
Створено
TTS.ai було створено John Nader (nadermx), Незалежний розробник, який створює інструменти комп' ютерного зв' язку з відкритим кодом. TTS.ai є частиною місії для того, щоб зробити найкращу комп' ютерно- голосову технологію доступною для кожного ♫ Не потрібно блокувати виробників, не збирати даних, просто потужні голосові технології за справедливими цінами.
Наша місія
TTS.ai було збудовано на простому переконанні: Лучшая ШІ голосовая технология должна быть доступна всем. У той час як пропріетарні сервіси сплачують внескові ціни на базові текстові повідомлення, спільнота з відкритим кодом створила моделі, які відповідають чи перевищують комерційну якість.
Ми об'єднуємо найкращі моделі комп'ютерного програмного забезпечення в одну, легкодоступну платформу, без замків постачальника, без збору даних, просто потужну голосову технологію за справедливими цінами.
Що ми пропонуємо
Текст для мовлення
20 моделей+, зокрема, Kokro, Chatterbox, Bark тощо. Від швидкого легкого синтезу до виведених у студії даних.
Мова до тексту
Влаштовуючись Whsper, Fast-Whisper, і сенсорно, записуйте аудіо на 100+ мов з часовими штампами і виявленням промовця.
Клонування голосу
Клонувати будь- який голос з зразок п' яти секунд. Створіть власні голоси для ваших проектів, GPT- SoviTS, ComyWoom 2, тощо.
Обробка аудіо
Покращення звуку, вилучення голосів, розбиття стебел, вилучення ехо- ревергатора, виявлення ключа/ BPM і перетворення форматів. Всі ці формати надано комп' ютерним інтерфейсом.
Голосова балачка
Вибери модель і голос для інтерактивного спілкування.
Розробник API
Сумісний з OpenAI REST API. Python SDK, приклади коду і комплексна документація. Створіть можливості голосу у ваших програмах.
Відкрити перше джерело
Кожна модель на TTS.ai - відкритий код, випущений за допомогою MIT або Apache 2.0. Ми віримо в інновації, що керують громадськістю і прозорість.
Нам потрібні
Всі моделі ваги було звантажено з офіційних сховищ. Ми не додаємо жодних змін у пакунку.
Інфраструктура
TTS.ai працює на спеціальних серверах GPU за допомогою NVIDIA Tesa P40 GPU (загалом 96GB VRAM). Наша інфраструктура розроблена для низької пізності і високої перестановки:
- Зарезервовані скупчення GPU для підрахунку - без спільних ресурсів
- Динамічне розподілення GPU на основі моделей вимог VRAM
- П' ятова система пріоритету для оптимального проходження
- Моделі попередньо завантажені у VRAM для миттєвого обчислення
- Доставка звукових даних зі зворотним доступом для швидкого звантаження CDN
Конфіденційна і безпека
- Без тренування даних: Ми ніколи не користуємося вашим аудіо чи текстом для тренувань моделей
- Автоз' єднання: Створений аудіо буде автоматично вилучено через 24 години
- Шифрування: Всі дані зашифровано в транзисторі (TLS 1. 2+) і у стані спокою
- Без стеження: Нам потрібні
- Сумісний з GDR: Запитувати ваші дані або вилучати будь- коли