Пра
Найбольш поўная платформа штучнага інтэлекту з адкрытым зыходным кодам. 20+ мадэляў, 100+ галасоў, усё ў адным месцы.
Створана
TTS.ai быў створаны John Nader (nadermx), Незалежны распрацоўшчык, які стварае інструменты штучнага інтэлекту з адкрытым зыходным кодам. TTS.ai з'яўляецца часткай місіі зрабіць найлепшыя тэхналогіі штучнага інтэлекту даступнымі для ўсіх - без залежнасці ад вытворцы, без збору дадзеных, проста магутныя тэхналогіі галасаваньня па справядлівых цэнах.
Наша місія
TTS.ai быў пабудаваны на простай веры: лепшыя тэхналогіі штучнага голасу павінны быць даступныя для ўсіх. У той час як уласніцкія сэрвісы ўжываюць прэміум-цэны за асноўныя функцыі пераўтварэння тэксту ў мову, супольнасць адкрытага кода стварыла мадэлі, якія адпавядаюць або пераўзыходзяць камерцыйную якасць.
Мы аб'ядналі лепшыя мадэлі галасаваньня з адкрытым зыходным кодам у адну, лёгкую ў выкарыстаньні платформу. Няма залежнасьці ад вытворцы. Няма збору дадзеных. Толькі магутныя галасавыя тэхналогіі па справядлівых цэнах.
Што мы прапануем
Пераклад тэксту на мовуName
20+ мадэляў, уключаючы Kokoro, Chatterbox, Bark і іншыя. Ад хуткага лёгкага сінтэзу да вываду студыйнай якасці.
Пераклад з мовы на тэкстName
Праграмнае забесьпячэньне Whisper, Faster-Whisper, і SenseVoice. Транскрыпцыя аўдыё на 100+ мовах з вымярэньнем часу і выяўленьня голасу.
Клонаванне голасу
Клонаваць любы голас з 5-секунднага семплу. Chatterbox, GPT-SoVITS, CosyVoice 2 і іншыя. Ствараць уласныя голасу для сваіх праектаў.
Апрацоўка гукуName
Пашырыць гук, выдаліць вокал, падзяліць стэм, выдаліць эха/рэверберацыю, вызначыць ключы/BPM і пераўтварыць фарматы. Усё на аснове штучнага інтэлекту.
Галасовы чатName
Галасовыя гутаркі ў рэальным часе з AI. Выберыце вашу мадэль і голас для інтэрактыўных гутарак.
API распрацоўшчыка
OpenAI-сумяшчальны REST API. Python SDK, прыклады кода і поўная дакументацыя. Збудоўвайце галасавыя функцыі ў вашых праграмах.
Перш за ўсё адкрыты код
Кожная мадэль на TTS.ai з'яўляецца адкрытым кодам, ліцэнзаваным пад MIT або Apache 2.0. Мы верым у празрыстасць і ініцыятывы супольнасці.
Мы
Усе вагі мадэляў загружаныя з іх афіцыйных сховішчаў. Мы не дадаем ніякіх уласных зменаў.
Інфраструктура
TTS.ai працуе на спецыяльных серверах з графічнымі працэсарамі NVIDIA Tesla P40 (96 ГБ VRAM усяго). Наша інфраструктура распрацавана для нізкай затрымакі і высокай прапускной здольнасці:
- Выдзеленыя кластары GPU для вываду - няма агульных рэсурсаў
- Дынамічнае выдзяленне GPU на аснове патрабаванняў мадэлі VRAM
- Сістэма 5- чарговага прыярытэту для аптымальнай прапускной здольнасці
- Модэлі папярэдне загружаныя ў VRAM для неадкладнага вываду
- CDN-падтрымка дастаўкі аўдыё для хуткіх сцягваньняў
Прыватнасць і бяспека
- Няма трэніровачных дадзеных: Мы ніколі не выкарыстоўваем ваш аўдыё ці тэкст для трэніроўкі мадэляў
- Аўтаматычнае выдаленне: Створаны гук аўтаматычна выдаляецца праз 24 гадзіны
- Шыфроўка: Усе дадзеныя шыфраваны пры перадачы (TLS 1. 2+) і пры захоўванні
- Без адсочвання: Мы
- Згодна з GDPR: Запытаць ці выдаліць вашыя дадзеныя ў любы час