Пра

Найбольш поўная платформа штучнага інтэлекту з адкрытым зыходным кодам. 20+ мадэляў, 100+ галасоў, усё ў адным месцы.

Створана

TTS.ai быў створаны John Nader (nadermx), Незалежны распрацоўшчык, які стварае інструменты штучнага інтэлекту з адкрытым зыходным кодам. TTS.ai з'яўляецца часткай місіі зрабіць найлепшыя тэхналогіі штучнага інтэлекту даступнымі для ўсіх - без залежнасці ад вытворцы, без збору дадзеных, проста магутныя тэхналогіі галасаваньня па справядлівых цэнах.

Наша місія

TTS.ai быў пабудаваны на простай веры: лепшыя тэхналогіі штучнага голасу павінны быць даступныя для ўсіх. У той час як уласніцкія сэрвісы ўжываюць прэміум-цэны за асноўныя функцыі пераўтварэння тэксту ў мову, супольнасць адкрытага кода стварыла мадэлі, якія адпавядаюць або пераўзыходзяць камерцыйную якасць.

Мы аб'ядналі лепшыя мадэлі галасаваньня з адкрытым зыходным кодам у адну, лёгкую ў выкарыстаньні платформу. Няма залежнасьці ад вытворцы. Няма збору дадзеных. Толькі магутныя галасавыя тэхналогіі па справядлівых цэнах.

Што мы прапануем

Пераклад тэксту на мовуName

20+ мадэляў, уключаючы Kokoro, Chatterbox, Bark і іншыя. Ад хуткага лёгкага сінтэзу да вываду студыйнай якасці.

Пераклад з мовы на тэкстName

Праграмнае забесьпячэньне Whisper, Faster-Whisper, і SenseVoice. Транскрыпцыя аўдыё на 100+ мовах з вымярэньнем часу і выяўленьня голасу.

Клонаванне голасу

Клонаваць любы голас з 5-секунднага семплу. Chatterbox, GPT-SoVITS, CosyVoice 2 і іншыя. Ствараць уласныя голасу для сваіх праектаў.

Апрацоўка гукуName

Пашырыць гук, выдаліць вокал, падзяліць стэм, выдаліць эха/рэверберацыю, вызначыць ключы/BPM і пераўтварыць фарматы. Усё на аснове штучнага інтэлекту.

Галасовы чатName

Галасовыя гутаркі ў рэальным часе з AI. Выберыце вашу мадэль і голас для інтэрактыўных гутарак.

API распрацоўшчыка

OpenAI-сумяшчальны REST API. Python SDK, прыклады кода і поўная дакументацыя. Збудоўвайце галасавыя функцыі ў вашых праграмах.

Перш за ўсё адкрыты код

Кожная мадэль на TTS.ai з'яўляецца адкрытым кодам, ліцэнзаваным пад MIT або Apache 2.0. Мы верым у празрыстасць і ініцыятывы супольнасці.

Мы

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
І яшчэ...

Усе вагі мадэляў загружаныя з іх афіцыйных сховішчаў. Мы не дадаем ніякіх уласных зменаў.

Інфраструктура

TTS.ai працуе на спецыяльных серверах з графічнымі працэсарамі NVIDIA Tesla P40 (96 ГБ VRAM усяго). Наша інфраструктура распрацавана для нізкай затрымакі і высокай прапускной здольнасці:

  • Выдзеленыя кластары GPU для вываду - няма агульных рэсурсаў
  • Дынамічнае выдзяленне GPU на аснове патрабаванняў мадэлі VRAM
  • Сістэма 5- чарговага прыярытэту для аптымальнай прапускной здольнасці
  • Модэлі папярэдне загружаныя ў VRAM для неадкладнага вываду
  • CDN-падтрымка дастаўкі аўдыё для хуткіх сцягваньняў

Прыватнасць і бяспека

  • Няма трэніровачных дадзеных: Мы ніколі не выкарыстоўваем ваш аўдыё ці тэкст для трэніроўкі мадэляў
  • Аўтаматычнае выдаленне: Створаны гук аўтаматычна выдаляецца праз 24 гадзіны
  • Шыфроўка: Усе дадзеныя шыфраваны пры перадачы (TLS 1. 2+) і пры захоўванні
  • Без адсочвання: Мы
  • Згодна з GDPR: Запытаць ці выдаліць вашыя дадзеныя ў любы час

Пра TTS.ai FAQ

TTS.ai быў створаны Джонам Надэрам (nadermx), незалежным распрацоўшчыкам, які імкнецца зрабіць тэхналогію машыннага навучання даступнай для ўсіх. Мы рыхтуем і абслугоўваем лепшыя мадэлі з адкрытым зыходным кодам ад супольнасці, а не трэніруем уласніцкія.

Наша інфраструктура працуе на спецыяльных серверах з графічнымі працэсарамі NVIDIA Tesla P40, якія забяспечваюць 96 ГБ VRAM. Веб-фронтэнд і серверы вываду GPU знаходзяцца ў бяспечных цэнтрах дадзеных з нізкай латэнцыяй злучэння.

Мы мінімізуем захоўванне дадзеных. Уводзіны тэксту апрацоўваюцца ў рэальным часе і не захоўваюцца назаўсёды. Усе загружаныя і створаныя гукавыя файлы аўтаматычна выдаляюцца праз 24 гадзіны. Мы ніколі не выкарыстоўваем вашыя дадзеныя для трэніроўкі мадэляў штучнага інтэлекту.

TTS.ai абслугоўвае расце супольнасць распрацоўшчыкаў, стваральнікаў кантэнту і бізнесу па ўсім свеце. Наша платформа апрацоўвае тысячы запытаў на генерацыю голасу штодня праз 20+ мадэляў AI.

Мы імкнемся да высокай даступнасці з нашай адмысловай інфраструктурай GPU і сістэмай прыярытэтаў 5-х чарг. Нягледзячы на тое, што мы не прапануем афіцыйнага SLA для карыстальнікаў бясплатнага ўзроўню, платныя планы атрымліваюць выгаду ад прыярытэтнай апрацоўкі і вышэйшай надзейнасці.

Так. Кожная мадэль на TTS.ai з'яўляецца адкрытым кодам, ліцэнзаваным па ліцэнзіі MIT або Apache 2.0. Мы актыўна падтрымліваем супольнасць галасавага штучнага інтэлекту з адкрытым кодам і ўносім уклад у аптымалізацыю і інтэграцыю назад у экасістэму.

Наша стратэгія ўключае ў сябе даданне новых сучасных мадэляў па меры іх выхаду, пашырэнне падтрымкі моў, паляпшэнне магчымасцяў галасавых гутарак у рэальным часе і стварэнне новых інструментаў апрацоўкі гуку. Мы пастаянна інтэгруем апошнія адкрытыя дасягненні ў галіне штучнага інтэлекту.

TTS.ai збудаваны і падтрымліваецца адным распрацоўшчыкам, таму няма адкрытых пазіцый. Аднак, адкрыты код заўсёды прымаецца — звяжыцеся праз старонку кантактаў або GitHub.

Так, мы вітаем супрацоўніцтва з распрацоўшчыкамі, кампаніямі і арганізацыямі, якія хочуць інтэграваць машыннае навучанне ў свае прадукты. Звяжыцеся з намі, каб абмеркаваць інтэграцыю API, аб'ёмныя цэны або разгортванне ўласнай мадэлі.

Мы праводзім рэгулярныя праверкі бяспекі нашай інфраструктуры. Усе дадзеныя зашыфроўваюцца падчас перадачы з дапамогай TLS 1. 2+, паролі зашыфроўваюцца з дапамогай стандартных алгоритмов, а ключы API выкарыстоўваюць аднабаковую зашыфроўку. Даступ да сервера абмежаваны для аўтарызаванага персаналу праз ключы SSH.

TTS.ai адпавядае патрабаванням GDPR і прытрымліваецца прынцыпаў мінімалізацыі дадзеных. Мы не захоўваем асабістыя аўдыёданыя больш за 24 гадзіны, не выкарыстоўваем дадзеныя кліентаў для трэніровак і забяспечваем поўны доступ да дадзеных, правы на карэкціроўку і выдаленне па запыце.

Мы пастаянна назіраем за адкрытымі тэхналогіямі штучнага інтэлекту голасу і дадаем новыя мадэлі, як толькі яны становяцца даступнымі і даказваюць сваю якасць. Галоўныя абнаўлення мадэляў звычайна адбываюцца штомесяц, з невялікімі аптымізацыямі, якія разгортваюцца на пастаяннай аснове.