Хата турында хәбәр итү / мөмкинлекләр сорау

Ачык чыганаклы тексттан сөйләмгә модельләр

Безнең платформадагы һәрбер TTS моделе коммерциягә уңайлы лицензияләр белән ачык чыганаклы. MIT, Apache 2.0 - бернинди шәхси чикләүләр юк, куллану чикләүләре юк, гаҗәпләндерүче лицензияләү түләүләре юк. Аларны безнең хостланган API аша кулланыгыз, яки аларны үз инфраструктурагызда тулы контроль белән үз-үзегезне хостлагыз.

Ачык чыганак MIT лицензиясе Апачи Үз-үзен тотучы GitHub сайтында

Тулы TTS редакторы Документлар

Хәзер кулланып карагыз

0/500

Kokoro, Piper, VITS, MeloTTS белән бушлай

Сезнең барлыкка китергән аудио сездә монда күренәчәк

Тулы TTS редакторын ачу

Ачык кодлы TTS өстенлекләре

Ни өчен ачык чыганак моделләре сезнең проектлар өчен мөһим?

Барлык ачык чыганаклар лицензияләнгән

TTS.ai'дагы һәр модель ачык чыганак лицензиясеннән файдалана. Пропилеар кара савытлар юк, җитештерүче блокировкасы юк, көтелмәгән лицензияләү түләүләре юк.

Апачи

Моделләр MIT яки Apache 2.0 лицензиясе буенча, иң киң таралган ачык чыганак лицензиясеннән файдаланалар. Коммерция максатларында кулланыгыз, үзгәртегез, яңадан таратыгыз — чикләүләр юк.

Үз-үзен тотучы

Һәрбер модельне юкка чыгарыгыз һәм аны үз җайланмагызда эшләтегез. Сезнең мәгълүматлар, вакыт һәм инфраструктураны тулысынча контрольдә тотыгыз. Буранга бәйлелек кирәкми.

Графика процессоры оптимизацияләнгән

Моделләр CUDA ярдәме белән NVIDIA график процессорлары өчен оптимизацияләнгән. Piper процессорларда гына эшли. Күп кенә модельләргә нәтиҗәле нәтиҗә ясау өчен 2-8 ГБ VRAM кирәк.

Җәмгыять тарафыннан көйләнгән

Актив ачык чыганак җәмгыятьләре бу модельләрне саклый һәм камилләштерә. Игътибарлы булыгыз — хаталарны, яхшыртуларны һәм яңа тавышларны GitHubка җибәрегез.

Коммерция өчен куллану дөрес

Барлык модельләр үзләренең лицензияләре нигезендә коммерцияле куллануга рөхсәт итә. Продуктлар төзү, хезмәтләр сату һәм коммерцияле эчтәлек булдыру өчен авторлык хокуклары яки куллану түләүләре юк.

Безнең ачык чыганаклы модель каталогы

Һәр модель, аның лицензиясе һәм аның иң яхшы сыйфатлары

Kokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Тиз 5/5

Иң яхшысы: Apache 2.0 — иң яхшы сыйфатлы ирекле модель, 82М параметрлар, үз-үзен хостлау җиңел

Өйрәнү Kokoro

Piper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Тиз 3/5

Иң яхшысы: MIT — Процессор өчен генә, чикле җайланмалар һәм кертелгән үз-үзеңне тоту өчен идеаль

Өйрәнү Piper

VITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Тиз 3/5

Иң яхшысы: MIT — күпчелек түбән агым модельләре кулланган фундаменталь архитектура.

Өйрәнү VITS

Bark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Ябык 4/5

Иң яхшысы: 2013 — «Татмедиа» акционерлык җәмгыятенең «Татмедиа» ААҖ филиалы ачыла.

Өйрәнү Bark

Tortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Ябык 5/5 Сүзләрне клонлау

Иң яхшысы: Apache 2.0 — максималь сыйфатлы, киң өйрәнелгән референция имплементациясе.

Өйрәнү Tortoise TTS

OpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Медиа 4/5 Сүзләрне клонлау

Иң яхшысы: MIT — ачык чыганаклы тавыш клонлаштыру грануляр стиль контроле белән

Өйрәнү OpenVoice

Open Source TTS-ны ничек кулланырга

Безнең хостланган APIны кулланыгыз яки үзегез модельләрне эшләтегез

Ачык чыганаклы модельләрне карау

Безнең каталогта 20+ ачык чыганаклы ТТС моделе бар. Һәрбер модель битендә лицензия, архитектура, мөмкинлекләр һәм үз-үзеңне тоту таләпләре күрсәтелә.

Сезнең браузерда сынап карагыз

TTS.ai-да бернәрсәне дә урнаштырмыйча, теләсә нинди модельне турыдан-туры сынап карагыз. Безнең GPU серверлары эшкәртү белән шөгыльләнә, шуңа күрә үз-үзегезне хостингка куярга карар кылганчы сыйфатны бәяләп була.

Үз-үзеңне хостлау яки API куллану

GitHub-тан модель репозиторийларын клонлагыз һәм локаль рәвештә эшләтегез, яки безнең хостланган API-ны җитештерү өчен кулланыгыз. Үз-үзеңне хостлау тулысынча контрольне бирә; безнең API идарә ителгән инфраструктураны тәэмин итә.

Сезнең кушымтаны төзү

Үз-үзеңне тотучы модельләр яки безнең REST API ярдәмендә TTS-ны продуктыгызга берләштерегез. Барлык модельләр коммерция өчен кулланыла ала, лицензияләү яки авторлык хокукы түләүләре юк.

Лицензияне чагыштыру

TTS.ai-да барлык модельләр коммерциягә уңайлы ачык чыганак лицензияләрен куллана.

Модель	Лицензия	Атрибутлар
Kokoro	Apache 2.0	Таләп ителә
Piper	MIT	Юк
VITS	MIT	Юк
MeloTTS	MIT	Юк
Chatterbox	MIT	Юк
Tortoise TTS	Apache 2.0	Таләп ителә
StyleTTS 2	MIT	Юк
OpenVoice	MIT	Юк
Sesame CSM	Apache 2.0	Таләп ителә
Orpheus	Llama 3.2	"Built with Llama"

Бу модельләрне бушлай кулланып карагыз

Үз-үзеңне тоту vs Хостланган API

Сез үзегез модельләрне эшләтегез яки безгә инфраструктура белән идарә итәргә куегыз

Сезнең җайланмада үз-үзен хостлау

TTS.ai'дагы һәр модель GitHub яки Hugging Face'та ачык чыганак проекты буларак тәкъдим ителә. Җаваплылыкны төшерегез, бәйлелекләрне урнаштырыгыз, һәм үзегезнең график процессорларыгызда нәтиҗәне эшләтегез. Сез кичектерү, яшеренлек һәм масштаблауны тулысынча контрольдә тотасыз.

Деректерне тулысынча яшерү — аудио сезнең серверны беркайчан да калдырмый
Башлангыч көйләүдән соң сорау бәясе юк
Сезнең үз мәгълүматларыгыз буенча үзенчәлекле яхшыртулар
Графика процессоры кирәк (NVIDIA киңәш ителә)
Сез яңартуларны, масштаблауны һәм бәйлелекләрне идарә итәсез

TTS.ai хостланган API куллану

Бер REST API аша 20+ модельгә тиз арада керү мөмкинлеге. Без GPU провизиясен, модель яңартуларын, чиратларны һәм масштабны контрольдә тотабыз. Бер API ключа һәр модельгә керү мөмкинлеге бирә — аерым урнаштыруларны идарә итәргә кирәкми.

Графика җиһазлары кирәкми
20+ модель бер API аша
Модельләрне автоматик яңарту һәм яхшырту
99,9 % эш вакыты җитәрлек инфраструктура белән
Сез фәкать үзегез кулланган өчен генә әҗер бирәсез.

Аның урынына хостланган API кулланыгыз

Тиз башлау: API яки үз-үзен хосты

Безнең хостланган API-ны кулланыгыз яки Kokoro-ны минутлар эчендә локаль урнаштырыгыз

1 вариант: TTS.ai хостланган API Иң җиңеле

import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)

2нче вариант: pip белән үз-үзен хост итү Тулы контроль

# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

API документациясен карау

Ачык чыганак, уңайлы бәяләр

1999 елдан бирле «Татмедиа» акционерлык җәмгыятенең баш мөхәррире.

Үзгәрешсез дәрәҗә

50 дән артык фәнни хезмәт авторы.

4 гыйнвар — Милади тәкъвимендә дүртенче айның дүртенче көне.
Төп куллану өчен теркәлү кирәкми
Коммерцияле куллануга рөхсәт ителә

Башлатучы

500 кредит/аена

Барлыгы 20+ ачык чыганак моделе
Сүзләрне клонлау
APIга керү

Профиль

$29

2000 елда нигезләнгән.

GPU эшкәртүнең өстенлеге
Барлык премиум модельләр
Компанияне яклау

Барлык бәяләрне карау

Кайвакыт бирелә торган сораулар

Тексттан сөйләмгә күчерү турында киң таралган сораулар

Әйе. TTS.aiдагы һәр модель рөхсәт ителгән ачык чыганак лицензиясын куллана — MIT яки Apache 2.0. Без чикләүле лицензияләр белән модельләрне аерым рәвештә кертмибез (мәсәлән, Coqui's CPML яки коммерцияле булмаган CC-BY-NC). Һәр модельнең лицензиясен аның GitHub репозиториясендә тикшерә аласыз.

Икесе дә коммерцияле куллануга, үзгәртүгә һәм яңадан таратуга рөхсәт итүче ачык чыганак лицензияләре. Apache 2.0 ачык патент бирүләрне өсти һәм кодны үзгәртсәгез, үзгәрешләр турында хәбәр итүне таләп итә. MIT гадирәк һәм азрак таләпләр куя. Икесе дә бизнес өчен уңайлы.

Әйе. Һәр модель үз-үзен тоташтырырга мөмкин. Модель репозиториясен GitHub-тан клонлагыз, бәйлелекләрне урнаштырыгыз, модель авырлыкларын юкка чыгарыгыз һәм нәтиҗә ясагыз. Без һәр модельнең үз-үзен тоташтыруга таләпләре өчен документацияне тәкъдим итәбез, шул исәптән GPU, RAM һәм Python версиясен.

Таләпләр модельгә карап үзгәрә. Piper'га график процессор кирәкми (процессор гына кирәк). Kokoro һәм MeloTTS'ка 1-2 ГБ VRAM кирәк. Стандарт модельләрнең күбесенә 4 ГБ VRAM кирәк. Tortoise һәм Sesame CSM'га 8 ГБ кирәк. NVIDIA RTX 3060 (12 ГБ) күпчелек модельләрне уңайлы эшли ала.

Әйе. Ачык чыганак лицензиясе үзгәртүләргә рөхсәт итә, шул исәптән төгәл көйләүне дә. GPT-SoVITS һәм Bark кебек модельләр төгәл көйләү скриптларын тәкъдим итәләр. Сез үзегезнең тавыш мәгълүматлары буенча модельләрне өйрәтә аласыз, үзегезнең тавышларны булдыру өчен яки билгеләнгән телләр өчен эшчәнлекне яхшырту өчен.

Иң яхшы ачык чыганак моделләре (Kokoro, StyleTTS 2, Chatterbox) хәзер сыйфат күрсәткечләре буенча ElevenLabs һәм Google TTS кебек коммерцияле хезмәтләргә туры килә яки аларны узып китә. Коммерцияле хезмәтләрнең төп өстенлеге - идарә ителгән инфраструктура һәм ярдәм, аудио сыйфаты түгел.

Без аларны инде юкка чыгардык. XTTS/XTTS-v2 (Coqui's CPML — коммерцияле булмаган), F5-TTS (CC-BY-NC — коммерцияле булмаган), һәм Higgs-v2 (Бозон лицензиясе — чикләүле) бар да юкка чыгарылды. TTS.aiдагы һәр модель коммерцияле куллану өчен куркынычсыз дип тикшерелгән.

Әйе. Модельләрнең күбесе GitHub аша җәмәгатьчелек ярдәмен кабул итә. Сез хаталар турындагы хәбәрләрне, яңа телләр өчен тавыш язуларны, кодны яхшыртуларны һәм документацияне җибәрә аласыз. Һәр модельнең GitHub репозиториясен катнашу кагыйдәләре һәм актив проблемалар өчен карагыз.

ГПУ хәтерен уртаклашу өчен сорау буенча модельләрне йөкләгез һәм ялгыз вакытта юк итегез. Безнең ГПУ серверы 20+ модельне 4x Tesla P40 (96GB гомуми VRAM) динамик йөкләү кулланып эшли. Үз-үзен хостлау өчен, бер 24GB ГПУ берьюлы 3-5 модельне хезмәтләндерә ала.

Күп кенә модельләр рәсми Docker образлары яки Dockerfiles тәкъдим итә. Берничә модельне эшләтү өчен, NVIDIA Container Toolkit белән GPUга керү өчен үз Docker конфигурациясен төзи аласыз. Безнең API сервер архитектурасы референт гамәлгә ашыру булып хезмәт итә ала.

Кайбер модельләргә Python 3.10-3.12 кирәк. Coqui TTS (VITS) аеруча Python 3.11 кирәк. Кайбер модельләргә Python 3.12 киңәш ителә. Һәр модельнең requirements.txt файлын төгәл версиягә туры килү өчен тикшерегез.

Әйе. MIT һәм Apache 2.0 лицензияләре коммерцияле куллануга рөхсәт итә. Сез бу модельләрне кулланып SaaS продуктларын, мобиль кушымталарны, уеннарны һәм хезмәтләрне лицензияләү түләүләре, авторлык түләүләре, яки исем кушу таләпләресез төзи аласыз (исем кушу таләп ителгән булса да).

5.0/5 (1)

Бүген ачык чыганаклы TTS белән сынап карагыз

20+ ачык чыганак моделе, барысы да коммерцияле лицензияле. Безнең API яки үз-хост кулланыгыз - сайлап алу сезнең кулда.

Бушлай теркәлү Нархларны карау

Ачык чыганаклы тексттан сөйләмгә модельләр

Хәзер кулланып карагыз

TTS.ai-ны яратасызмы? Дусларыгызга сөйләгез!

Ачык кодлы TTS өстенлекләре

Барлык ачык чыганаклар лицензияләнгән

Апачи

Үз-үзен тотучы

Графика процессоры оптимизацияләнгән

Җәмгыять тарафыннан көйләнгән

Коммерция өчен куллану дөрес

Безнең ачык чыганаклы модель каталогы

Kokoro

Piper

VITS

Bark

Tortoise TTS

OpenVoice

Open Source TTS-ны ничек кулланырга

Ачык чыганаклы модельләрне карау

Сезнең браузерда сынап карагыз

Үз-үзеңне хостлау яки API куллану

Сезнең кушымтаны төзү

Лицензияне чагыштыру

Үз-үзеңне тоту vs Хостланган API

Сезнең җайланмада үз-үзен хостлау

TTS.ai хостланган API куллану

Тиз башлау: API яки үз-үзен хосты

Ачык чыганак, уңайлы бәяләр

Үзгәрешсез дәрәҗә

Башлатучы

Профиль

Кайвакыт бирелә торган сораулар

TTS.ai модельләр чынлап та ачык чыганакмы?

MIT һәм Apache 2.0 лицензияләре арасында нинди аерма бар?

Мин бу модельләрне үз серверымда үз-үземә урнаштыра аламмы?

TTS модельләрен үз-үземә урнаштыру өчен нинди GPU кирәк?

Мин ачык чыганаклы TTS модельләрен камилләштерә аламмы?

«Татмедиа» акционерлык җәмгыятенең матбугат хезмәте җитәкчесе.

Лицензия чикләүләре булган модельләр бармы, алардан сакланырга кирәкме?

Мин бу ачык чыганак моделенә өлеш кертә аламмы?

Бер GPU серверында берничә модельне ничек эшләтергә?

Үз-үзеңне тоту өчен Docker образы бармы?

Үз-үзеңне тоту өчен Pythonның нинди версиясе кирәк?

Мин бу модельләрне кулланып коммерция продуктын төзи аламмы?

Бүген ачык чыганаклы TTS белән сынап карагыз