Ачык чыганаклы тексттан сөйләмгә модельләр

Безнең платформадагы һәрбер TTS моделе коммерциягә уңайлы лицензияләр белән ачык чыганаклы. MIT, Apache 2.0 - бернинди шәхси чикләүләр юк, куллану чикләүләре юк, гаҗәпләндерүче лицензияләү түләүләре юк. Аларны безнең хостланган API аша кулланыгыз, яки аларны үз инфраструктурагызда тулы контроль белән үз-үзегезне хостлагыз.

Ачык чыганак MIT лицензиясе Апачи Үз-үзен тотучы GitHub сайтында

Хәзер кулланып карагыз

0/500
Kokoro, Piper, VITS, MeloTTS белән бушлай
Your generated audio will appear here
Кулланылган
0:00 0:00
Җибәрү
TTS.ai сезгә ошадымы? Дусларыгызга сөйләгез!

Ачык кодлы TTS өстенлекләре

Ни өчен ачык чыганак моделләре сезнең проектлар өчен мөһим?

Барлык ачык чыганаклар лицензияләнгән

TTS.ai'дагы һәр модель ачык чыганак лицензиясеннән файдалана. Пропилеар кара савытлар юк, җитештерүче блокировкасы юк, көтелмәгән лицензияләү түләүләре юк.

Апачи

Моделләр MIT яки Apache 2.0 лицензиясе буенча, иң киң таралган ачык чыганак лицензиясеннән файдаланалар. Коммерция максатларында кулланыгыз, үзгәртегез, яңадан таратыгыз — чикләүләр юк.

Үз-үзен тотучы

Һәрбер модельне юкка чыгарыгыз һәм аны үз җайланмагызда эшләтегез. Сезнең мәгълүматлар, вакыт һәм инфраструктураны тулысынча контрольдә тотыгыз. Буранга бәйлелек кирәкми.

Графика процессоры оптимизацияләнгән

Модельләр NVIDIA график процессорлары өчен CUDA ярдәме белән оптимизацияләнгән. Piper процессорларда гына эшли. Күпчелек модельләргә нәтиҗәле нәтиҗә ясау өчен 2-8 GB VRAM кирәк.

Җәмгыять тарафыннан көйләнгән

Актив ачык чыганак җәмгыятьләре бу модельләрне саклый һәм камилләштерә. Игътибарлы булыгыз — хаталарны, яхшыртуларны һәм яңа тавышларны GitHubка җибәрегез.

Коммерция өчен куллану дөрес

Барлык модельләр үзләренең лицензияләре нигезендә коммерцияле куллануга рөхсәт итә. Продуктлар төзү, хезмәтләр сату һәм коммерцияле эчтәлек булдыру өчен авторлык хокуклары яки куллану түләүләре юк.

Безнең ачык чыганаклы модель каталогы

Һәр модель, аның лицензиясе һәм аның иң яхшы сыйфатлары

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Иң яхшысы: Apache 2.0 — иң яхшы сыйфатлы ирекле модель, 82М параметрлар, үз-үзен хостлау җиңел

Өйрәнү Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Иң яхшысы: MIT — Процессор өчен генә, чикле җайланмалар һәм кертелгән үз-үзеңне тоту өчен идеаль

Өйрәнү Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Иң яхшысы: MIT — күпчелек түбән агым модельләре кулланган фундаменталь архитектура.

Өйрәнү VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Иң яхшысы: 2013 — «Татмедиа» акционерлык җәмгыятенең «Татмедиа» ААҖ филиалы ачыла.

Өйрәнү Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Сүзләрне клонлау

Иң яхшысы: Apache 2.0 — максималь сыйфатлы, киң өйрәнелгән референция имплементациясе.

Өйрәнү Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Сүзләрне клонлау

Иң яхшысы: MIT — ачык чыганаклы тавыш клонлаштыру грануляр стиль контроле белән

Өйрәнү OpenVoice

Open Source TTS-ны ничек кулланырга

Безнең хостланган APIны кулланыгыз яки үзегез модельләрне эшләтегез

1

Ачык чыганаклы модельләрне карау

Безнең 20+ ачык чыганаклы TTS модельләре каталогын карагыз. Һәр модель битендә лицензия, архитектура, мөмкинлекләр һәм үз-үзеңне тоту таләпләре күрсәтелә.

2

Сезнең браузерда сынап карагыз

TTS.ai-да бернәрсәне дә урнаштырмыйча, теләсә нинди модельне турыдан-туры сынап карагыз. Безнең GPU серверлары эшкәртү белән шөгыльләнә, шуңа күрә үз-үзегезне хостингка куярга карар кылганчы сыйфатны бәяләп була.

3

Үз-үзеңне хостлау яки API куллану

GitHub-тан модель репозиторийларын клонлагыз һәм локаль рәвештә эшләтегез, яки безнең хостланган API-ны җитештерү өчен кулланыгыз. Үз-үзеңне хостлау тулысынча контрольне бирә; безнең API идарә ителгән инфраструктураны тәэмин итә.

4

Сезнең кушымтаны төзү

Үз-үзеңне тотучы модельләр яки безнең REST API ярдәмендә TTS-ны продуктыгызга берләштерегез. Барлык модельләр коммерция өчен кулланыла ала, лицензияләү яки авторлык хокукы түләүләре юк.

Лицензияне чагыштыру

TTS.ai-да барлык модельләр коммерциягә уңайлы ачык чыганак лицензияләрен куллана.

Модель Лицензия Коммерция өчен куллану Үзгәртү Үз-үзе Атрибутлар
Kokoro Apache 2.0 Таләп ителә
Piper MIT Юк
VITS MIT Юк
MeloTTS MIT Юк
Chatterbox MIT Юк
Tortoise TTS Apache 2.0 Таләп ителә
StyleTTS 2 MIT Юк
OpenVoice MIT Юк
Sesame CSM Apache 2.0 Таләп ителә
Orpheus Llama 3.2 "Built with Llama"

Үз-үзеңне тоту vs Хостланган API

Сез үзегез модельләрне эшләтегез яки безгә инфраструктура белән идарә итәргә куегыз

Сезнең җайланмада үз-үзен хостлау

TTS.ai'дагы һәр модель GitHub яки Hugging Face'та ачык чыганак проекты буларак тәкъдим ителә. Җаваплылыкны төшерегез, бәйлелекләрне урнаштырыгыз, һәм үзегезнең график процессорларыгызда нәтиҗәне эшләтегез. Сез кичектерү, яшеренлек һәм масштаблауны тулысынча контрольдә тотасыз.

  • Деректерне тулысынча яшерү — аудио сезнең серверны беркайчан да калдырмый
  • Башлангыч көйләүдән соң сорау бәясе юк
  • Сезнең үз мәгълүматларыгыз буенча үзенчәлекле яхшыртулар
  • Графика процессоры кирәк (NVIDIA киңәш ителә)
  • Сез яңартуларны, масштаблауны һәм бәйлелекләрне идарә итәсез

TTS.ai хостланган API куллану

Бер REST API аша барлык 24+ модельгә тиз арада керү. Без GPU провизиясен, модель яңартуларын, чиратларны һәм масштабны контрольдә тотабыз. Бер API ключа һәр модельгә керү мөмкинлеге бирә - аерым урнаштыруларны идарә итәргә кирәкми.

  • Графика җиһазлары кирәкми
  • Барлык 24+ модель бер API аша
  • Модельләрне автоматик яңарту һәм яхшырту
  • 99,9 % эш вакыты җитәрлек инфраструктура белән
  • Сез фәкать үзегез кулланган өчен генә әҗер бирәсез.

Тиз башлау: API яки үз-үзен хосты

Безнең хостланган API-ны кулланыгыз яки Kokoro-ны минутлар эчендә локаль урнаштырыгыз

1 вариант: TTS.ai хостланган API Иң җиңеле
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
2нче вариант: pip белән үз-үзен хост итү Тулы контроль
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Ачык чыганак, уңайлы бәяләр

1999 елдан бирле «Татмедиа» акционерлык җәмгыятенең баш мөхәррире.

Үзгәрешсез дәрәҗә

$0

50 дән артык фәнни хезмәт авторы.

  • 4 гыйнвар — Милади тәкъвимендә дүртенче айның дүртенче көне.
  • Төп куллану өчен теркәлү кирәкми
  • Коммерцияле куллануга рөхсәт ителә

Башлатучы

$9

500 кредит/аена

  • Барлыгы 24+ ачык чыганак моделе
  • Сүзләрне клонлау
  • APIга керү

Профиль

$29

2000 елда нигезләнгән.

  • GPU эшкәртүнең өстенлеге
  • Барлык премиум модельләр
  • Компанияне яклау
Барлык бәяләрне карау

Кайвакыт бирелә торган сораулар

Тексттан сөйләмгә күчерү турында киң таралган сораулар

Әйе. TTS.aiдагы һәр модель рөхсәт ителгән ачык чыганак лицензиясын куллана — MIT яки Apache 2.0. Без чикләүле лицензияләр белән модельләрне аерым рәвештә кертмибез (мәсәлән, Coqui's CPML яки коммерцияле булмаган CC-BY-NC). Һәр модельнең лицензиясен аның GitHub репозиториясендә тикшерә аласыз.

Икесе дә коммерцияле куллануга, үзгәртүгә һәм яңадан таратуга рөхсәт итүче ачык чыганак лицензияләре. Apache 2.0 ачык патент бирүләрне өсти һәм кодны үзгәртсәгез, үзгәрешләр турында хәбәр итүне таләп итә. MIT гадирәк һәм азрак таләпләр куя. Икесе дә бизнес өчен уңайлы.

Әйе. Һәр модель үз-үзен тоташтырырга мөмкин. Модель репозиториясен GitHub-тан клонлагыз, бәйлелекләрне урнаштырыгыз, модель авырлыкларын юкка чыгарыгыз һәм нәтиҗә ясагыз. Без һәр модельнең үз-үзен тоташтыруга таләпләре өчен документацияне тәкъдим итәбез, шул исәптән GPU, RAM һәм Python версиясен.

Таләпләр модельгә карап үзгәрә. Piper'га график процессор кирәкми (процессор гына кирәк). Kokoro һәм MeloTTS'ка 1-2 ГБ VRAM кирәк. Стандарт модельләрнең күбесенә 4 ГБ VRAM кирәк. Tortoise һәм Sesame CSM'га 8 ГБ кирәк. NVIDIA RTX 3060 (12 ГБ) күпчелек модельләрне уңайлы эшли ала.

Әйе. Ачык чыганак лицензиясе үзгәртүләргә рөхсәт итә, шул исәптән төгәл көйләүне дә. GPT-SoVITS һәм Bark кебек модельләр төгәл көйләү скриптларын тәкъдим итәләр. Сез үзегезнең тавыш мәгълүматлары буенча модельләрне өйрәтә аласыз, үзегезнең тавышларны булдыру өчен яки билгеләнгән телләр өчен эшчәнлекне яхшырту өчен.

Иң яхшы ачык чыганак моделләре (Kokoro, StyleTTS 2, Chatterbox) хәзер сыйфат күрсәткечләре буенча ElevenLabs һәм Google TTS кебек коммерцияле хезмәтләргә туры килә яки аларны узып китә. Коммерцияле хезмәтләрнең төп өстенлеге - идарә ителгән инфраструктура һәм ярдәм, аудио сыйфаты түгел.

Без аларны инде юкка чыгардык. XTTS/XTTS-v2 (Coqui's CPML — коммерцияле булмаган), F5-TTS (CC-BY-NC — коммерцияле булмаган), һәм Higgs-v2 (Бозон лицензиясе — чикләүле) бар да юкка чыгарылды. TTS.aiдагы һәр модель коммерцияле куллану өчен куркынычсыз дип тикшерелгән.

Әйе. Модельләрнең күбесе GitHub аша җәмәгатьчелек ярдәмен кабул итә. Сез хаталар турындагы хәбәрләрне, яңа телләр өчен тавыш язуларны, кодны яхшыртуларны һәм документацияне җибәрә аласыз. Һәр модельнең GitHub репозиториясен катнашу кагыйдәләре һәм актив проблемалар өчен карагыз.

Модельләрне сорау буенча йөкләгез һәм GPU хәтерен уртаклашу өчен ялгыз вакытта йөкләмәне юкка чыгарыгыз. Безнең GPU серверы 20+ модельне 4x Tesla P40 (барлыгы 96GB VRAM) динамик йөкләүне кулланып эшли. Үз-үзен хостлау өчен, бер 24GB GPU берьюлы 3-5 модельне хезмәтләндерә ала.

Күп кенә модельләр рәсми Docker образлары яки Dockerfiles тәкъдим итә. Берничә модельне эшләтү өчен, NVIDIA Container Toolkit белән GPUга керү өчен үз Docker конфигурациясен төзи аласыз. Безнең API сервер архитектурасы референт гамәлгә ашыру булып хезмәт итә ала.

Кайбер модельләргә Python 3.10-3.12 кирәк. Coqui TTS (VITS) аеруча Python 3.11 кирәк. Кайбер модельләргә Python 3.12 киңәш ителә. Һәр модельнең requirements.txt файлын төгәл версиягә туры килү өчен тикшерегез.

Әйе. MIT һәм Apache 2.0 лицензияләре коммерцияле куллануга рөхсәт итә. Сез бу модельләрне кулланып SaaS продуктларын, мобиль кушымталарны, уеннарны һәм хезмәтләрне лицензияләү түләүләре, авторлык түләүләре, яки исем кушу таләпләресез төзи аласыз (исем кушу таләп ителгән булса да).
5.0/5 (1)

Бүген ачык чыганаклы TTS белән сынап карагыз

24+ ачык чыганак моделе, барысы да коммерцияле-лицензияләнгән. Безнең API яки үз-хост кулланыгыз - сайлау сезнең кулда.