Ачык булактуу текстти сүйлөмгө которуу моделдери

Биздин платформадагы ар бир TTS модели коммерциялык жактан ыңгайлуу лицензиялар менен ачык булактуу. MIT, Apache 2.0 — эч кандай патенттик чектөөлөр жок, колдонууга чектөөлөр жок, эч кандай таң калыштуу лицензиялык төлөмдөр жок. Аларды биздин хосттолгон API аркылуу колдоно аласыз, же аларды толук контролдоо менен өзүңүздүн инфраструктураңызда өзүңүз хосттоңуз.

Ачык булак MIT лицензиясы Apache 2.0 Өзүн-өзү тейлөөчү GitHub

Азыр аракет кылыңыз

Кокоро, Пайпер, VITS, MeloTTS менен акысыз
Сиздин түзүлгөн аудио файлыңыз бул жерде пайда болот
Жаратылган
Жүктөө
TTS.ai сизге жактыбы? Досторуңузга айтып коюңуз!

Ачык булактуу TTS артыкчылыктары

Ачык булак моделдеринин долбоорлор үчүн мааниси

Бардыгы ачык булак лицензиясы менен

TTS.ai сайтынын ар бир модели ачык булактуу лицензияны колдонот. Эч кандай патенттик кара кутучалар жок, эч кандай сатуучулардын чектөөлөрү жок, эч кандай күтүлбөгөн лицензиялык төлөмдөр жок.

MIT / Apache 2.0

Моделдер MIT же Apache 2.0 лицензиялары менен чыгарылат, бул эң кеңири таралган ачык булак лицензиялары. Коммерциялык максатта колдонуу, өзгөртүү, кайра таратуу — чектөөлөр жок.

Өзүн-өзү тейлөөчү

Ар кандай модель жүктөп алып, аны өз аппаратураңызда иштетиңиз. Маалыматтарыңыз, кечигип келүү жана инфраструктураны толук көзөмөлдөө. Булутка көз карандылык жок.

GPU оптимизациясы

Модели оптимизированы для NVIDIA GPU с поддержкой CUDA. Piper работает только на CPU. Большинство моделей требуют 2-8 ГБ VRAM для эффективного вывода.

Коомчулук тарабынан каржыланган

Активдүү ачык булак коомчулугу бул моделдерди каржылайт жана өркүндөтөт. Колдонуучулардын салымы жакшы кабыл алынат — каталарды, өркүндөтүүлөрдү жана жаңы пикирлерди GitHubго жөнөтүңүз.

Коммерциялык колдонууга ылайыктуу

Бардык моделдер өз лицензиялары боюнча коммерциялык колдонууга уруксат берет. Продукттарды түзүү, кызматтарды сатуу жана коммерциялык мазмунду түзүү үчүн автордук төлөмдөр же колдонуу акылары жок.

Ачык булак моделдеринин каталогу

Ар бир модель, анын лицензиясы жана анын эң мыкты сапаттары

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Эң жакшысы: Apache 2.0 — эң мыкты сапаттагы акысыз модель, 82М параметрлер, оңой self-host

_Көрөлү Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Эң жакшысы: MIT — CPU-only, edge-приборлор жана embedded self-hosting үчүн идеалдуу

_Көрөлү Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Эң жакшысы: MIT — көпчүлүк төмөнкү моделдер тарабынан колдонулган фундаменталдык архитектура

_Көрөлү VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Эң жакшысы: MIT — стандарттуу TTSден тышкары уникалдуу аудио генерациялоо мүмкүнчүлүктөрү

_Көрөлү Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Сөздү клондоо

Эң жакшысы: Apache 2.0 — жогорку сапаттагы, кеңири изилденген референттик ишке ашыруу

_Көрөлү Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Сөздү клондоо

Эң жакшысы: MIT — ачык коддуу үн клондоо жана стилдик башкаруу

_Көрөлү OpenVoice

Ачык булактуу TTSти колдонуу

Биздин хосттолгон API'ни колдонуу же өзүңүздүн моделдерди иштетүү

1

Ачык булактуу моделдерди издөө

Биздин каталогдо 20дан ашык ачык булактуу TTS моделдери бар. Ар бир моделдин бетинде лицензия, архитектура, мүмкүнчүлүктөр жана өздүк хостинг талаптары көрсөтүлгөн.

2

Браузериңизде сынап көрүңүз

TTS.aiде каалаган моделди орнотпостон түз текшериңиз. Биздин GPU серверлери иштетүүнү аткарат, ошондуктан сиз сапатты баалоо үчүн өзүңүздү өзүңүзгө тапшыра аласыз.

3

Өзүңүз же биздин API колдоносуз

GitHub'дан модель репозиторийлерин клондоо жана локалдык түрдө иштетүү, же биздин хостингдеги API'ни колдонуу. Өз-өзүнчө хостинг толук контролду берет; биздин API башкарылган инфраструктураны камсыз кылат.

4

Сиздин тиркемеңизди түзүү

ТТСти продуктуңузга өз алдынча хосттолгон моделдер же REST API аркылуу интеграциялаңыз. Бардык моделдер коммерциялык максатта лицензиялык төлөмдөр же автордук төлөмдөрсүз колдонулат.

Лицензияны салыштыруу

TTS.ai моделдеринин бардыгы коммерциялык жактан пайдалуу ачык булак лицензияларын колдонот

Модель Лицензия Коммерциялык колдонуу Өзгөртүү Өз-өзүнчө хост Атрибуциялоо
Kokoro Apache 2.0 Зарыл
Piper MIT Болбосо
VITS MIT Болбосо
MeloTTS MIT Болбосо
Chatterbox MIT Болбосо
Tortoise TTS Apache 2.0 Зарыл
StyleTTS 2 MIT Болбосо
OpenVoice MIT Болбосо
Sesame CSM Apache 2.0 Зарыл
Orpheus Llama 3.2 "Built with Llama"

Өздүк хостинг жана хостинг API

Өзүңүз моделдерди иштетиңиз же инфраструктураны биз иштетебиз

Сиздин аппаратураңыздагы өздүк хост

TTS.ai'дагы ар бир модель GitHub же Hugging Face'тагы ачык булак долбоору катары жеткиликтүү. Жүктөөлөр, көз карандылыктарды орнотуу жана өз GPU'ңузда индукцияны жүргүзүү. Сиздин колуңузда кечиктирүүнүн, купуялуулуктун жана масштабдоонун толук контролу бар.

  • Маалыматтын толук купуялуулугу — аудио эч качан сервериңизди таштабайт
  • Баштапкы орнотуудан кийин ар бир суроо үчүн төлөм жок
  • Өзүңүздүн маалыматтарыңызды оңдоо
  • Графикалык процессор керек (NVIDIA сунушталат)
  • Жаңылоо, масштабдоо жана көз карандылыктарды башкаруу

TTS.ai хост API'син колдонуу

Бир гана REST API аркылуу бардык 20дан ашык моделдерге тез жеткилик алуу. Биз GPU провизиясын, моделдин жаңыртууларын, кезекти башкарууну жана масштабдоону аткарабыз. Бир гана API ачкычы ар бир моделге жеткилик берет — бөлөк жайгаштырууларды башкарууга зарылчылык жок.

  • GPU аппаратурасы керектелбейт
  • Бардык 20+ моделдер бир API аркылуу
  • Автоматтык жаңыртуу жана моделдин жакшыртуулары
  • 99,9% иштөө убактысы жана жетишсиз инфраструктура
  • Сиз колдонгон нерселер үчүн гана төлөңүз

Жылдам старт: API же өздүк хост

Биздин хосттогу API'ни колдонуп, же Kokoro'ну бир нече мүнөттүн ичинде орнотуңуз

1-вариант: TTS.ai хосттолгон API Эң оңой
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
2-вариант: pip менен өзүнчө хост Толук башкаруу
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Ачык булак, арзан баада

Биздин хосттогу API ачык булактуу TTSти GPU'ларды башкаруусуз жеткиликтүү кылат.

Акысыз катмар

$0

15 кредит

  • 4 акысыз ачык булактуу моделдер
  • Баздык колдонуу үчүн каттоо жок
  • Коммерциялык колдонууга уруксат берилген

Жүргүзгүч

$9

500,000 символ/ай

  • Бардык 20+ ачык булактуу моделдер
  • Сөздү клондоо
  • API кирүү

Про

$29

2,000,000 символ/ай

  • GPU иштетүү приоритети
  • Бардык премиум моделдер
  • Enterprise колдоосу
Толук баасын көрүү

Көп берилүүчү суроолор

Тексттен сүйлөмгө которуу боюнча кеңири тараган суроолор

Да. TTS.ai-де ар бир модель ачык булак лицензиясын колдонот — MIT же Apache 2.0. Биз чектөөчү лицензиялар менен моделдерди (мисалы, Coqui's CPML же коммерциялык эмес CC-BY-NC) өзгөчө алып салабыз. Ар бир моделдин лицензиясын анын GitHub репозиториясында текшере аласыз.

Эки лицензия да коммерциялык колдонууга, өзгөртүүгө жана кайра таратууга уруксат берет. Apache 2.0 патенттик уруксаттарды кошуп, кодду өзгөрткөндө өзгөртүүлөрдү билдирүүнү талап кылат. MIT жөнөкөй жана талап аз. Эки лицензия да бизнес үчүн ылайыктуу.

Да. Ар бир модель өзүнчө хосттоого мүмкүн. Модель репозиторийин GitHub'дан клондоо, көз карандылыктарды орнотуу, моделдин салмагын жүктөп алуу жана индукцияны жүргүзүү. Биз ар бир моделдин өзүнчө хосттоого болгон талаптары үчүн документацияны камсыз кылабыз, анын ичинде GPU, RAM жана Python версиясы.

Необходимые требования варьируются в зависимости от модели. Piper не требует графического процессора (только процессор). Kokoro и MeloTTS требуют 1-2 ГБ видеопамяти. Большинство стандартных моделей требуют 4 ГБ видеопамяти. Tortoise и Sesame CSM требуют 8 ГБ. NVIDIA RTX 3060 (12 ГБ) достаточно для большинства моделей.

Ооба. Ачык булактуу лицензиялар өзгөртүүлөрдү, анын ичинде жакшыртууларды киргизүүгө мүмкүндүк берет. GPT-SoVITS жана Bark сыяктуу моделдер жакшыртуу скрипттерин камтыйт. Өзүңүздүн үн маалыматтарыңызга негизделген моделдерди үйрөтүп, ыңгайлаштырылган үнүңүздү түзө аласыз же конкреттүү тилдер үчүн иштешин жакшырта аласыз.

Top open-source models (Kokoro, StyleTTS 2, Chatterbox) now match or surpass commercial services like ElevenLabs and Google TTS in quality benchmarks. Commercial services' main advantage is managed infrastructure and support, not audio quality.

Биз аларды жокко чыгардык. XTTS/XTTS-v2 (Coqui's CPML — коммерциялык эмес), F5-TTS (CC-BY-NC — коммерциялык эмес), жана Higgs-v2 (Бозон лицензиясы — чектөөлүү) бардык эле алынып салынды. TTS.ai-де ар бир модель коммерциялык колдонууга коопсуз экендиги текшерилген.

Да. Модельдордун көпчүлүгү коомчулуктун GitHub аркылуу салымын кабыл алат. Сиз ката жөнүндө отчетторду, жаңы тилдер үчүн үн жазмаларын, кодду жакшыртууларды жана документацияны жөнөтө аласыз. Ар бир моделдин GitHub репозиторийинде катышуу эрежелери жана активдүү көйгөйлөр бар.

Моделдерди талапка жараша жүктөп, иштебей турганда жүктөп, GPU эсин бөлүштүрүү. Биздин GPU сервери динамикалык жүктөө менен 20дан ашык моделди 4x Tesla P40 (бардыгы 96GB VRAM) иштетет. Жеке хостинг үчүн бир гана 24GB GPU бир учурда 3-5 моделди иштете алат.

Көпчүлүк моделдер расмий Docker сүрөттөрүн же Dockerfiles файлдарын сунуштайт. Бир нече моделдерди иштетүү үчүн, NVIDIA Container Toolkit менен GPUга кирүү үчүн жеке Docker орнотууларын түзө аласыз. Биздин API сервер архитектурасы референттик ишке ашыруу катары кызмат кылат.

Көпчүлүк моделдерге Python 3.10-3.12 керек. Coqui TTS (VITS) үчүн Python 3.11 керек. Биз көпчүлүк моделдер үчүн Python 3.12ди сунуштайбыз. Ар бир моделдин requirements.txt файлын текшерип, туура версиясын табыңыз.

Ооба. MIT жана Apache 2.0 лицензиялары коммерциялык колдонууга уруксат берет. Бул моделдерди колдонуп, SaaS продуктуларын, мобилдик тиркемелерди, оюндарды жана кызматтарды лицензиялык төлөмдөр, автордук төлөмдөр же атрибуциялоо талаптары жок түзө аласыз (атрибуциялоо абдан маанилүү).
5.0/5 (1)

Биз эмнени жакшыртсак болот? Сиздин пикириңиз бизге көйгөйлөрдү чечүүгө жардам берет.

Бүгүн ачык булактуу TTS менен аракет кылыңыз

20+ ачык булактуу моделдер, бардыгы коммерциялык лицензия менен. Биздин API же self-host колдонуп, сиз өзүңүз тандаңыз.