Очиқ манбали матндан сўзга моделлар

Бизнинг платформамиздаги ҳар бир TTS модели очиқ манбали ва савдога мос лицензияларга эга. MIT, Apache 2.0 — ҳеч қандай мулкий чекловлар, фойдаланиш чекловлари, кутилмаган лицензиялаш тўловлари йўқ. Уларни бизнинг хостланган API орқали фойдаланинг ёки уларни ўзингизнинг инфратузилмангизда тўлиқ назорат билан ўзингиз хост қилинг.

Очиқ манба MIT лицензияси Apache 2.0 Ўз-ўзидан GitHub

Энди синаб кўриш

Kokoro, Piper, VITS, MeloTTS билан бепул
Сизнинг яратилган аудионгиз бу ерда пайдо бўлади
Юкланган
Юклаб олиш
TTS.ai'ни севасанми? Дўстларингга айт!

Очиқ манбали TTS афзалликлари

Нима учун очиқ манбали моделлар сизнинг лойиҳаларингиз учун муҳим?

Барча очиқ манба лицензияси

TTS.aiдаги ҳар бир модел очиқ манбали лицензияни қўллайди. Ҳеч қандай мулкий қора қутилар, ҳеч қандай сотувчининг блокировкаси, ҳеч қандай кутилмаган лицензиялаш тўловлари йўқ.

MIT / Apache 2.0

Моделлар MIT ёки Apache 2.0 лицензияси остида, энг кенг қўлланиладиган очиқ манбали лицензиялар остида. Тижорат мақсадларида фойдаланиш, ўзгартириш, қайта тарқатиш — чекловлар йўқ.

Ўз-ўзидан

Ҳар қандай моделни юклаб олиб, уни ўз жиҳозингизда ишга туширинг. Сизнинг маълумотларингиз, кутиш вақти ва инфратузилма устидан тўлиқ назоратни қўлга киритинг. Бутунлай булутга боғлиқлик йўқ.

GPU оптималлаштирилган

Моделлар CUDA қўллаб-қувватлаши билан NVIDIA GPU учун оптималлаштирилган. Piper фақат CPUда ишлайди. Кўплаб моделларга самарали хулоса чиқариш учун 2-8GB VRAM керак.

Жамият томонидан қўллаб-қувватланмоқда

Актив очиқ манбали жамоалар бу моделларни сақлаб қолади ва яхшилайди. Қўлловлар кутилмоқда — хатоларни, яхшиланишларни ва янги овозларни GitHub'га юборинг.

Тижорат мақсадларида қўллаш мумкин

Барча моделлар ўз лицензиялари асосида коммерциявий фойдаланишга рухсат беради. Продуктлар яратинг, хизматларни сотинг ва коммерциявий мазмун яратинг, ҳеч қандай авторлик ҳақи ёки фойдаланиш ҳақисиз.

Бизнинг очиқ манба модели каталогимиз

Ҳар бир модел, унинг лицензияси ва энг яхши ишлайдиган жойи

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Энг яхшиси: Apache 2.0 — энг яхши сифатли эркин модел, 82M параметрлар, ўз-ўзини бошқариш осон

Синаб кўриш Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Энг яхшиси: MIT — фақат CPU, edge қурилмалар ва embedded self-hosting учун идеал

Синаб кўриш Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Энг яхшиси: MIT — кўплаб қуйи моделлар томонидан қўлланиладиган асос архитектураси

Синаб кўриш VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Энг яхшиси: MIT — стандарт TTS дан ташқари ноёб аудио яратиш қобилияти

Синаб кўриш Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Товушни клонлаш

Энг яхшиси: Apache 2.0 — энг юқори сифатли, кенг ўрганилган манбаий амалга ошириш

Синаб кўриш Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Товушни клонлаш

Энг яхшиси: MIT — очиқ манбали овозни клонлаш ва гранул стилини бошқариш

Синаб кўриш OpenVoice

Очиқ манбали TTSни қандай ишлатиш керак

Бизнинг хостланган API'дан фойдаланинг ёки ўзингиз моделларни ишга туширинг

1

Очиқ манбали моделларни ўрганиш

Бизнинг 20+ очиқ манбали TTS моделлари каталогини кўринг. Ҳар бир модел саҳифаси лицензия, архитектура, имкониятлар ва ўз-ўзини хостинг талабларини кўрсатади.

2

Браузерда синаш

TTS.ai'да ҳеч нарса ўрнатмасдан ҳар қандай моделни тўғридан-тўғри синовдан ўтказинг. Бизнинг GPU серверларимиз ишлаш билан шуғулланади, шунинг учун сиз ўз-ўзини хостингга киришишдан олдин сифатни баҳолай оласиз.

3

Ўз-ўзини хост қилиш ёки API'ни қўллаш

GitHub'дан модел репозиториясини клонлаш ва маҳаллий равишда ишга тушириш ёки ишлаб чиқариш учун бизнинг хостланган API'ни қўллаш. Ўз-хостинг тўлиқ назоратни беради; бизнинг API бошқариладиган инфратузилмани таъминлайди.

4

Сўнгги дастурни яратиш

TTSни ўзингизга тегишли моделлар ёки бизнинг REST API ёрдамида маҳсулотингизга интеграция қилинг. Барча моделлар лицензиялаш ёки ҳақ тўлашсиз савдо учун фойдаланиш мумкин.

Лицензия қиёслаш

TTS.ai даги барча моделлар савдога мос очиқ манбали лицензиялардан фойдаланади

Модель Лицензия Тижорат мақсадларида фойдаланиш Таъмирлаш Ўз-ўзидан Атрибуция
Kokoro Apache 2.0 Кўрсатилган
Piper MIT Иловаий
VITS MIT Иловаий
MeloTTS MIT Иловаий
Chatterbox MIT Иловаий
Tortoise TTS Apache 2.0 Кўрсатилган
StyleTTS 2 MIT Иловаий
OpenVoice MIT Иловаий
Sesame CSM Apache 2.0 Кўрсатилган
Orpheus Llama 3.2 "Built with Llama"

Ўз-хизмат кўрсатувчи ва хизмат кўрсатувчи API

Модельларни ўзингиз ишга туширинг ёки бизга инфратузилмани бошқаришни қолдиринг

Сўзлашув қурилмангизда ўз-ўзини хост қилиш

TTS.ai даги ҳар бир модел GitHub ёки Hugging Face даги очиқ манбали лойиҳа сифатида мавжуд. Вазнларни юклаб олинг, боғлиқликларни ўрнатинг ва ўз GPU ларингизда индукцияни ишга туширинг. Сизнинг тўлиқ назоратингизда кечикиш, махфийлик ва масштаблаш бор.

  • Дастурий таъминотнинг тўлиқ махфийлиги - аудио ҳеч қачон серверингизни тарк этмайди
  • Бошланғич созлашдан кейин ҳар бир талаб учун харажатлар йўқ
  • Ўзингизнинг маълумотларингиз бўйича шахсий аниқлаш
  • GPU жиҳозлари талаб этилади (NVIDIA тавсия этилади)
  • Сиз янгиланишларни, ўлчамларни ва боғлиқликларни бошқарасиз

TTS.ai хостланган API'дан фойдаланиш

Биргина REST API орқали 20+ моделларга тезкор киришни олинг. Биз GPU таъминоти, модел янгиланиши, навбат бошқаруви ва масштаблашни бошқарамиз. Биргина API калити сизга ҳар бир моделга киришни беради — алоҳида ўрнатишларни бошқаришга эҳтиёж йўқ.

  • GPU жиҳозлари керак эмас
  • Барча 20+ моделлар бир API орқали
  • Автоматик модел янгиланиш ва яхшилаш
  • 99.9% иш вақти ва ортиқча инфратузилма
  • Фақат ўзингиз фойдаланадиган нарса учунгина тўлов тўлайсиз.

Тез бошланиш: API ёки Ўз-Хост

Бизнинг хостланган API'дан фойдаланинг ёки Kokoro'ни дақиқалар ичида локал ўрнатинг

1-вариант: TTS.ai хостланган API Энг осон
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
2-вариант: pip билан ўз-ўзини хост қилиш Тоза бошқарув
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

Очиқ манбали, арзон нархларда

Бизнинг хостланган API очиқ манбали TTS'ни GPU'ларни бошқармасдан фойдаланишга имкон беради.

Оқ ранг

$0

15 кредит

  • 4 та очиқ манбали моделлар бепул
  • Асосий фойдаланиш учун рўйхатдан ўтиш йўқ
  • Коммерциявий фойдаланишга рухсат берилган

Бошловчи

$9

500,000 аломат/ой

  • Барча 20+ очиқ манба модели
  • Овозни клонлаш
  • APIга кириш

Про

$29

2,000,000 белги/ой

  • GPU ишлашнинг устуворлиги
  • Ҳамма premium моделлар
  • Корхона қўллаб-қувватлаши
Барча нархларни кўриш

Кўп бериладиган саволлар

Матндан сўзга очиқ манба ҳақидаги кўп учрайдиган саволлар

Ҳа. TTS.ai'даги ҳар бир модел MIT ёки Apache 2.0 лицензияси билан очиқ манбали лицензиядан фойдаланади. Биз чекловчи лицензиялар билан моделларни (Coqui's CPML ёки нотижорат CC-BY-NC каби) алоҳида чиқариб ташлаймиз. Ҳар бир моделнинг лицензиясини унинг GitHub репозиториясида текшира оласиз.

Иккаласи ҳам тижорат мақсадларида фойдаланиш, ўзгартириш ва қайта тарқатишга рухсат берувчи очиқ манбали лицензиялардир. Apache 2.0 патент беришни очиқ-ойдин қўшиб қўяди ва кодни ўзгартирсангиз ўзгаришларни эълон қилишни талаб қилади. MIT камроқ талаблар билан соддароқ. Иккаласи ҳам бизнес учун қулай.

Ҳа. Ҳар бир модел ўзига хос хост бўлиши мумкин. GitHub'дан модел репозиториясини клонлаш, боғлиқликларни ўрнатиш, модел оғирликларини юклаб олиш ва хулоса чиқаришни амалга ошириш. Биз ҳар бир моделнинг ўзига хос хост талаблари учун ҳужжатларни тақдим этамиз, жумладан GPU, RAM ва Python версияси.

Модельга қараб талаблар ўзгаради. Piper учун GPU керак эмас (фақат CPU). Kokoro ва MeloTTS учун 1-2GB VRAM керак. Кўплаб стандарт моделлар учун 4GB VRAM керак. Tortoise ва Sesame CSM учун 8GB керак. NVIDIA RTX 3060 (12GB) кўплаб моделлар учун қулай ишлайди.

Ҳа. Очиқ манбали лицензиялар ўзгартиришларни, шу жумладан яхшилашни ҳам амалга оширишга имкон беради. GPT-SoVITS ва Bark каби моделлар яхшилаш скриптларини тақдим этади. Сиз ўзингизнинг овоз маълумотларингиз бўйича моделларни ўргатиб, ўзига хос овозларни яратишингиз ёки маълум тиллар учун иш самарадорлигини яхшилашингиз мумкин.

Кўплаб очиқ манбали моделлар (Kokoro, StyleTTS 2, Chatterbox) ҳозирда ElevenLabs ва Google TTS каби савдо хизматлари билан тенг ёки ундан устун сифат кўрсаткичларига эга. Савдо хизматларининг асосий афзаллиги бошқариладиган инфратузилма ва қўллаб-қувватлаш, аудио сифати эмас.

Биз уларни олдиндан чиқариб ташладик. XTTS/XTTS-v2 (Coqui's CPML — нотижорат), F5-TTS (CC-BY-NC — нотижорат), ва Higgs-v2 (Бозон Лицензияси — чекловчи) барчаси олиб ташланди. TTS.ai даги ҳар бир модел нотижорат фойдаланиш учун хавфсиз эканлиги текширилди.

Ҳа. Кўплаб моделлар жамоатчиликнинг GitHub орқали ҳиссасини қабул қилади. Сиз хатолар ҳақидаги ҳисоботларни, янги тиллар учун овоз ёзувлари, кодни яхшилаш ва ҳужжатларни юборишингиз мумкин. Ҳар бир моделнинг GitHub репозиториясини ҳисса қўшишга оид йўл-йўриқлар ва фаол муаммолар учун текширинг.

Модельларни талабга кўра юкланг ва GPU хотирасини бўлиш учун ишламаганда юкламани олиб ташланг. Бизнинг GPU серверимиз динамик юклаш ёрдамида 4x Tesla P40 (96GB умумий VRAM) устида 20+ моделларни ишга туширади. Ўз-ўзини хостинг учун, битта 24GB GPU бир вақтда 3-5 моделларга хизмат кўрсата олади.

Кўплаб моделлар расмий Docker тасвирлари ёки Dockerfiles'ни тақдим этади. Бир неча моделларни ишга тушириш учун, GPU'га кириш учун NVIDIA Container Toolkit' билан Docker'ни ўзингизга мослаштириб олишингиз мумкин. Бизнинг API сервер архитектурамиз мисол сифатида хизмат қилиши мумкин.

Кўплаб моделлар Python 3.10-3.12 талаб қилади. Coqui TTS (VITS) Python 3.11 талаб қилади. Биз кўплаб моделлар учун Python 3.12 ни тавсия қиламиз. Ҳар бир моделнинг requirements.txt файлини тўлиқ версия мувофиқлиги учун текширинг.

Ҳа. MIT ва Apache 2.0 лицензиялари очиқчасига савдо мақсадларида фойдаланишга рухсат беради. Сиз бу моделларни лицензиялаш тўловлари, ҳақ тўлаш ёки гувоҳнома талабларисиз (агар гувоҳнома талаб қилинса ҳам) SaaS маҳсулотлари, мобил дастурлар, ўйинлар ва хизматларни яратишингиз мумкин.
5.0/5 (1)

Биз нимани яхшилашимиз мумкин? Сизнинг фикрингиз бизга муаммоларни ҳал қилишга ёрдам беради.

Бугун очиқ манбали TTS'ни синаб кўринг

20+ очиқ манбали моделлар, барчаси савдо лицензияси билан. Бизнинг API ёки ўз-ўзини хост қилишни қўлланг - танлов сизда.