Модели отвореног изворног текста за говор

Сваки ТТС модел на нашој платформи је отворен извор са комерцијално пријатним дозволама. МИТ, Апачи 2.0 — без власничког закључавања, без ограничења за коришћење, без изненађујуће дозволе. Користите их преко домаћинског АПИ, или самодомаћите их на сопственој инфраструктури са пуном контролом.

Отвори извор МИТ лиценца Апачи 2. 0 Само-гостољубиви ГитХуб

Пробај сада.

Слободно са Кокоро, Пајпер, ВИТС, МелоТТС
Овд› је ће се појавити ваш генерисани звук
генерисано
Преузми
Љубав ТТС.аи?

Предности отвореног извора ТТС‐ а

Зашто отворени модели значе за ваше пројекте

лиценца свих отворених извора

Сваки модел на TTS.ai користи дозволу отвореног извора.

МИТ / Апачи 2. 0

Моделима је дозволено МИТ или Апачу 2.0, најпопустљивијим лиценцама отвореног извора. Користите комерцијално, модификујте, прерасподелите — без ограничења.

Само-гостољубиви

Преузми било који модел и покрени га на свој хардвер. Потпуна контрола над подацима, латенцијама и инфраструктуром. Није потребна зависност од облака.

Оптимизован ГПУ

Модели су оптимизовани за НИВИДИА ГПУс са подршком КУДА‐ а. Пајпер ради само на ЦПУ‐ у. Већини модела је потребно 2- 8ГБ ВРАМ за ефикасан закључак.

Заједница одржана

Активне заједнице отвореног извора одржавају и побољшавају ове моделе. Доприносе добродошли — подносе грешке, побољшања и нове гласове на ГитХубу.

Комерцијална употреба у реду

Сви модели омогућавају комерцијалну употребу под њиховим дозволама. Изградите производе, продајте услуге и стварајте комерцијалне садржаје без овлашћења или накнада за коришћење.

Каталог отвореног модела

Сваки модел, његова дозвола, и оно што је најбоље

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Најбоље за: Апачи 2.0 — најквалитетнији бесквалитетни модел, 82М парамс, лак за самодобављање

Покушај Kokoro

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Најбоље за: МИТ — само ЦПУ, савршен за уређаје са ивицама и уграђене само домаћине

Покушај Piper

VITSVITS

Free

Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.

Fast 3/5

Најбоље за: МИТ — основна архитектура коју користе многи низводни модели

Покушај VITS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Најбоље за: МИТ — јединствене могућности за генерацију звука изван стандардног ТТС‐ а

Покушај Bark

Tortoise TTSTortoise TTS

Premium

Multi-voice text-to-speech focused on quality with autoregressive architecture.

Slow 5/5 Гласово клонирање

Најбоље за: Апачи 2. 0 — максимални квалитет, широко проучена референтна имплементација

Покушај Tortoise TTS

OpenVoiceOpenVoice

Premium

Instant voice cloning with granular control over style, emotion, and accent.

Medium 4/5 Гласово клонирање

Најбоље за: МИТ — клонирање гласом отвореног извора грануларним стилом

Покушај OpenVoice

Како користити ТТС отвореног извора

Користите домаћински АПИ или сами покрените моделе

1

Истражи моделе отвореног извора

Прегледајте наш каталог 20+ модела ТТС отвореног извора. Свака страница приказује лиценца, архитектуру, могућности и захтеве за самодомаћивање.

2

Покушај у прегледачу

Тестирајте било који модел директно на TTS.ai без инсталирања ничега. Наши ГПУ сервери обрађују тако да можете проценити квалитет пре него што се посветите самододавању.

3

Самоуправљање или коришћење нашег АПИ‐ а

Репос модела клонова из ГитХуба и ради локално, или користите наш домаћин АПИ за производњу. Само-вођење даје пуну контролу; наш АПИ обезбеђује управљену инфраструктуру.

4

Градите програм

Интегриши ТТС у свој производ користећи само-домаћине моделе или наш РЕСТ АПИ. Сви модели су комерцијално употребљиви без дозволе или дозволе.

Упоређивање лиценца

Сви модели на TTS.ai користе комерцијално пријатне лиценце отвореног извора

Модел Лиценца комерцијална употреба Изм› јена Самоуправљање Ауттрибуција
Kokoro Apache 2.0 неопходно
Piper MIT Опционо
VITS MIT Опционо
MeloTTS MIT Опционо
Chatterbox MIT Опционо
Tortoise TTS Apache 2.0 неопходно
StyleTTS 2 MIT Опционо
OpenVoice MIT Опционо
Sesame CSM Apache 2.0 неопходно
Orpheus Llama 3.2 "Built with Llama"

Самохостирање против домаћинског АПИ‐ а

Покрените моделе сами или нас пустите да водимо инфраструктуру.

Самоуправљање на хардверу

Сваки модел на TTS.ai доступан је као пројекат отвореног извора на ГитХубу или Хуггинг Фацу. Преузмите тежине, инсталирајте зависности и покрените закључке на сопственим ГПУ‐ има. Имате пуну контролу над латенцијом, приватношћу и скалирањем.

  • Пуна приватност података — звук никада не напушта сервер
  • Без трошкова по захт› јеву након почетног подешавања
  • Посебно фино уређивање на сопствене податке
  • Захт› ијева ГПУ хардвер (препоручена НВИДИА)
  • Управљате ажурирањем, скалирањем и зависностима

TTS.ai домаћински АПИ

Добијате тренутни приступ свим 20+ моделима кроз један РЕСТ АПИ. Сређујемо ГПУ обезбеђење, ажурирање модела, управљање редом и скалирање. Један АПИ кључ вам даје приступ сваком моделу — нема потребе да управљате одвојеним распоредом.

  • ГПУ хардвер није потребан
  • Сви 20+ модели кроз један API
  • Аутоматско ажурирање модела и побољшања
  • 99,9% радно време са сувишном инфраструктуром
  • Плати само за оно што користиш.

Брзи почетак: АПИ или самохост

Користите домаћински АПИ, или инсталирајте Кокоро локално у минутима

Опција 1: TTS.ai домаћински АПИ Најлакше
import requests

response = requests.post("https://api.tts.ai/v1/tts", json={
    "text": "Open source TTS with a simple API.",
    "model": "kokoro",
    "voice": "af_heart",
    "format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})

with open("output.wav", "wb") as f:
    f.write(response.content)
Опција 2: Само-Хост са пип Потпуна контрола
# Install Kokoro locally
pip install kokoro

# Generate speech on your own GPU
import kokoro

pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
    kokoro.save(audio, f"output_{i}.wav")

отворени извор, дозвољене цене

Наш домаћин АПИ чини отворени извор ТТС доступним без управљања ГПУ.

слободни ниво

$0

15 кредита за пријаву

  • 4 модела отвореног извора бесплатно
  • Нема пријаве за основну употребу
  • Дозвољено комерцијално коришћење

Покретач

$9

500.000 знакова месечно

  • Свих 20+ модела отвореног извора
  • Гласово клонирање
  • АПИ приступ

Проф.

$29

2,000.000 знакова месечно

  • Приоритетна процесија ГПУ‐ а
  • Сви премиум модели
  • Подршка за предузеће
Приказ Пуна цена

Често постављана питања

Уобичајена питања о тексту отвореног извора за говор

Да. Сваки модел на TTS.ai користи попустљиву лиценца отвореног извора — МИТ или Апач 2.0. Изузетно искључујемо моделе са рестриктивним дозволама (попут Кокијевог КПМЛ или некомерцијалног CC-BY-NC). Можете проверити лиценца сваког модела у свом ризници ГитХуб.

Оба дозвољена дозвола отвореног извора омогућавају комерцијалну употребу, модификацију и прерасподелу. Апачи 2. 0 додаје експлицитне дозволе за патенте и захтева измене ако измените код. МИТ је једноставнији са мање захтева. Оба су пословна пријатна.

Да. Сваки модел може бити самодостојан. Клонирајте ризницу модела из ГитХуба, инсталирајте зависности, преузимајте тежине модела и покрените закључке. Омогућавамо документацију за захтеве за самодомећање сваког модела, укључујући ГПУ, РАМ и ~@ ¦Питон¦Python¦ верзију.

Захтеви се разликују према моделу. Пајперу не треба само ГПУ (само ЦПУ). Кокоро и МелоТТС треба 1-2ГБ ВРАМ. Већини стандардних модела треба 4ГБ ВРАМ. Тортоизу и Сезаму ЦСМ треба 8ГБ. НВИДИА РТХ 3060 (12ГБ) може удобно покренути већину модела.

Да. Лиценца отвореног извора омогућава изм› јену укључујући фино уређивање. Модели попут GPT- SoVITS и Bark пружају фино уређивање скрипти. Модели можете тренирати на сопственим гласним подацима за стварање посебних гласова или побољшање перформанси за одређене језике.

Најбољи модели отвореног извора (Кокоро, СтилТТС 2, Чаттербокс) сада се поклапају или превазилазе комерцијалне услуге као што су 11 Лабс и Гугл ТТС у стандардима квалитета. Главна предност комерцијалних услуга је управљање инфраструктуром и подршком, а не аудио квалитетом.

Већ смо их искључили. ИксТТС/XTS- v2 (Кокијев КПМЛ — некомерцијално), Ф5- ТТС (ЦЦ- БИ- НЦ — некомерцијално), и Хиггс- v2 (Лиценца Босона — рестриктивно) су уклоњени. Сваки модел на TTS.ai је проверен комерцијално- коришћењен.

Да. Већина модела прихвата доприносе заједнице преко ГитХуба. Можете да поднесете извештаје о грешкама, говорне снимке за нове језике, побољшања кода и документацију. Проверите сваки модел ГитХуб ризницу за смернице доприноса и активна питања.

Учитавање модела на захт› ијев и истоваривање при неуспешном д› ијељењу ГПУ меморије. Наш ГПУ сервер покреће 20+ модела на 4x Tesla P40 (96GB укупно VRAM) помоћу динамичког учитавања. За самоуправљање, један 24GB ГПУ може истовремено послужити 3-5 модела.

Многи модели пружају званичне слике из Докера или Докер фајлове. За вишеструке моделе можете изградити посебну поставу Докера са ~@ ¦НВИДИА¦NVIDIA¦ контејнером за приступ ГПУ‐ а. Наша архитектура АПИ сервера може послужити као референтна имплементација.

Већина модела захт› ијева ~@ ¦Питон¦Python¦ 3.10-3.12. Коки ТТС (ВИТС) посебно захт› ијева ~@ ¦Питон¦Python¦ 3.11. За већину модела препоручујемо ~@ ¦Питон¦Python¦ 3.12. Проверите захтеве сваког модела.txt за тачну компатибилност верзија.

Да. Дозволе МИТ‐ а и Апача 2. 0 изричито омогућавају комерцијалну употребу. Можете изградити сааС производе, мобилне апликације, игре и сервисе користећи ове моделе без такси за лиценцање, овлашћења или захтева за приписивање (иако се цени приписивање).
5.0/5 (1)

Твоја повратна реакција нам помаже да решимо проблеме.

Данас покушај отвореног изворног ТТС‐ а

20+ модела отвореног извора, сви комерцијално лиценцани. Користите наш АПИ или само-домаћин — избор је ваш.