Модели на отворен изворен текст за говор
Секој TTS модел на нашата платформа е отворен извор со комерцијално пријатни лиценца. MIT, Apache 2.0 — без сопственички ограничувања, без изненадувачки дозволи.
Обиди се сега
Користи од отворениот извор на TTS
Зошто отворените модели се важни за вашите проекти
Лицензација на сите отворени извори
Секој модел на TTS.ai користи попустлива лиценца со отворен извор.
МИТ / Апачи 2.0
Моделите се лиценцани под МИТ или Апачи 2.0, најпопустливите лиценца со отворен извор.
Самопожелно
Симни било кој модел и пушти го на свој хардвер. Целосна контрола над вашите податоци, латенција и инфраструктура. Не е потребна зависност од облак.
Оптимизиран GPU
Моделите се оптимизирани за NVIDIA GPUs со поддршка на CCUDA. Piper работи само на процесор. Повеќето модели имаат потреба од 2-8GB VRAM за ефикасно заклучување.
Заедницата е задржана
Активните заедници со отворен извор ги одржуваат и подобруваат овие модели. Прилозите добредојдени — поднесуваат бубачки, подобрувања и нови гласови на GitHub.
Комерцијална употреба е во ред
Сите модели дозволуваат комерцијална употреба под нивните дозволи. Изградба на производи, продажба на услуги и создавање на комерцијална содржина без трошоци или трошоци за користење.
Каталогот на нашиот отворен модел
Секој модел, неговата дозвола, и она што го прави најдобро
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Најдобро за: Апачи 2.0 — најдобар безквалитетен модел, 82М парами, лесен за самодомаќин
Обиди се Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Најдобро за: MIT — само за процесор, совршен за работни уреди и вграден само-домаќин
Обиди се Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Најдобро за: МИТ — основната архитектура што ја користеле многу модели низводно
Обиди се VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Најдобро за: MIT — единствени можности за генерација на звук над стандардните TTS
Обиди се Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Најдобро за: Апачи 2.0 — максимален квалитет, широко испитана референтна имплементација
Обиди се Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Најдобро за: MIT — клонирање на гласот со гранулиран стил
Обиди се OpenVoiceКако да се користи ТТС со отворен извор
Користете го нашиот домаќин на API или самиот извршете модели
Разгледај ги моделите со отворен извор
Прегледајте го нашиот каталог на 20+ отворени модели на TTS. Секоја модел страница ги прикажува условите на лиценцата, архитектурата, способностите и самодомаќинските барања.
Пробај во твојот прелистувач
Тестирај го секој модел директно на TTS.ai без инсталирање на ништо. Нашите GPU сервери раководат со обработката за да можете да го процените квалитетот пред да се посветите на самодомаќинство.
Самостојност или користење на нашиот API
Репозицијата на моделот на клонови од GitHub и трчање локално, или користење на нашиот домаќин на API за производство.
Изградете ја вашата апликација
Интегрирајте го ТТС во вашиот производ користејќи самостојни модели или нашиот REST API. Сите модели се комерцијално употребливи без лиценца или хонорари.
Споредување на лиценцата
Сите модели на TTS.ai користат комерцијално пријатни лиценца со отворен извор
| Модел | Лиценца | Комерцијална употреба | Измена | Самостојност | Атрибуција |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Неопходно | |||
| Piper | MIT | Опционо | |||
| VITS | MIT | Опционо | |||
| MeloTTS | MIT | Опционо | |||
| Chatterbox | MIT | Опционо | |||
| Tortoise TTS | Apache 2.0 | Неопходно | |||
| StyleTTS 2 | MIT | Опционо | |||
| OpenVoice | MIT | Опционо | |||
| Sesame CSM | Apache 2.0 | Неопходно | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Самостојна против домаќинската API
Изврши го моделот самиот или дозволи ни да се справиме со инфраструктурата.
Самостојност на хардверот
Секој модел на TTS.ai е достапен како отворен проект за GitHub или Hugging Face. Превземете ги теговите, инсталирајте ги зависностите и извршувајте заклучоци на сопствените GPU. Имате целосна контрола над латенцијата, приватноста и скалирањето.
- Целосна приватност на податоците — звукот никогаш не го напушта серверот
- Без трошоци по барање по иницијалното поставување
- Сопствено нагласување на Вашите податоци
- Бара GPU хардвер (препорачана NVIDIA)
- Менаџирате ажурирања, скалирање и зависности
Користи TTS.ai компјутерски API
Добивате моментален пристап до сите 20+ модели преку еден REST API. Ние се справиме со GPU обезбедувањето, ажурирањето на моделот, менаџментот на редица и скалирањето. Еден API клуч ви дава пристап до секој модел — нема потреба да управувате со одделни распоредувања.
- Не е потребен GPU хардвер
- Сите 20+ модели преку еден API
- Автоматски ажурирања и подобрувања на моделот
- 99,9 отсто повеќе време со излишна инфраструктура
- Плати само за тоа што го користиш.
Брз почеток: API или самостојност
Користете го нашиот домаќин на API, или инсталирајте го Kokoro локално во минути
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Отворен извор, достоен за цени
Нашиот домаќин на АПИ го прави отворениот извор на ТТС пристапен без управување со ГПУ.
Слободен ред
$0
15 кредити за пријавување
- 4 слободни модели со отворен извор
- Нема пријава за основна употреба
- Дозволена комерцијална употреба
Стартер
$9
500.000 знаци месечно
- Сите 20+ модели со отворен извор
- Гласовно клонирање
- API пристап
Проф.
$29
2. 000. 000 знаци на месец
- Приоритетна обработка на GPU
- Сите премиум модели
- Поддршка за претпријатието
Често поставувани прашања
Вообичаени прашања во врска со текстот од отворен извор за говор
Твоите повратни информации ни помагаат да ги решиме проблемите.
Обиди се со отворен код TTS денес
20+ модели со отворен извор, сите комерцијално лицензирани. Користете го нашиот API или само-домаќин — изборот е ваш.