Модели на отворен код за реч
Всеки модел на TTS на нашата платформа е отворен източник с търговски лицензи. MIT, Apache 2.0 – без собствено заключване, без ограничения за използване, без изненадващи лицензиране такси. Използвайте ги чрез нашия домакин API, или самостоятелно ги домакин на собствената си инфраструктура с пълен контрол.
Опитай сега.
Отворен код TTS ползи
Защо отворени модели има значение за вашите проекти
Всички лицензирани с отворен източник
Всеки модел на TTS.ai използва допустим лиценз за отворен източник. Без собствени черни кутии, без заключване на продавача, без неочаквани лицензии такси.
МИТ / Апачи 2.0
Моделите са лицензирани под MIT или Apache 2.0, най-попустимите лицензи за отворен източник. Използвайте търговско, модифициране, преразпределяне — без ограничения.
Самостабилност
Изтеглете всеки модел и го пуснете на собствен хардуер. Пълен контрол върху вашите данни, латенция и инфраструктура. Не се изисква зависимост от облак.
Оптимизиран GPU
Моделите са оптимизирани за NVIDIA GPUs с CUDA подкрепа. Piper работи само на CPU. Повечето модели се нуждаят от 2-8GB VRAM за ефективно изчисляване.
Поддържана общност
Активни общности с отворени източници поддържат и подобряват тези модели. Вносът е добре дошъл — представяне на грешки, подобрения и нови гласове на GitHub.
Търговска употреба е ОК.
Всички модели позволяват търговска употреба по техните лицензи. Изграждане на продукти, продаване на услуги и създаване на търговско съдържание без авторски права или такси за ползване.
Каталог на нашия Open Source Model
Всеки модел, лиценза и това, което прави най-добре
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Най-добро за: Apache 2.0 — най-добър безкачествеен модел, 82M парами, лесен за самоу домакин
Опитай. Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Най-добро за: MIT — само за процесор, перфектен за ръбови устройства и вграден самодомакин
Опитай. Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Най-добро за: MIT — основателна архитектура, използвана от много модели надолу по веригата
Опитай. VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Най-добро за: MIT — уникални възможности за аудио генериране извън стандартните TTS
Опитай. Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Най-добро за: Apache 2.0 — максимално качество, широко проучено референтно изпълнение
Опитай. Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Най-добро за: MIT — клониране на глас с гранулиран стил
Опитай. OpenVoiceКак да използвате отворен код TTS
Използвайте нашия домакин API или управлявайте модели сами
Разгледайте модели с отворен източник
Преглед на каталога ни от 20+ модели с отворен източник TTS. Всяка модел страница показва лиценза, архитектура, възможности и самостоятелни изисквания.
Опитайте в браузъра си
Тествайте всеки модел директно на TTS.ai без инсталиране на нищо. Нашите GPU сървъри се справят с обработката, така че можете да оцените качеството, преди да се ангажирате с самостоятелно домакинство.
Самостоятелност или използване на нашите API
Klone model repos от GitHub и да работи на местно място, или да използваме нашия домакин API за производство. Самоустройството дава пълен контрол; нашият API осигурява управлявана инфраструктура.
Изграждане на вашата програма
Интегрирайте TTS във Вашия продукт с помощта на самостоятелни модели или нашия REST API. Всички модели са търговски използвани без лицензиране такси или авторски права.
Сравнение на лицензите
Всички модели на TTS.ai използват търговски лицензи за отворен източник
| Модел | Лиценз | Търговско използване | Промяна | Самостоятелно обслужване | Присвояване |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Задължително | |||
| Piper | MIT | Задължително | |||
| VITS | MIT | Задължително | |||
| MeloTTS | MIT | Задължително | |||
| Chatterbox | MIT | Задължително | |||
| Tortoise TTS | Apache 2.0 | Задължително | |||
| StyleTTS 2 | MIT | Задължително | |||
| OpenVoice | MIT | Задължително | |||
| Sesame CSM | Apache 2.0 | Задължително | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Самопосещение срещу хостед API
Пуснете модели сами или ни оставите да се справим с инфраструктурата
Самоустройство на хардвъра си
Всеки модел на TTS.ai е на разположение като отворен източник проект на GitHub или Hugging Face. Изтеглете тежестите, инсталиране на зависимостита и изтичане на преценка на собствените си GPU. Имате пълен контрол върху латентност, поверителност и скалиране.
- Пълен поверителност на данните — звукът никога не напуска вашия сървър
- Без разходи по искане след първоначалната конфигурация
- Потребителско фино настройване на собствените си данни
- Изисква GPU хардуер (препоръчително NVIDIA)
- Вие управлявате актуализации, скалиране и зависимости
Използване TTS.ai Hosted API
Осигурете незабавен достъп до всички 20+ модели чрез един REST API. Ние се справяме с GPU предоставяне, обновяване на модела, управление на редица и скалиране. Един API ключ ви дава достъп до всеки модел - няма нужда да управлявате отделни разгръщания.
- Няма нужда от GPU хардуер
- Всички 20+ модели чрез един API
- Автоматични актуализации и подобрения на модела
- 99,9% преустановяване с излишна инфраструктура
- Плащай само за това, което използваш.
Бързо стартиране: API или самоустройство
Използвайте нашия домакин API, или инсталирайте Kokoro локално в минути
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Отворен източник, достъпно ценообразуване
Нашият домакин API прави отворен източник TTS достъпен без управление на GPUs.
Свободен ред
$0
15 000 символа на регистрацията
- 4 отворени модели безплатно
- Няма регистрация за основна употреба
- Дозволено търговско използване
Стартиране
$9
500 кредита/месечни кредити
- Всички 20+ модели с отворен източник
- Гласово клониране
- API достъп
Професионален
$29
2 000 000 символа на месец
- Приоритетна обработка на GPU
- Всички премиумни модели
- Подпомагане на предприятията
Често задавани въпроси
Общи въпроси за текст от отворен източник към реч
Какво можем да подобрим? Твоята обратна връзка ни помага да решим проблемите.
Опитайте Open Source TTS днес
20+ отворени модели, всички търговски лицензирани. Използвайте нашия API или самостоятелен домакин – изборът е ваш.