Модулі пераўтварэньня тэксту ў мову з адкрытым зыходным кодам
Усе мадэлі TTS на нашай платформе маюць адкрыты зыходны код з камэрцыйнымі ліцэнзіямі. MIT, Apache 2. 0 — без уласніцкіх абмежаванняў, без абмежаванняў выкарыстання, без сюрпрызных ліцэнзійных плацяжоў. Выкарыстоўвайце іх праз наш хоставаны API або самастойна ўсталюйце іх на вашай уласнай інфраструктуры з поўным кантролем.
Паспрабуйце зараз
Перавагі TTS з адкрытым кодам
Чаму мадэлі з адкрытым зыходным кодам важныя для вашых праектаў
Усе адкрытыя ліцэнзіі
Кожная мадэль на TTS.ai выкарыстоўвае дазволеную ліцэнзію адкрытага зыходнага коду. Няма ўласных чорных скрыняў, няма замыкання на вытворцы, няма нечаканых ліцэнзійных плат.
Apache 2. 0
Мадэлі ліцэнзаваныя па ліцэнзіях MIT або Apache 2. 0, самых дазволеных ліцэнзіях адкрытага коду. Выкарыстоўвайце ў камерцыйных мэтах, змяняйце, распаўсюджвайце — без абмежаванняў.
Самастойны
Спампаваць любую мадэль і запусціць яе на сваім апаратным забеспячэнні. Поўны кантроль над вашымі дадзенымі, латэнцыяй і інфраструктурай. Не патрабуецца залежнасць ад хмарачоса.
Аптымізавана для GPU
Мадэлі аптымалізаваныя для графічных працэсараў NVIDIA з падтрымкай CUDA. Piper працуе толькі на працэсарах. Большасць мадэляў патрабуюць 2- 8 ГБ VRAM для эфектыўнага вываду.
Падтрымка супольнасці
Актыўныя супольнасці з адкрытым зыходным кодам падтрымліваюць і ўдасканальваюць гэтыя мадэлі. Запрашаем да ўдзелу — паведамляйце пра памылкі, паляпшэнні і новыя галасы на GitHub.
Камерцыйнае выкарыстанне
Усе мадэлі дазваляюць камэрцыйнае выкарыстанне ў адпаведнасці з іх ліцэнзіямі. Збудоўвайце прадукты, прадайце паслугі і стварайце камерцыйны змест без роялці або платы за выкарыстанне.
Наш каталог мадэляў з адкрытым зыходным кодам
Кожная мадэль, яе ліцэнзія і тое, што яна робіць найлепш
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Лепшы для: Apache 2. 0 — найлепшая якасная свабодная мадэль, 82М параметраў, лёгкае самаабслугоўванне
Спроба Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Лепшы для: MIT — толькі CPU, ідэальна падыходзіць для краевых прылад і ўбудаванага самаабслугоўвання
Спроба Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Лепшы для: MIT — асноўная архітэктура, якая выкарыстоўваецца многімі мадэлямі
Спроба VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Лепшы для: MIT — унікальныя магчымасці генерацыі аўдыё за межамі стандартнага TTS
Спроба Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Лепшы для: Apache 2. 0 - максімальна якасная, шырока вывучаная рэалізацыя
Спроба Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Лепшы для: MIT — клянаваньне голасу з адкрытым зыходным кодам з дробным кіраваньнем стылямі
Спроба OpenVoiceЯк карыстацца адкрытым кодам TTS
Выкарыстоўвайце наш хоставаны API або запусьціце мадэлі самастойна
Дасьледаваньне мадэляў з адкрытым зыходным кодам
Праглядзіце наш каталог з больш чым 20 мадэлямі TTS з адкрытым зыходным кодам. Кожная старонка мадэлі паказвае ліцэнзію, архітэктуру, магчымасці і патрабаванні да самога хостынгу.
Паспрабуйце ў вашым браўзэры
Праверце любую мадэль прама на TTS.ai, не ўсталёўваючы нічога. Нашы серверы GPU займаюцца апрацоўкай, таму вы можаце ацаніць якасць перад тым, як прыступіць да самастойнага хостынгу.
Выкарыстоўвайце наш API
Клонаваць рэпазіторыі мадэляў з GitHub і запускаць лакальна, або выкарыстоўваць наш хоставаны API для вытворчасці. Само-хостынг дае поўны кантроль; наш API забяспечвае кіраваную інфраструктуру.
Збудаваць праграмуName
Убудоўвайце TTS у свой прадукт, выкарыстоўваючы мадэлі з уласным хостынгам або наш REST API. Усе мадэлі даступныя для выкарыстання ў камерцыйных мэтах без ліцэнзійных плацяжоў або роялці.
Параўнанне ліцэнзій
Усе мадэлі на TTS.ai выкарыстоўваюць камерцыйныя ліцэнзіі з адкрытым зыходным кодам
| Модуль | Ліцэнзія | Камерцыйнае выкарыстанне | Змяненне | Сам- вузел | Прызванне |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Неабходны | |||
| Piper | MIT | Неабавязковы | |||
| VITS | MIT | Неабавязковы | |||
| MeloTTS | MIT | Неабавязковы | |||
| Chatterbox | MIT | Неабавязковы | |||
| Tortoise TTS | Apache 2.0 | Неабходны | |||
| StyleTTS 2 | MIT | Неабавязковы | |||
| OpenVoice | MIT | Неабавязковы | |||
| Sesame CSM | Apache 2.0 | Неабходны | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Самастойны хостынг супраць хоставанага API
Выканаць мадэлі самастойна або дазволіць нам кіраваць інфраструктурай
Самастойны вузел на вашым абсталяванні
Кожная мадэль на TTS.ai даступная як праект з адкрытым зыходным кодам на GitHub або Hugging Face. Сцягніце вагу, усталюйце залежнасці і запусціце вывад на вашых уласных GPU. Вы маеце поўны кантроль над латэнцыяй, прыватнасцю і масштабаваннем.
- Поўная прыватнасьць дадзеных — гук ніколі не пакідае ваш сервер
- Няма выдаткаў на запыт пасля першапачатковага настаўлення
- Нестандартная дакладная наладка на вашых уласных дадзеных
- Неабходны графічны працэсар (рэкамендуецца NVIDIA)
- Вы кіруеце абнаўленнямі, масштабаваньнем і залежнасьцямі
Выкарыстоўваць хоставаны API TTS.ai
Атрымайце неадкладны доступ да ўсіх 24+ мадэляў праз адзін REST API. Мы займаемся прапарцыянаваннем GPU, абнаўленнямі мадэляў, кіраваннем чаргамі і масштабаваннем. Адзін ключ API дае вам доступ да кожнай мадэлі - няма неабходнасці кіраваць асобнымі разгортваннямі.
- Аперацыйная сістэма не патрабуецца
- Усе 24+ мадэлі праз адзін API
- Аўтаматычнае абнаўленне і паляпшэнне мадэляў
- 99. 9% час працы з рэзервовай інфраструктурай
- Плаціце толькі за тое, чым карыстаецеся
Хуткае запуску: API або Self- Host
Выкарыстоўвайце наш хоставаны API або ўсталюйце Kokoro лакальна за некалькі хвілін
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Адкрыты код, даступная цана
Нашы хоставаныя API робяць TTS з адкрытым зыходным кодам даступным без кіравання GPU.
Вольны пласт
$0
50 крэдытных пры рэгістрацыі
- 4 свабодныя мадэлі з адкрытым зыходным кодам
- Няма рэгістрацыі для простага выкарыстання
- Камерцыйнае выкарыстанне дазволена
Старт
$9
500 кредитов/ месяц
- Усе 24+ мадэлі з адкрытым кодам
- Клонаванне голасу
- Даступ да API
Прафесійны
$29
2000 кредитов/ месяц
- Прыярытэтная апрацоўка GPU
- Усе прэміум мадэлі
- Падтрымка кампаніі
Частыя пытанні
Частыя пытаньні пра адкрыты тэкставы працэсар
Паспрабуйце Open Source TTS сёньня
24+ мадэлі з адкрытым зыходным кодам, усе з камерцыйнай ліцэнзіяй. Выкарыстоўвайце наш API або самастойны хост - выбар за вамі.