Слободна ВИ Текст у говор
33+ модели отвореног извора, 273+ Гласови, 33+ Језици. Нема потребе за налогом.
Све што вам је потребно за Глас АИ
30+ алатки које покрећу отворени модели АИ‐ а
33+ АИ Гласовни модели
Најопширнија збирка отворених ТТС модела у једној платформи
Kokoro слободни
Кокоро је 82 милиона параметара за текст у говор који удара много изнад класе тежине. Упркос малим величинама, производи изузетно природни и изразиви говор. Кокоро подржава више језика, укључујући енглески, јапански, кинески и корејски, различитим изразивим гласовима. Ради невероватно брзо — генерише аудио скоро 100 икс брже од реалног времена на ГПУ.
Најбоље за: Висок квалитет ТТС са минималном латенцијом, преносом програма
Покушај слободно
Piper слободни
Пајпер је лака текстуална у пеец мотор развијен од стране Рхаспија који користи ВИТС и архитектуру грла. Чини га идеалним за ивице уређаје, домаћу аутоматизацију и програме који захтевају офлајн ТТС. Са преко 100 гласова преко 30+ језика, Пајпер пружа природни говор при реалном временским брзинама чак и на Распбери Пи 4.
Најбоље за: Брзи прегледи, приступачност и уграђени програми
Покушај слободно
VITS слободни
ВИТС (Вериционални закључак са супротним учењем за крајње до крајњег текстуалног говора) је паралелан метод од крајњег до крајњег ТТС‐ а који генерише више природног звука него тренутни двофазови модели. Прихвата варијациони закључак повећан нормализујућим токовима и процесом обратног обуке, што постиже значајно побољшање природности.
Најбоље за: Опште намештање текстуалног говора са природном прозодијом
Покушај слободно
MeloTTS слободни
МелоТТС од MyShell.ai је многојезична TTS библиотека која подржава енглески (амерички, британски, индијски, аустралијски), шпански, француски, кинески, јапански и корејски. Изузетно је брз, обрађује текст само на ЦПУ‐ у у ускоро. МелоТТС је дизајниран за коришћење производње и подржава и ЦПУ закључак.
Најбоље за: Производни програми којима је потребна брза, јазична ТТС
Покушај слободно
Kani TTS 2 слободни
Кани- ТТС-2 од NineNineSix је ултра лак 400М параметарски модел изграђен на течној кичми АИ ЛФМ2 са НВИДИЈОМ Нанокодеком. Ради само у 3GB ВРАМ‐ у и за ~2 секунде говора на ~2 на ~2 секунди на А100 (РТФ 0. 2). Тренутни јавни издање броди контролну тачку енглеског „ КАНИ‐ ТТС‐ а-2- ен “ и не разоткрива удицу која је потребна за клонирање гласа — користите Чатербокс / ИндексТТTS2 / F5- ТТС за клонирање, или Кокоро / МелоТТС за неенглески.
Најбоље за: Брза генерација енглеског на хардверу ниско- ВРАМ‐ а, брзи прегледи
Покушај слободно
OuteTTS слободни
ОутеТТС проширује велике језичке моделе са могућностима за текст- у- говор при одржавању оригиналне архитектуре. Подржава више позадина, укључујући и lama.cpp (CPU/ GPU), Хуглинг Фаце Transformers, ExLlamaV2, VLLM, па чак и закључак прегледача преко Transformers.js. Могућности нултог клонирања гласом кроз профиле звучника сачуване као ЈСОН.
Најбоље за: Распоред ивице, ТТС на основу прегледача, окружења ниског извора
Покушај слободно
Pocket TTS слободни
Покет ТТС од Кјутаја (креатора Мошија) је компактан модел 100М параметара текст- у- говор који удара много изнад своје тежине. Ефективно ради на ЦПУ‐ у, подржава клонирање гласа из једнег аудио узорка и производи природни говор. Мала величина модела чини га идеалним за постављање ивице и окружења ниског ресурса.
Најбоље за: Лагано распоредавање, окружења само за ЦПУ, брзо клонирање гласом
Покушај слободно
Kitten TTS слободни
Кеттен ТТС од КиттенML‐ а је ултра- лаки модел текста изграђен на ОННX‐ у. Са варијантама од 15М до 80М параметра (25- 80 МБ на диску), доставља висококвалитетну синтезу гласа на ЦПУ‐ у без потребе за ГПУ- ом. Могућности 8 уграђених гласова, подесљива брзина говора и уграђена текстуална препреработка за бројеве, валуте и јединице. Идеална за распоредање ивица и ниске касније програма.
Најбоље за: Брзи лагани ТТС, распоред ивица, ниске касније програме
Покушај слободно
Ming-Omni TTS слободни
Ming-omni- tts-0,5B по укључивањуAI је компактан свемодални модел говора изграђен на густој кичми БајлингММ‐ а, са уграђеном емоцијом / дијалектом / БГМ контролом кроз упутства ЈСОН‐ а. Изврсна стабилност — 0,83% ВЕР на кинеским референцама.
Најбоље за: Висока верност двојазичне нарације, емоционално контролисан глас глума, кинески аудиокњига садржај
Покушај слободно
MOSS-TTS Nano слободни
МОСС- ТТС- Нано- 100М је компактна варијанта ~80x мањих тежина и драматично мања по захтеву ~80x по ВРАМ‐ у, што је пригодно за слободније и високопреносне распореде.
Најбоље за: Слободна ТТС, производња високог обима, интерактивна употреба ниске касноће
Покушај слободно
Bark стандардни
Трансформаторски текстуални у аудио модел који генерише реалистичне говоре, музику и звучне ефекте.
Програмер: Suno · Лиценца: MIT
Пробај.
Bark Small стандардни
Лакша верзија Барка са бржим закључком и нижим коришћењем меморије.
Програмер: Suno · Лиценца: MIT
Пробај.
CosyVoice 2 стандардни
Алибаба је скелабле ТТС са људским паритет природно и скоро нула латенције.
Програмер: Alibaba (Tongyi Lab) · Лиценца: Apache 2.0
Пробај.
Dia TTS стандардни
Модел генерације вишезвучног дијалога који ствара природне разговоре између звучника.
Програмер: Nari Labs · Лиценца: Apache 2.0
Пробај.
Parler TTS стандардни
Опишите глас који желите на природном језику, а Парлер генерише говор који одговара.
Програмер: Hugging Face · Лиценца: Apache 2.0
Пробај.
IndexTTS-2 стандардни
Нулти-погођен ТТС са фино-зрела контрола емоција и висока експресивност.
Програмер: Index Team · Лиценца: Bilibili Model License
Пробај.
Spark TTS стандардни
Гласово клонирање ТТС са контролисаним емоцијама и говорећи стил преко упита.
Програмер: SparkAudio · Лиценца: CC BY-NC-SA 4.0
Пробај.
GPT-SoVITS стандардни
Неколико гласова клонирање ТТС који репликује било који глас од само 5 секунди звука.
Програмер: RVC-Boss · Лиценца: MIT
Пробај.
Orpheus стандардни
Емоционални ТТС модел људског нивоа трениран на 100К сати говора података.
Програмер: Canopy Labs · Лиценца: Llama 3.2 Community
Пробај.
Qwen3 TTS стандардни
Алибабин вишејезички ТТС са предефинисаним гласовима и дизајном гласа из текста.
Програмер: Alibaba (Qwen) · Лиценца: Apache 2.0
Пробај.
VieNeu-TTS-v2 стандардни
Вијетнамски + енглески ТТС са 7 предефинисаних гласова и клонирањем гласа од нуле. Само ЦПУ, није неопходан ГПУ.
Програмер: Phạm Nguyễn Ngọc Bảo · Лиценца: Apache 2.0
Пробај.
Chatterbox Turbo стандардни
Брже Цхаттербокс са под-200мс латенције и паралингуистичке ознаке за смех, кашаљ, и још.
Програмер: Resemble AI · Лиценца: MIT
Пробај.
VoxCPM стандардни
ТТС без токенизатора производећи 44,1кХз аудио са конзистенцијом контекст-свесна пасуса.
Програмер: OpenBMB · Лиценца: Apache 2.0
Пробај.
VibeVoice стандардни
Мајкрософтов модел за садржај дугог облика више говорника попут подемисија и аудио књига.
Програмер: Microsoft · Лиценца: MIT
Пробај.
CosyVoice3 стандардни
Следећа генерација вишејезичне ТТС са двостримирањем, контролом емоција, и клонирањем гласа од нуле.
Програмер: Alibaba (FunAudioLLM) · Лиценца: Apache 2.0
Пробај.
NAMAA Saudi TTS стандардни
Прво отвори саудијско-арапски ТТС, домородни саудијски дијалект са клонирањем гласа.
Програмер: NAMAA Space · Лиценца: MIT
Пробај.
Darwin TTS стандардни
Унакрсно модална варијанта Qwen3-TTS са ФФН тежинама мешана из Qwen3-1,7B модела језика за оштројезично клонирање.
Програмер: FINAL-Bench · Лиценца: Apache 2.0
Пробај.
MOSS-TTSD стандардни
Модел наставка вишезвучног дијалога — ствара разговоре у стилу подцаста са до 5 звучника и 60 минута кохерентног звука.
Програмер: OpenMOSS · Лиценца: Apache 2.0
Пробај.
CosyVoice 2
Алибаба је скелабле ТТС са људским паритет природно и скоро нула латенције.
Језици: en, zh, ja, ko, fr, de, it, es
Клонирање гласа
IndexTTS-2
Нулти-погођен ТТС са фино-зрела контрола емоција и висока експресивност.
Језици: en, zh
Клонирање гласа
Spark TTS
Гласово клонирање ТТС са контролисаним емоцијама и говорећи стил преко упита.
Језици: en, zh
Клонирање гласа
GPT-SoVITS
Неколико гласова клонирање ТТС који репликује било који глас од само 5 секунди звука.
Језици: en, zh, ja, ko
Клонирање гласа
Chatterbox
Стејт-оф-тхе-модерни глас клонирање са емоционалном контролом из Ресембл АИ.
Језици: en
Клонирање гласа
Tortoise TTS
Вишегласни текст-то-спеецх фокусиран на квалитет са ауто-регресивном архитектуром.
Језици: en
Клонирање гласа
OpenVoice
Тренутно клонирање гласом са гранулар контроле над стилом, емоцијама, и нагласком.
Језици: en, zh, ja, ko, fr, es
Клонирање гласа
VieNeu-TTS-v2
Вијетнамски + енглески ТТС са 7 предефинисаних гласова и клонирањем гласа од нуле. Само ЦПУ, није неопходан ГПУ.
Језици: vi, en
Клонирање гласа
Chatterbox Turbo
Брже Цхаттербокс са под-200мс латенције и паралингуистичке ознаке за смех, кашаљ, и још.
Језици: en
Клонирање гласа
VoxCPM
ТТС без токенизатора производећи 44,1кХз аудио са конзистенцијом контекст-свесна пасуса.
Језици: en, zh
Клонирање гласа
OuteTTS
ТТС на основу ЛЛМ‐ а који ради на ЦПУ‐ у, ГПУ‐ у или прегледачу преко lama.cpp и Transformers. js.
Језици: en
Клонирање гласа
Pocket TTS
Лагани модел параметара 100М од Киутаи са клонирањем гласа из једног узорка.
Језици: en, fr
Клонирање гласа
CosyVoice3
Следећа генерација вишејезичне ТТС са двостримирањем, контролом емоција, и клонирањем гласа од нуле.
Језици: en, zh, ja, ko, de, es, fr, it, ru
Клонирање гласа
NAMAA Saudi TTS
Прво отвори саудијско-арапски ТТС, домородни саудијски дијалект са клонирањем гласа.
Језици: ar
Клонирање гласа
Darwin TTS
Унакрсно модална варијанта Qwen3-TTS са ФФН тежинама мешана из Qwen3-1,7B модела језика за оштројезично клонирање.
Језици: en, ko, ja, zh
Клонирање гласа
MOSS-TTSD
Модел наставка вишезвучног дијалога — ствара разговоре у стилу подцаста са до 5 звучника и 60 минута кохерентног звука.
Језици: en, zh
Клонирање гласа
Ming-Omni TTS
Компактан модел говора 0.5Б из укључењаAI са високом веродостојношћу 44.1kHz излаза и клонирањем нула гласова.
Језици: en, zh
Клонирање гласа
MOSS-TTS Nano
Сићушна варијанта 100М МОСС-ТТС - иста архитектура, 80х мања, слободна латенција.
Језици: en, zh, de, es, fr, ja, it, ko, ru, ar, pt
Клонирање гласапрограмер‐ први АПИ‐ програмер
АПИ сагласан са OpenAI‐ ом. Један крајњи крај, 22+ модела. Стремим подршку за програме у реалном времену.
- Формат сагласан са OpenAI‐ ом
- Стремирање ТТС‐ а за програме у реалном времену
- Пакетна обрада за велике послове
- Обав› јештења о ~@ ¦Вебхуку¦Webhooku¦
pip install ttsai
npm install @ttsainpm/ttsai
from tts_ai import TTSClient
client = TTSClient(api_key="sk-tts-xxx")
audio = client.generate(
text="Hello from TTS.ai!",
model="kokoro",
voice="af_bella",
)
client.save(audio, "output.mp3")
једноставна, провидна цена
Почните слободни, скалирајте док растете.
слободни
15.000 знакова + 5000/дан
- 7 бесплатних модела, укључујући Кокоро
- 5.000 знакова по генерацији
- АПИ приступ укључен
Покретач
500 кредита месечно
- Сви 22+ модели
- 100.000 знакова по генерацији
- Гласово клонирање
Проф.
2.000 кредита месечно
- Све у Стартеру
- АПИ приступ
- Приоритетна обрада
Често постављана питања
Твоја повратна реакција нам помаже да решимо проблеме.
Почни да користиш ВИ глас данас
Придружите се ствараоцима, програмерима и пословима користећи TTS.ai