Слободна ВИ Текст у говор

82М параметри Ултра‐ брзина Експресивни гласови вишејезично Подршка за ток

Лагани модел 82М параметара испоручује говор квалитета студија са брзом закључком.

Брзина · 1.5GB VRAM Пробај.

Piper

Пријатно на ЦПУ Офлајн способан 100+гласова 35+ језика Подршка за ССМЛ

Брзи, локални неуронски текст за говорни систем оптимизован за малину и уграђене уређаје.

Брзина · 0 (CPU only) VRAM Пробај.

VITS

Синтеза краја до краја Природна прозодија Брзи закључци Вишеструки звучници

Условно варијациони аутокодер са супротним учењем за крај-то-крај текста-то-спеецх.

Брзина · 1GB VRAM Пробај.

MeloTTS

Оптимизован ЦПУ‐ ом вишејезично Вишеструки нагласци Производња спремна Ниска латенција

Високог квалитета многојезичног текста- у- говор који ради на ЦПУ са минималном латенцијом.

Брзина · 0.5GB (GPU optional) VRAM Пробај.

Bark

Звучни ефекти Смејање/уздишивање Генерација музике 100+ звучника вишејезично

Трансформаторски текстуални у аудио модел који генерише реалистичне говоре, музику и звучне ефекте.

споро · 5GB VRAM Пробај.

Bark Small

Лагано Брже од пуног Лајања Емоционални говор вишејезично

Лакша верзија Барка са бржим закључком и нижим коришћењем меморије.

средње · 2GB VRAM Пробај.

CosyVoice 2

Стрејање клонирање нултих метака укрштено-језично Контрола емоција Људски паритет

Алибаба је скелабле ТТС са људским паритет природно и скоро нула латенције.

Dia TTS

Мулти-звучник Стварање дијалога Природно преокретање Емоционални израз 1.6Б параметри

Модел генерације вишезвучног дијалога који ствара природне разговоре између звучника.

Parler TTS

Опис гласа Контрола природног језика Флексибилно креирање гласа Није потребна претподешавање гласова

Опишите глас који желите на природном језику, а Парлер генерише говор који одговара.

Indic Parler TTS

11 индијских језика Опис гласа Контрола природног језика Аутентичан индијски изговор

Високог квалитета говора за 8+ индијске језике са природним језиком контроле гласа.

споро · 8GB VRAM Пробај.

KhanomTan TTS

Тајландска ТТС Вишеструки звучници YourTTS architecture Комерцијално безбедно лиценца

Тајландски-први текст-на-спеецх са избором говорника гласови.

Брзина · 2GB VRAM Пробај.

IndexTTS-2

Контрола емоција Нула-пуцањ Емоционални вектори Експресивни говор Фино-зелена контрола

Нулти-погођен ТТС са фино-зрела контрола емоција и висока експресивност.

Spark TTS

Гласово клонирање Контрола емоција Управљање стилом Питање засновано на питању 5 секунди клонирање

Гласово клонирање ТТС са контролисаним емоцијама и говорећи стил преко упита.

GPT-SoVITS

5 секунди клонирање Певачки глас Неколикократко учење Висока верност укрштено-језично

Неколико гласова клонирање ТТС који репликује било који глас од само 5 секунди звука.

споро · 6GB VRAM Пробај.

Orpheus

Емоције људског нивоа 100К сати обуке Природни нагласак Експресивни говор

Емоционални ТТС модел људског нивоа трениран на 100К сати говора података.

Chatterbox

клонирање нултих метака Контрола емоција Висока верност Пренос стила Један узорак клонирања

Стејт-оф-тхе-модерни глас клонирање са емоционалном контролом из Ресембл АИ.

Tortoise TTS

највиши квалитет Вишегласни Архитектура ДАЛЛ‐ Е Гласово клонирање Аутоматски регресивни

Вишегласни текст-то-спеецх фокусиран на квалитет са ауто-регресивном архитектуром.

споро · 8GB VRAM Пробај.

StyleTTS 2

Људски ниво Дифузија стила Супротни тренинг Природна варијација Висока верност

Човечки ниво текста-на-спеецх кроз дифузију стила и супротне обуке.

OpenVoice

Инстант клонирање Претварање гласа Контрола емоција Контрола акцената вишејезично

Тренутно клонирање гласом са гранулар контроле над стилом, емоцијама, и нагласком.

Qwen3 TTS

9 предефинисаних гласова Дизајн гласа из текста Контрола емоција 10 језика

Алибабин вишејезички ТТС са предефинисаним гласовима и дизајном гласа из текста.

средње · 7GB VRAM Пробај.

VieNeu-TTS-v2

7 предефинисаних гласова (север + јужни нагласци) Пребацивање кода En-Vi Гласово клонирање (3-5s референца) Подршка за подемисију/ вишезвучник Само ЦПУ — није неопходан

Вијетнамски + енглески ТТС са 7 предефинисаних гласова и клонирањем гласа од нуле. Само ЦПУ, није неопходан ГПУ.

Брзина · CPU VRAM Пробај.

Sesame CSM

Разговорно Природни тајминг Окрећем Поб› јежни канал 1Б параметри

Разговорни модел говора ствара природни дијалог са одговарајућим тајмингом и емоцијама.

споро · 8GB VRAM Пробај.

Chatterbox Turbo

Под- 200мс латенција Паралингвистичке ознаке 6× у реалном времену Гласово клонирање Уређивање жига

Брже Цхаттербокс са под-200мс латенције и паралингуистичке ознаке за смех, кашаљ, и још.

Брзина · 2GB VRAM Пробај.

VoxCPM

44.1kHz аудио без токенизатора Укрштено-језично клонирање Контекст- свесни ЛоРА фино уклапање

ТТС без токенизатора производећи 44,1кХз аудио са конзистенцијом контекст-свесна пасуса.

Брзина · 4GB VRAM Пробај.

Kani TTS 2

3ГБ ВРАМ Ултра‐ брзина Лагано Нанокодек слободни

Ултра-лаки 400М енглески ТТС модел ради у само 3ГБ ВРАМ.

Брзина · 3GB VRAM Пробај.

OuteTTS

Закључак ЦПУ‐ а Закључак прегледача Вишеструке позадине профили звучника

ТТС на основу ЛЛМ‐ а који ради на ЦПУ‐ у, ГПУ‐ у или прегледачу преко lama.cpp и Transformers. js.

споро · 2GB VRAM Пробај.

VibeVoice

Мулти-звучник До 90 мин Стварање подемисије Конзистентност звучника 200м протока

Мајкрософтов модел за садржај дугог облика више говорника попут подемисија и аудио књига.

Брзина · 4GB VRAM Пробај.

Pocket TTS

100М параметри Закључак ЦПУ‐ а Гласово клонирање Клонирање једног узорка ивица спремна

Лагани модел параметара 100М од Киутаи са клонирањем гласа из једног узорка.

Брзина · 1GB VRAM Пробај.

Kitten TTS

Закључак само ЦПУ‐ а Испод 80МБ величине модела 8 уграђених гласова Управљање брзином Оннкс заснован 24кХЗ излаз

Ултра-лака ТТС испод 80МБ. Покреће се на ЦПУ без ГПУ.

Брзина · 0GB VRAM Пробај.

CosyVoice3

Двостримирање Контрола емоција Гласово клонирање Управљање брзином/ обимом Упутство које следи

Следећа генерација вишејезичне ТТС са двостримирањем, контролом емоција, и клонирањем гласа од нуле.

Брзина · 4GB VRAM Пробај.

NAMAA Saudi TTS

саудијски арапски дијалектName модерни стандардни арапски клонирање нула хитаца Контрола емоција Домаћи изговор

Прво отвори саудијско-арапски ТТС, домородни саудијски дијалект са клонирањем гласа.

средње · 6GB VRAM Пробај.

Darwin TTS

Гласово клонирање укрштено-језично ФФН- крвави 4 језика језика Qwen3 backbone

Унакрсно модална варијанта Qwen3-TTS са ФФН тежинама мешана из Qwen3-1,7B модела језика за оштројезично клонирање.

средње · 7GB VRAM Пробај.

MOSS-TTSD

Дијалог са више звучника До 5 звучника 60мин. кохерентни аудио Гласово клонирање Оптимизовано подемисије

Модел наставка вишезвучног дијалога — ствара разговоре у стилу подцаста са до 5 звучника и 60 минута кохерентног звука.

средње · 12GB VRAM Пробај.

Ming-Omni TTS

44.1kHz излаз Гласово клонирање Контрола емоција Управљање диалектима Генерација БГМ‐ а Компактно 0, 5Б

Компактан модел говора 0.5Б из укључењаAI са високом веродостојношћу 44.1kHz излаза и клонирањем нула гласова.

средње · 3GB VRAM Пробај.

MOSS-TTS Nano