Free AI Тексттен сүйлөөгө

82M параметрлери Өтө тез Экспрессивдүү үн Көп тилдүү Стриминг колдоосу

Lightweight 82M parameter model delivering studio-quality speech with blazingly fast inference.

Жаңы · 1.5GB VRAM Текшерүү

Piper

Процессорго ыңгайлуу Автономдуу 100+ үн 35+ тили SSML колдоосу

Жылдам, локалдык нейрондук текст-сөз системасы Raspberry Pi жана енүүчү түзүлүштөр үчүн оптимизацияланган.

Жаңы · 0 (CPU only) VRAM Текшерүү

VITS

Бирин-бири толуктаган синтез Табигый прозо Жылдам жыйынтыктоо Бир нече үн чыгаргычтар

Тексттен сүйлөмгө которуу үчүн шарттуу вариациялык автокодер, атаандаштык окутуу менен.

Жаңы · 1GB VRAM Текшерүү

MeloTTS

Процессор үчүн оптималдаштырылган Көп тилдүү Бир нече акцент Продукцияга даяр Кичинекей кечигүү

Жаңылыктарды жана жаңылыктарды жөнөтүү

Жаңы · 0.5GB (GPU optional) VRAM Текшерүү

Bark

_Ыраазычылык Көкүрөктө/Жүрөгүмдө Музыканы жаратуу 100+ үн чыгаруучу Көп тилдүү

Трансформерге негизделген текст-аудио модели, реалисттик сүйлөмдү, музыканы жана үн эффекттерин жаратат.

Баян · 5GB VRAM Текшерүү

Bark Small

Жашыл Толук коргошундан тез Эмоциялык сүйлөм Көп тилдүү

Барктын жеңилдетилген версиясы, тездетилген индукция жана аз эс колдонуу менен.

Медиа · 2GB VRAM Текшерүү

CosyVoice 2

Стриминг Zero-shot клондоо Көп тилдүү Эмоцияларды башкаруу Адам-паритети

Alibaba's scalable streaming TTS with human-parity naturalness and near zero latency.

Dia TTS

Бир нече үн чыгаргыч Диалогуларды түзүү Табигый айлануу Эмоция Параметрлер

Көп сүйлөгөндөрдүн диалогун жаратуучу модел, сүйлөгөндөрдүн ортосунда табигый сүйлөшүүлөрдү жаратат.

Parler TTS

Дауыс баяндамасы Табигый тил контроллери Ыңгайлуу үн түзүү Баштапкы орнотулган үн зарыл эмес

Сиз каалаган үндү табигый тилде жазыңыз, андан кийин Parler сизге ылайыктуу үндү жаратат.

Indic Parler TTS

Инди тили Сөздүк баяндамасы Табигый тил контроллери Аутентикалык индийче сүйлөм

8+ Индия тилдери үчүн сапаттуу сүйлөм, табигый тилди үн менен башкаруу.

Баян · 8GB VRAM Текшерүү

KhanomTan TTS

Тай TTS Бир нече үн чыгаргычтар YourTTS архитектурасы Коммерциялык лицензия

Тай-перви текст-в-слов с выбором говорящих голосов.

Жаңы · 2GB VRAM Текшерүү

IndexTTS-2

Эмоциялар Zero-shot Эмоция векторлору Экспрессивдүү сүйлөм Төмөнкү деңгээлдеги контроллер

Zero-shot TTS менен майда-чүйдөсүнө чейин эмоцияларды башкаруу жана жогорку эмоционалдуулугу.

Spark TTS

Сөздү клондоо Эмоцияларды башкаруу Стиль контроллери Сөзсүз 5 секунддук клондоо

Контролируемые эмоции и стиль речи с помощью подсказок.

GPT-SoVITS

5 секунддук клондоо Ырдоо Бир нече жолу окуу Жогору сапат Көп тилдеги

Бир нече секунда ичинде 5 секунддук аудиодон каалаган үндү клондоо үчүн TTS.

Баян · 6GB VRAM Текшерүү

Orpheus

Адам деңгээлиндеги эмоция 100K сааттык машыгуу Табигый басым Экспрессивдүү сүйлөм

100K сааттык сүйлөм маалыматтары боюнча даярдалган адамдын деңгээлиндеги эмоциялык TTS модели.

Chatterbox

Клондоо Эмоциялар Жогору сапат Стильдердин алмашуусу Бирдиктүү үлгүнү клондоо

Современный нулевой-шот голосовой клонирования с эмоцией контроля от Resemble AI.

Tortoise TTS

Эң жогорку сапат Бир нече үн DALL-E архитектурасы Сөздү клондоо Авторегрессивдүү

Авторегрессивдүү архитектурасы менен сапатка арналган тексттен сүйлөмгө которуу.

Баян · 8GB VRAM Текшерүү

StyleTTS 2

Адам деңгээли Диффузия стили Конкуренттик машыгуу Табигый өзгөрүү Жогору сапат

Адамдык деңгээлдеги текст-сөз стилинин диффузия жана атаандаштык машыгуу аркылуу.

OpenVoice

Клондоону тездетүү Сөздү которуу Эмоциялар Акцентти башкаруу Көп тилдүү

Стиль, эмоция жана акцентти көзөмөлдөө менен тездик менен үн клондоо.

Qwen3 TTS

9 алдын-ала орнотулган үн Тексттен үн дизайны Эмоциялар Тилдер

Alibaba's multilingual TTS with preset voices and voice design from text.

Медиа · 7GB VRAM Текшерүү

VieNeu-TTS-v2

7 алдын-ала орнотулган үн (Түштүк + Түштүк акценттери) En-Vi код алмашуу Сөздү клондоо (3-5с) Подкаст / бир нече үн чыгаруучуну колдоо CPU гана — GPU талап кылынбайт

Вьетнам + англис код-сменный TTS с 7 предустановленными голосами и нулевым клонированием голоса. Только процессор, нет графического процессора.

Жаңы · CPU VRAM Текшерүү

Sesame CSM

Конверсациялык Табигый убакыт Тапшырманы алуу Арткы канал Параметрлер

Конверсиялык сүйлөмдүн модели, табигый диалогду туура убакытта жана эмоция менен жаратат.

Баян · 8GB VRAM Текшерүү

Chatterbox Turbo

200 мсден аз кечиктирүү Паралингвистикалык тегдер 6x реалдуу убакытта Сөздү клондоо Водный знак

200 мске чейинки кечигүү жана күлкү, кашык жана башкалар үчүн паралингвистикалык тегдер менен тез Chatterbox.

Жаңы · 2GB VRAM Текшерүү

VoxCPM

Аудио Токенизаторсуз Тилдер аралык клондоо Контекстке жараша LoRA тунуктугу

Токенизаторсуз TTS 44.1kHz аудиону контекстке жараша абзацтын бирдейлиги менен чыгарат.

Жаңы · 4GB VRAM Текшерүү

Kani TTS 2

3 ГБ видео эс Өтө тез Жашыл Нанокодек Акысыз

400М англис TTS модели 3 ГБ VRAM менен иштейт.

Жаңы · 3GB VRAM Текшерүү

OuteTTS

Процессордук индукция Браузердин жыйынтыгы Бир нече backends Ойнотуучу профилдери

LLM-базасынын TTS, CPU, GPU же браузер аркылуу llama.cpp жана Transformers.js аркылуу иштей алат.

Баян · 2GB VRAM Текшерүү

VibeVoice

Бир нече сүйлөткүч 90 мүнөткө чейин Подкасттарды түзүү Сөйлөөчүнүн бирдейлиги 200 мс поток

Подкасттар жана аудиокитептер сыяктуу узак форматтагы көп сүйлөмдүү мазмун үчүн Microsoft модели.

Жаңы · 4GB VRAM Текшерүү

Pocket TTS

Параметрлер Процессордук индукция Сөздү клондоо Бирдиктүү үлгүнү клондоо Эгиндерине ылайыктуу

Кютай тарабынан жасалган 100М параметрлүү жеңил модель, бир эле үлгүдөн үн клондоо менен.

Жаңы · 1GB VRAM Текшерүү

Kitten TTS

CPU-only inferrence 80Мбдан кичине 8 ички үн Жылдамдыкты башкаруу ONNX негизделген 24 кГц чыгуу

80 МБдан аз көлөмдөгү өтө жеңил TTS. Графикалык процессорсуз процессор менен иштей алат.

Жаңы · 0GB VRAM Текшерүү

CosyVoice3

Эки поток Эмоциялар Сөздү клондоо Жылдамдык/аудио контроллери Инструкциядан кийин

Келишимдүү тилди, эки каналдуу, эмоцияларды башкаруу жана үн клондоону колдогон жаңы муундун көп тилдүү TTS.

Жаңы · 4GB VRAM Текшерүү

NAMAA Saudi TTS

Сауд Арабия диалекти Жаңы стандарттуу араб тили Сөздү клондоо Эмоциялар Атайын интонация

Сауд Арабиясынын биринчи ачык TTS. Сауд Арабиясынын өздүк диалектиси, Chatterbox сапатындагы үн клондоосу менен.

Медиа · 6GB VRAM Текшерүү

Darwin TTS

Сөздү клондоо Көп тилдеги FFN-бөлүштүрүү 4 негизги тил Qwen3 түпкү тутуму

Кросс-модалдык Qwen3-TTS варианты FFN салмагы менен Qwen3-1.7B тил моделинен аралаштырылган, көп тилдеги клондоону жакшыртуу үчүн.

Медиа · 7GB VRAM Текшерүү

MOSS-TTSD

Бир нече сүйлөткүчтүү диалог 5 үн чыгаргычка чейин 60мин кохеренттүүлүгү Сөздү клондоо Подкасттарды оптималдаштыруу

Мульти-сөйлөчү диалогдун улантуу модели — 5 сүйлөгөнгө чейинки подкаст-стилдеги сүйлөшүүлөрдү жана 60 мүнөттүк кохеренттүүлүктү түзөт.

Медиа · 12GB VRAM Текшерүү

Ming-Omni TTS

44.1кГц чыгуу Сөздү клондоо Эмоциялар Диалекттик башкаруу BGM генератору Компакт 0.5B

InclusionAI компаниясынын 0.5B омни-модалдык үн моделинин жогорку сапаттагы 44.1kHz чыгарылышы жана үн клондоосу жок.

Медиа · 3GB VRAM Текшерүү

MOSS-TTS Nano