Очиқ AI Матндан сўзга

82M параметрлар Жуда тез Экспрессив овозлар Кўп тилли Трансляцияни қўллаб-қувватлаш

Оғирлиги 82М бўлган параметр модели студия сифатли сўзлашувни тезкор индукция билан таъминлайди.

Тезкор · 1.5GB VRAM Синаб кўриш

Piper

CPU-friendly Офлайнга қодир 100+ овозлар 35+ тиллар SSML қўллаб-қувватлаши

Raspberry Pi ва ёпиқ қурилмалар учун оптималлаштирилган тезкор, маҳаллий нейрон матн-сўз тизими.

Тезкор · 0 (CPU only) VRAM Синаб кўриш

VITS

Ўнгдан чапга синтез Табиий усул Тез хулоса Бир неча овоз берувчилар

Матндан сўзга ўтиш учун рақобатли ўқув билан шартли ўзгарувчан автокодловчи.

Тезкор · 1GB VRAM Синаб кўриш

MeloTTS

CPU-оптимизацияланган Кўп тилли Кўплаб акцентлар Продукция тайёр Кам кутиш вақти

CPUда минимал кечикиш билан ишлайдиган юқори сифатли кўп тилли матн-нутқ.

Тезкор · 0.5GB (GPU optional) VRAM Синаб кўриш

Bark

Овоз эффектлари Кўкрак чўзиш Мусиқа яратиш 100+ овозли Кўп тилли

Трансформаторга асосланган матндан аудиога реалистик сўзлашув, мусиқа ва товуш эффектларини яратувчи модел.

Секин · 5GB VRAM Синаб кўриш

Bark Small

Оғир Барча барглардан тезроқ Эмоцион сўзлашув Кўп тилли

Баркнинг енгил версияси тезроқ хулоса чиқариш ва камроқ хотира сарфлаш билан.

Оддий · 2GB VRAM Синаб кўриш

CosyVoice 2

Трансляция Zero-shot клонлаш Тиллараро Эмоциялар бошқаруви Инсон-паритет

Alibaba'нинг инсон-паритет табиийлиги ва деярли сифр кечикиш билан ўлчамли стрийминг TTS.

Dia TTS

Кўп эшиттирувчи Диалоги яратиш Табиий айланиш Эмоцион ифода 1.6B параметрлари

Овозли суҳбатлар орасида табиий суҳбатларни яратадиган кўп овозли диалог яратиш модели.

Parler TTS

Овоз тавсифи Табиий тил бошқаруви Юқори даражадаги овоз яратиш Ўрнатилган овозлар керак эмас

Истаган овозингизни табиий тилда ифодаланг ва Parler мос келадиган сўзларни яратиб беради.

Indic Parler TTS

Ҳинд тили Овоз таърифи Табиий тил бошқаруви Аutentic Ҳиндча талаффуз

8+ Ҳинд тиллари учун табиий тил овоз бошқаруви билан юқори сифатли сўзлашув.

Секин · 8GB VRAM Синаб кўриш

KhanomTan TTS

Тай TTS Бир неча овоз берувчилар YourTTS архитектураси Коммерциявий-хавфсиз лицензия

Тай-фут сўзловчи овозларини танлаш билан матн-нутққа.

Тезкор · 2GB VRAM Синаб кўриш

IndexTTS-2

Эмоциялар бошқаруви Zero-shot Эмоция вектори Экспрессив сўзлашув Юқори сифатли бошқарув

Zero-shot TTS, яхши ҳис-туйғуларни бошқариш ва юқори ифодалилик билан.

Spark TTS

Овозни клонлаш Эмоцияларни бошқариш Услубни бошқариш Сўров асосида 5-сониялик клонлаш

ТТС овозини клонлаш, бошқариладиган ҳиссиёт ва саволлар орқали гапириш услуби.

GPT-SoVITS

5-сониялик клонлаш Ёзувчи овози Фақат озгина ўрганиш Юқори аниқлик Тиллараро

Фақат 5 сониялик аудиодан ҳар қандай овозни такрорлайдиган оз сонли овозни клонлаш TTS.

Секин · 6GB VRAM Синаб кўриш

Orpheus

Инсон даражасидаги ҳиссиёт 100K соатлик машғулот Табиий ёритиш Экспрессив сўзлашув

100K соатлик сўз маълумотлари асосида тайёрланган инсон даражасидаги ҳиссий TTS модели.

Chatterbox

Zero-shot клонлаш Эмоциялар бошқаруви Юқори аниқлик Услубни кўчириш Бир намунани клонлаш

Resemble AI'дан ҳис-туйғуларни бошқариш билан энг сўнгги нуқтали овозни клонлаш.

Tortoise TTS

Энг юқори сифат Кўп овозли DALL-E архитектураси Овозни клонлаш Авторегрессив

Авторегрессив архитектураси билан сифатга эътибор қаратилган кўп овозли матн-нутқ.

Секин · 8GB VRAM Синаб кўриш

StyleTTS 2

Инсон даражаси Услуб диффузия Мунозара машғулоти Табиий ўзгариш Юқори аниқлик

Стиль диффузия ва рақобатли машқлар орқали инсон даражасидаги матн-нутққа.

OpenVoice

Дарҳол клонлаш Товушни ўзгартириш Эмоциялар бошқаруви Акцент бошқаруви Кўп тилли

Стиль, ҳиссиёт ва акцент устидан аниқ назорат билан тезкор овозни клонлаш.

Qwen3 TTS

9 та олдиндан ўрнатилган овозлар Матндан овоз дизайни Эмоциялар бошқаруви Тиллар

Alibaba'нинг кўп тилли TTS'и, олдиндан белгиланган овозлар ва матндан овоз дизайни билан.

Оддий · 7GB VRAM Синаб кўриш

VieNeu-TTS-v2

7 та олдиндан ўрнатилган овозлар (Шарқий + Жанубий акцентлар) En-Vi код алмаштириш Товушни клонлаш (3-5с мисол) Подкаст / кўп эшиттирувчи қўллаб-қувватлаш Фақат CPU — GPU талаб этилмайди

Вьетнам + инглиз код-ўтказиш TTS 7 олдиндан белгиланган овозлар ва zero-shot овоз клонлаш билан. Фақат CPU, GPU талаб қилинмайди.

Тезкор · CPU VRAM Синаб кўриш

Sesame CSM

Мулоқот Табиий вақт Қаторга олиш Орқа канал 1B параметрлари

Мувофиқ вақт ва ҳиссиёт билан табиий диалогни яратувчи суҳбат сўзлашув модели.

Секин · 8GB VRAM Синаб кўриш

Chatterbox Turbo

200ms дан кам кутиш вақти Паралингвистик теглар 6x реал вақт Товушни клонлаш Сув белгиси

Sub-200ms latency ва кулиш, йўталиш ва бошқалар учун paralinguistic теги билан тезроқ Chatterbox.

Тезкор · 2GB VRAM Синаб кўриш

VoxCPM

44.1kHz аудио Токенизаторсиз Тиллараро клонлаш Контекстга қараб LoRA яхшилаш

Tokenizer-free TTS 44.1kHz аудиони контекст-аware абзац бирлиги билан ишлаб чиқаради.

Тезкор · 4GB VRAM Синаб кўриш

Kani TTS 2

3GB VRAM Жуда тез Оғир NanoCodec Оқ

Фақат 3GB VRAM хотирада ишлайдиган 400M инглизча TTS модели.

Тезкор · 3GB VRAM Синаб кўриш

OuteTTS

CPU хулосаси Браузер хулосаси Кўплаб backendлар Овозли профиллар

CPU, GPU ёки браузер орқали llama.cpp ва Transformers.js орқали ишлайдиган LLM-базали TTS.

Секин · 2GB VRAM Синаб кўриш

VibeVoice

Кўп эшиттирувчи 90 дақиқагача Подкаст яратиш Сўҳбатдошнинг бир хиллиги 200ms узатиш

Подкастлар ва аудиокитоблар каби узоқ шаклли кўп эшиттирувчили мазмун учун Microsoft модели.

Тезкор · 4GB VRAM Синаб кўриш

Pocket TTS

100M параметрлар CPU хулосаси Овозни клонлаш Бир намунали клонлаш Эгишга тайёр

Kyutai томонидан енгил 100M параметрли модел, бир намунадан овозни клонлаш билан.

Тезкор · 1GB VRAM Синаб кўриш

Kitten TTS

Фақат CPU-га асосланган хулоса 80MB дан кичик модел ҳажми 8 та овоз Тезликни назорат қилиш ONNX-га асосланган 24kHz чиқинди

80MB дан камроқ бўлган жуда енгил TTS. CPUда GPUсиз ишлайди.

Тезкор · 0GB VRAM Синаб кўриш

CosyVoice3

Иккиламчи оқим Эмоциялар бошқаруви Овозни клонлаш Суръат/ҳажм назорати Ишоралар остидаги

Кейинги авлод кўп тилли TTS, иккиламчи узатиш, ҳис-туйғуларни бошқариш ва овозни клонлаш билан.

Тезкор · 4GB VRAM Синаб кўриш

NAMAA Saudi TTS

Саудия Арабистони диалекти Замонавий стандарт арабча Zero-shot овозни клонлаш Эмоциялар бошқаруви Ўзбекча талаффуз

Биринчи очиқ Сауд Арабия TTS. Chatterbox-хавфсиз овозни клонлаш билан маҳаллий Сауд диалекти.

Оддий · 6GB VRAM Синаб кўриш

Darwin TTS

Овозни клонлаш Тиллараро FFN-бирлашган 4 асосий тил Qwen3 орқа қисми

Qwen3-1.7B тил моделидан кўп тилли клонлаш учун FFN вазнлари билан аралаштирилган cross-modal Qwen3-TTS варианти.

Оддий · 7GB VRAM Синаб кўриш

MOSS-TTSD

Кўп эшиттирувчили диалог 5 тагача баландпарвоз 60min когерент аудио Овозни клонлаш Подкастларни оптималлаштириш

Кўп эшиттирувчили диалог давом эттириш модели — 5 эшиттирувчи ва 60 дақиқалик бир хил аудио билан подкаст-стилидаги суҳбатларни яратиш.

Оддий · 12GB VRAM Синаб кўриш

Ming-Omni TTS

44.1kHz чиқим Овозни клонлаш Эмоциялар бошқаруви Диалект бошқаруви BGM яратиш Компакт 0.5B

InclusionAI дан 0.5B омни-модал сўзлашув модели, юқори ишончли 44.1kHz чиқинди ва овозни 0-шот билан клонлаш.

Оддий · 3GB VRAM Синаб кўриш

MOSS-TTS Nano