Free AIGenericName Мәтінді сөйлеугеName

82М параметрлері Өте жылдам Экспрессивті дауыстар Көп тілді Аударуды қолдау

NGC 82 нысанына арналған жарияланымдар

Тұрақты · 1.5GB VRAM Сынап көру

Piper

Процессорға ыңғайлы Желіден тыс жұмыс істей алады 100+ дауыс 35+ тіл SSML қолдауы

Raspberry Pi және ендірілген құрылғылар үшін жақсартылған жылдам, жергілікті нейрондық мәтіннен сөйлеуге жүйе. Name

Тұрақты · 0 (CPU only) VRAM Сынап көру

VITS

Толық синтез Табиғи интонация Жылдам тұжырым Бірнеше динамик

Конфликтология — қатынастар теориясы мен практикасының ғылыми саласы.

Тұрақты · 1GB VRAM Сынап көру

MeloTTS

Процессорды жақсарту Көп тілді Бірнеше акценті Өндіріске дайын Төмен кідіріс

Процессорда минималды кешіктірумен жұмыс істейтін сапалы көп тілді мәтін- дыбыс аудару. Name

Тұрақты · 0.5GB (GPU optional) VRAM Сынап көру

Bark

Дыбыс эффекттері Көңіл көтеру/Көңіл көтеру Музыканы құру 100+ динамигі Көп тілді

Трансформаторға негізделген мәтіннен дыбыс шығару моделі, реалистік сөйлеу, музыка және дыбыс эффекттерін шығарады.

Баяу · 5GB VRAM Сынап көру

Bark Small

Жеңіл Барлық қабықтан тезірек Эмоциялық сөйлеу Көп тілді

Bark- тің жеңіл нұсқасы, тезірек есептеу және аз жады жұмсау. Name

Таспа · 2GB VRAM Сынап көру

CosyVoice 2

Аудару Zero-shot клондау Тіларалық Эмоцияларды басқару Адам- паритеті

Алғашқы нұсқасында атомның массасы мен электронның саны бірдей болатын.

Dia TTS

Бірнеше динамигі Диалогтарды құру Табиғи айналу Күй- күй белгілері 1. 6B параметрлері

Диалогтық жүйелер - диалогтық диалогты құру үшін қолданылатын бағдарламалық жасақтама.

Parler TTS

Дыбыс сипаттамасы Табиғи тілді басқару Еңбекшіл дауысты құру Алдын- ала орнатылған дауыстар керек емес

Сіз тілегіңізді табиғи тілде сипаттап, Parler сәйкесті дыбыстарды құрастырады.

Indic Parler TTS

11 қыркүйек Дыбыс сипаттамасы Табиғи тілдің басқаруы Үнді дыбысы

8+ үнді тілдерінің жоғары сапалы сөйлеуін табиғи дауыс басқаруымен басқарады.

Баяу · 8GB VRAM Сынап көру

KhanomTan TTS

Тай TTS Бірнеше динамик YourTTS архитектурасы Коммерциялық қауіпсіз лицензия

Таиланд- бірінші текст-то-слов с таңдау дыбыстары.

Тұрақты · 2GB VRAM Сынап көру

IndexTTS-2

Эмоциялар басқаруы Нулдік оқ Эмоциялар векторы Экспрессивті сөйлеу Жеңіл өңделген басқару

Ұзындығы 100 шақырымнан асатын ірі өзендер мен өзендер жүйесі бар.

Spark TTS

Дыбысын көшіру Эмоцияларды басқару Стильді басқару Сұрау негізінде 5 секундтық клондау

Аудио клондау TTS контролирленетін эмоциялармен және сұраулар арқылы сөйлеу стилімен.

GPT-SoVITS

5 секундтық клондау Ән айту Бірнеше рет оқыту Жоғары дәлдік Тіларалық

Аудио файлдың 5 секундынан кез келген дыбысты клондау үшін бірнеше реттік дауысты клондау.

Баяу · 6GB VRAM Сынап көру

Orpheus

Адамдық деңгейдегі эмоция 100K сағат оқыту Табиғи бояулау Экспрессивті сөйлеу

100-ден астам ғылыми еңбектің, оның ішінде 10 монографияның авторы.

Chatterbox

Клондау Эмоциялар басқаруы Жоғары дәлдік Стильдерді тасымалдау Бір үлгіні клондау

Рефлекторлық клондау — клондау әдісі арқылы гендік кодты клондау.

Tortoise TTS

Ең жоғары сапа Көп дауысты DALL- E архитектурасы Дыбысын көшіру Авторегрессия

Компьютерлік графика — компьютерлік графиканың бір саласы болып табылады.

Баяу · 8GB VRAM Сынап көру

StyleTTS 2

Адам деңгейі Диффузиялық стиль Конкуренциялық жаттығулар Табиғи ауытқуы Жоғары дәлдік

Қазақ тілі грамматикасы, грамматикалық стильдер, грамматикалық стильдер.

OpenVoice

Тікелей клондау Дыбыс аудармасы Эмоциялар басқаруы Акцентті басқару Көп тілді

Стиль, эмоция және акцентті егжей-тегжейлі басқарумен дауысты дереу клондау.

Qwen3 TTS

9 алдын- ала орнатылған дауыс Мәтіннен дыбыс дизайны Эмоциялар басқаруы Тіл

Alibaba-ның көп тілді TTS-і алдын-ала орнатылған дауыспен және мәтіннен дыбыс дизайнымен.

Таспа · 7GB VRAM Сынап көру

VieNeu-TTS-v2

7 алдын- ала орнатылған дауыс (солтүстік + оңтүстік акценттері) En-Vi кодты ауыстырғыш Дыбысты көшіру (3- 5с сілтеме) Подкаст / көп дыбыс шығарғыштарды қолдау Тек процессор — ГП қажет емес

Вьетнам және ағылшын тілдерін кодты ауыстырып, 7 алдын- ала орнатылған дыбыспен және дыбыстарды клондаусыз. Тек процессор қажет, графикалық процессор қажет емес. Name

Тұрақты · CPU VRAM Сынап көру

Sesame CSM

Сөйлесу Табиғи уақыт Қайталау Артқы арна 1B параметрлері

Диалогтық оқытуда диалогтық сөйлеудің негізгі мақсаты - сөйлеудің табиғи, эмоционалды және коммуникативтік қасиеттерін дамыту.

Баяу · 8GB VRAM Сынап көру

Chatterbox Turbo

200 мс- тан төменгі кешіктіру Паралингвистикалық тегтер 6x шын уақыт Дыбысын көшіру Сулы белгі

200 м-ден төменгі кешіктіруімен және күлкі, жөтел және басқа да паралингвистикалық тегтермен жылдам Chatterbox.

Тұрақты · 2GB VRAM Сынап көру

VoxCPM

44. 1 кГц аудио Токенизаторсыз Тіларалық клондау Контекстіне қарай LoRA дәлдігін жақсарту

Токенизаторсыз TTS 44.1kHz аудионы контекст-сенімді абзац біркелкілігімен шығарады.

Тұрақты · 4GB VRAM Сынап көру

Kani TTS 2

3Гб VRAM Өте жылдам Жеңіл Нанокодек Бос

400-ден астам ғылыми еңбектің, оның ішінде 3 монографияның авторы.

Тұрақты · 3GB VRAM Сынап көру

OuteTTS

Процессордың есептеуі Шолғыштың нәтижесі Бірнеше тетігі Динамик профилдері

LLM-ге негізделген, CPU, GPU немесе браузер арқылы llama.cpp және Transformers.js арқылы жұмыс істейтін TTS.

Баяу · 2GB VRAM Сынап көру

VibeVoice

Бірнеше динамигі 90 минутқа дейін Подкасттарды құру Дыбыс тізімін біріктіру 200мс ағым

Подкасттар мен аудиокітаптар сияқты ұзақ форматтағы мульти-сөйлеуші мазмұны үшін Microsoft моделі.

Тұрақты · 4GB VRAM Сынап көру

Pocket TTS

100М параметрлері Процессордың есептеуі Дыбысын көшіру Бір үлгіні клондау Шегіне дейін

Kyutai- ның жеңіл 100М параметрлік моделі, бір үлгіден дауысты клондау.

Тұрақты · 1GB VRAM Сынап көру

Kitten TTS

Процессордың ғана нәтижесі Үлгінің өлшемі 80Мб- тан кем 8 ішкі дауысName Жылдамдық бақылауы ONNX негізіндегі 24 кГц шығысы

80Мб-тан аспайтын өте жеңіл TTS. Графикалық процессорсыз процессорда орындалады. Name

Тұрақты · 0GB VRAM Сынап көру

CosyVoice3

Екі ағым Эмоциялар басқаруы Дыбысын көшіру Жылдамдық/Дыбыс контроллері Инструкциядан кейін

Би-стриминг, эмоцияларды басқару және дауысты клондау арқылы келесі буын көп тілді TTS.

Тұрақты · 4GB VRAM Сынап көру

NAMAA Saudi TTS

Сауд Арабия диалектіName Жаңа дәстүрлі арабша Дыбысты клондау Эмоциялар басқаруы Жергілікті дыбысы

Бірінші ашық Сауд Арабиясының дыбыс аудару жүйесі. Сауд Арабиясының өз диалектісі, Chatterbox- сапалы дыбыстарды клондау. Name

Таспа · 6GB VRAM Сынап көру

Darwin TTS

Дыбысын көшіру Тіларалық FFN- араласқан 4 негізгі тіл Qwen3 негізіндегі

Qwen3-1.7B тіл моделінен алынған FFN салмағы бар Qwen3-TTS-тің кросс-модалды нұсқасы көп тілдік клондауды жеңілдету үшін қолданылады.

Таспа · 7GB VRAM Сынап көру

MOSS-TTSD

Көп дыбыс шығарғыштар диалогы 5 динамикке дейін 60мин біртұтас аудио Дыбысын көшіру Подкасттарды жақсарту

Multi-speaker dialogue continuation model — 5-ке дейінгі спикерлермен және 60 минуттық біртұтас аудиомен подкаст-стиліндегі әңгімелерді құру.

Таспа · 12GB VRAM Сынап көру

Ming-Omni TTS

44. 1 кГц шығысы Дыбысын көшіру Эмоциялар басқаруы Диалект басқаруы BGM генераторы Ықшамдалған 0. 5B

1950 жылы 14 қаңтарда Алматы қаласында туған.1994 жылы 14 қаңтарда Алматы қаласында қайтыс болды.

Таспа · 3GB VRAM Сынап көру

MOSS-TTS Nano