Свабодны AI Пераклад тэксту на мовуName

Параметры 82M Вельмі хуткі Выразныя галасы Некалькі моў Падтрымка стрымінгу

У 1982 г. скончыў Беларускі дзяржаўны ўніверсітэт імя П. М. Машэрава па спецыяльнасці фізіка-матэматычны факультэт.

Захаваць · 1.5GB VRAM Паспрабуйце

Piper

Працоўны працэсар Падтрымлівае аўтаномны рэжым Голас 30+ моў Падтрымка SSML

Хуткая, мясцовая нейронная сістэма пераўтварэньня тэксту ў мову, аптымалізаваная для Raspberry Pi і ўбудаваных прылад.

Захаваць · 0 (CPU only) VRAM Паспрабуйце

VITS

Край- да- канца сінтэз Натуральная празодыя Хуткае высновы Некалькі дынамікаў

Праграмнае забеспячэнне для перакладу тэкстаў з адной мовы на іншую.

Захаваць · 1GB VRAM Паспрабуйце

MeloTTS

Аптымізавана для працэсара Некалькі моў Некалькі акцэнтаўKCharselect unicode block name Вытворчая гатоўнасць Нізкая задержка

Высокаякасная шматмоўная праграма пераўтварэння тэксту ў маўленне, якая працуе на працэсары з мінімальным часам чакання.

Захаваць · 0.5GB (GPU optional) VRAM Паспрабуйце

Bark

Гукавыя эфекты Смех/Здыханне Генерацыя музыкі 100+ дынамікаў Некалькі моў

Праграмнае забеспячэнне для пераўтварэння тэксту ў аўдыё, якое генеруе рэалістычную мову, музыку і гукавыя эфекты.

Павольны · 5GB VRAM Паспрабуйце

Bark Small

Легкі Хутчэй за поўную корку Эмацыянальная гаворка Некалькі моў

Гэтая версія была больш хуткай і мела больш магутны працэсар і памяць.

Носьбіт · 2GB VRAM Паспрабуйце

CosyVoice 2

Пратокі Клонаванне Zero-shot Міжмоўны Кіраванне эмоцыямі Людская парнасць

Нацыянальны гімн Рэспублікі Беларусь — гімн Рэспублікі Беларусь і дзяржаўны гімн Рэспублікі Беларусь.

Dia TTS

Некалькі дынамікаў Генераванне дыялогу Натуральны паварот Эмацыянальны выраз Параметры 1. 6B

Інфармацыйна-камунікацыйныя тэхналогіі (ІКТ) — комплекс тэхналогій, якія дазваляюць арганізаваць камунікацыю паміж людзьмі.

Parler TTS

Апісанне голасу Кантроль натуральнай мовы Гнуткае стварэньне голасу Няма патрэбы ў прадвызначаных галасах

Апішыце патрэбны вам голас на натуральнай мове, і Parler створыць адпаведны голас.

Indic Parler TTS

Індыйскія мовы Апісанне голасу Натуральная мова Аўтэнтычнае індыйскае ўмоўнае ўжываннеKCharselect unicode block name

У 8-м раздзеле гаворыцца пра мовы, якія маюць афіцыйны статус.

Павольны · 8GB VRAM Паспрабуйце

KhanomTan TTS

Тайская TTS Некалькі дынамікаў Архітэктура YourTTS Камерцыйная бяспечная ліцэнзія

Першы тэкставы пераклад з мовы на мову.

Захаваць · 2GB VRAM Паспрабуйце

IndexTTS-2

Кіраванне эмоцыямі Нулявы выстрэл Вэктары эмоцый Выразная гаворка Кіраванне дробназярністасцю

Сістэма лічбавага тэлебачання мае высокую эфектыўнасць і высокую дакладнасць.

Spark TTS

Клонаванне голасу Кіраванне эмоцыямі Кіраванне стылямі На аснове запыту Клонаванне на 5 секунд

Гісторыя тэорыі лічбаў і матэматыкі ў кантэксце лічбавых тэхналогій.

GPT-SoVITS

Клонаванне на 5 секунд Спявае голас Некалькі выпадкаў навучання Высокая дакладнасць Міжмоўны

Усяго было выпушчана каля 5000 экзэмпляраў кнігі, што складае каля 50 % усяго накладу часопіса.

Павольны · 6GB VRAM Паспрабуйце

Orpheus

Эмоцыі на ўзроўні чалавека 100K гадзін навучання Натуральны акцэнт Выразная гаворка

У 100-гадовым юбілеі гімназіі было выдадзена 100-тысячнае выданне кнігі.

Chatterbox

Клонаванне Zero-shot Кіраванне эмоцыямі Высокая дакладнасць Перадача стылю Клонаванне аднаго прыкладу

Сістэма лічбавага тэлевізійнага вяшчання ўключае ў сябе лічбавае тэлебачанне і лічбавую радыёвяшчанне.

Tortoise TTS

Найвышэйшая якасць Некалькі галасоў Архітэктура DALL- E Клонаванне голасу Аўтарэгрэсіўны

Большасць тэкстаў напісана ў стылі класіцызму з элементамі рэнесансу.

Павольны · 8GB VRAM Паспрабуйце

StyleTTS 2

Узровень чалавека Дыфузія стылю Трэніроўка супрацьстаяння Натуральнае адхіленне Высокая дакладнасць

Працаваў у галіне тэарэтычнай геаграфіі і геаграфічнай геаграфіі.

OpenVoice

Неадкладнае клонаванне Ператварэнне голасу Кіраванне эмоцыямі Кіраванне акцэнтам Некалькі моў

Неадкладнае кланаванне голасу з дэталёвым кантролем над стылем, эмоцыямі і акцэнтам.

Qwen3 TTS

Клонаванне голасу 9 прадвызначаных галасоў Дызайн голасу з тэксту Кіраванне эмоцыямі

Мультымоўны TTS Alibaba з клонаваннем голасу, прадвызначанымі голасамі і дызайнам голасу з тэксту.

Носьбіт · 7GB VRAM Паспрабуйце

VieNeu-TTS-v2

7 прадвызначаных галасоў (поўнач + поўдзень акцэнты) Name Пераключэнне коду En-Vi Клонаванне голасу (3-5 секунд) Name Падтрымка падкастаў/ шматдынамікаў Толькі працэсар — не патрабуецца відэакарта

В' етнамская + англійская з пераключэннем коду TTS з 7 прадвызначанымі голасамі і кланаваньнем голасу без выкарыстаньня графічнага працэсара.

Захаваць · CPU VRAM Паспрабуйце

Sesame CSM

Размовы Натуральны час Па чарзе Зваротны канал Параметры 1B

Нацыянальная мова — мова, на якой гавораць насельніцтва краіны і яе нацыянальныя меншасці.

Павольны · 8GB VRAM Паспрабуйце

Chatterbox Turbo

Затрымка менш за 200 мс Паралінгвістычныя тэгі 6x рэальнага часу Клонаванне голасу Водны знак

У 2000-я гг. з'явіліся новыя тэхналогіі, якія дазваляюць вырабляць 2D-мадэлі, 3D-мадэлі і г.д.

Захаваць · 2GB VRAM Паспрабуйце

VoxCPM

44. 1 кГц Не выкарыстоўваць токенізатар Клонаванне паміж мовамі Кантэкстуальны Дакладная наладка LoRA

44,1 % насельніцтва займаюцца сельскай гаспадаркай, у тым ліку 41,1 % — жывёлагадоўляй.

Захаваць · 4GB VRAM Паспрабуйце

Kani TTS 2

3 Гб VRAM Вельмі хуткі Клонаванне голасу Легкі НанакодэкName

400-міліметровая зброя 300-міліметровай зброі 300-міліметровая зброя 300-міліметровая зброя 300-міліметровая зброя

Захаваць · 3GB VRAM Паспрабуйце

OuteTTS

Выснова працэсара Выснова вандроўніка Некалькі сервераў Прафілі дынамікаў

LLM-заснаваны TTS, які працуе на CPU, GPU, або браўзэры праз llama.cpp і Transformers.js.

Павольны · 2GB VRAM Паспрабуйце

VibeVoice

Некалькі дынамікаў Да 90 хв ПадкастGenericName Кансістэнцыя гаворкі 200 мс

Мадэлі Microsoft для доўгатэрміновага кантэнту, такіх як подкасты і аўдыёкнігі.

Захаваць · 4GB VRAM Паспрабуйце

Pocket TTS

Параметры Выснова працэсара Клонаванне голасу Клонаванне аднаго прыкладу Падрыхтаваны для краёў

У 100-м годзе да н.э. быў заснаваны горад Кіпр, які стаў цэнтрам адной з гістарычных правінцый.

Захаваць · 1GB VRAM Паспрабуйце

Kitten TTS

Выснова толькі на аснове працэсара Памер мадэлі менш за 80 Мб 8 убудаваных галасоў Рэгуляванне хуткасці На аснове ONNX Вывад 24 кГц

Вельмі лёгкі TTS менш за 80 Мб. Працуе на працэсары без графічнага працэсара.

Захаваць · 0GB VRAM Паспрабуйце

CosyVoice3

Двухпотокавы Кіраванне эмоцыямі Клонаванне голасу Рэгуляванне хуткасці/гучнасці Інструкцыя

У ёй выкарыстаны тэхналогіі сінтэзу мовы, сінтэзу мовы з тэкстам, сінтэзу мовы з тэкстам і сінтэзу мовы з тэкстам.

Захаваць · 4GB VRAM Паспрабуйце

NAMAA Saudi TTS

АрабскаяName Сучасная стандартная арабскаяKCharselect unicode block name Клонаваньне голасу без выбуху Кіраванне эмоцыямі Нацыянальнае вымаўленне

Першы адкрыты саудаўска-арабскі TTS. Нацыянальны дыялект Саудаўскай Аравіі з кланаваньнем голасу якасцю Chatterbox.

Носьбіт · 6GB VRAM Паспрабуйце

Darwin TTS

Клонаванне голасу Мова Змешванне FFN 4 асноўныя мовы Сістэма Qwen3

Крос-модальны Qwen3-TTS варыянт з FFN-вагамі, змешанымі з моўнай мадэллю Qwen3-1.7B для больш выразнага шматмоўнага клонавання.

Носьбіт · 7GB VRAM Паспрабуйце

MOSS-TTSD

Дыялог з некалькімі гукавымі прыладаміName Да 5 дынамікаў 60 хвілін Клонаванне голасу Аптымізацыя для падкастаў

У 2009 годзе ў эфіры радыёстанцыі «Свабода» прайшоў радыёэфірны марафон «Свабода ў эфіры» з удзелам 500 чалавек і 60 радыёстанцый.

Носьбіт · 12GB VRAM Паспрабуйце

Ming-Omni TTS

Вывад 44. 1 кГц Клонаванне голасу Кіраванне эмоцыямі Дыялектная мова Генерацыя BGM Кампактная 0. 5B

У 1950 годзе ўпершыню быў выпушчаны 1,4-літровы 4-цыліндравы рухавік з 4-ступеністай механічнай каробкай перадач.

Носьбіт · 3GB VRAM Паспрабуйце

MOSS-TTS Nano