VITS

Baker (Chinese)

Бос ҚытайшаName Neutral VITS

Baker (Chinese) - VITS мәтін- дыбыс синтезі моделі қолданатын neutral ДК дауысы. Бұл free- layer дауысы ҚытайшаName тілінде сөйлейді және жақсы сапалы дыбыс синтезін береді. сәтсіз құру жылдамдығы мен 3/5 сапа рейтингімен Baker (Chinese) general-purpose text-to-speech with natural prosody үшін өте қолайлы. VITS драйверін Jaehyeon Kim et al. under the MIT license жасап шығарды, ол коммерциялық пайдалану үшін қауіпсіз. Ключев (Ключев) — Ресейдегі өзен.

Бағалау жоқ

VITSҮлгі мәліметі

Үлгі VITS
Жасаушы Jaehyeon Kim et al.
Сапа
Жылдамдығы Тұрақты
Лицензия MIT
Клондау Қол жетпейді
Тақырып Бос (таңбалар қолданылмайды)
Параметрлер 25M
Архитектура VAE + Normalizing Flows + GAN
Оқыту деректері 585 сағат
Жыл 2021

Пайдалану жағдайлары Baker (Chinese)

Бұл дауыстың қасиеттері бойынша ұсынылған қолданбалар

Аудиокітаптар мен әңгімелеуName

Baker (Chinese) дегенді қысқа мазмұнды табиғи интонациямен және өрнектермен баяндау үшін қолданыңыз.

Видео дыбыс жазулары

YouTube видеоларына, жарнамаларға және әлеуметтік медиа мазмұнына кәсіби баяндау қосыңыз.

Қолданбалар мен қолжетімділік

Жылдам құрылуы бұл дауысты нақты уақыт қолданбалары, экранды оқу құралдары және қолжетімділік құралдары үшін өте қолайлы етеді.

Электрондық білім беру және оқытуName

Жаңа технологияларды қолдану арқылы қызықты оқыту материалдарын, курстарды және білім беру мазмұнын құрыңыз.

Көбірек VITS Дыбыстар

Бірдей TTS үлгідегі басқа да дыбыстар

Default

АғылшыншаName Neutral

Жиі қойылатын сұрақтар

VITS (Variation Inference with adversarial learning for end- to- end Text- to- Speech) - бұл қазіргі екі сатылы үлгілерге қарағанда табиғи дауысты шығаратын параллельді, аясынан аяғына дейінгі TTS әдісі. Ол табиғилықты едәуір жақсарту үшін, нормаластыру ағымдары мен қарсыласу оқыту процесімен толықтырылған вариациялық инференцияны қолданады.

VITS Jaehyeon Kim et al.-мен жасақталған және MIT лицензиясы бойынша шығарылған, ол генерацияланған аудионы коммерциялық пайдалануға мүмкіндік береді.

VITS 4 тілде қолдау көрсетеді: ағылшын, қытай, жапон, корей.

VITS Free деңгейінде - тегін - кредиттер қажет емес. Барлық VITS дауыстарды толық аудионы құрмас бұрын тегін қарап шыға аласыз.

VITS өте жылдам құрылады. Ол шын уақытқа жақын орындалады, сондықтан оны ағындық және интерактивті қолданбалар үшін қолдануға болады.

VITS TTS.ai- дегі дыбыс сапасы үшін 3/ 5 бағасын алды. Бұл қолданбалардың көпшілігіне сай дыбыс сапасын береді.

Жоқ, VITS бірқатар ішкі дыбыстарды қолданады. Дыбысты клондау үшін CosyVoice 2, GPT- SoVITS немесе Chatterbox сияқты үлгілерді қолданыңыз.

Иә, VITS жалпы мақсаттағы мәтіннен сөйлеуге табиғи прозодиямен арнаулы ұсынылады. Оның аясынан аяғына дейін синтезі, табиғи прозодиясы, тез іздеу қабілеті оны осы қолданба үшін тамаша таңдау етеді.

Иә, VITS MIT лицензиясымен лицензияланған, бұл коммерциялық пайдалануға мүмкіндік береді. VITS дыбыстары арқылы жасалған аудионы видео, подкаст, қолданба, ойындар және басқа да коммерциялық жобаларда қолдануға болады.

Иә, TTS.ai- дегі барлық дауыстар коммерциялық лицензияланған ашық кодты модельдерді қолданады (MIT, Apache 2. 0). Жіберілген дыбыстар Сіздің бейнелеріңізде, подкасттарыңызда, қолданбаларда, ойындарыңызда және басқа да коммерциялық қолданбаларда қолданылуы мүмкін.

/api/v1/tts/ дегенге үлгі атауы мен дауыс идентификаторы бар POST сұрауын жіберіңіз. Python, JavaScript, Go және cURL кодының мысалдарын API құжаттама бетінен қараңыз.

Иә, осы беттегі орындау батырмасын басып үлгіні тыңдаңыз. Сіз сондай- ақ Мәтіннен сөйлеуге бетінде өзіңіздің мәтініңізді енгізіп, кез келген дауыспен тегін нобайын жасауға болады.

Тексеру Baker (Chinese) Қазір

Кез келген мәтін енгізіп, оны тыңдауName Baker (Chinese). Қолдануға еркін таңбалары қажет емес.