VibeVoice

Speaker 2 (Chinese)

Әдетті ҚытайшаName Neutral VibeVoice

Speaker 2 (Chinese) - VibeVoice мәтін- дыбыс синтезі моделі қолданатын neutral ДК дауысы. Бұл стандартты деңгей дауысы ҚытайшаName тілінде сөйлейді және студия сапалы дыбыс синтезін береді. сәтсіз құру жылдамдығы мен 5/5 сапа рейтингімен Speaker 2 (Chinese) podcasts, dialogues, long-form narration, multi-speaker content үшін өте қолайлы. VibeVoice драйверін Microsoft under the MIT license жасап шығарды, ол коммерциялық пайдалану үшін қауіпсіз. Ключев (Ключев) — Ресейдегі өзен.

Бағалау жоқ

VibeVoiceҮлгі мәліметі

Үлгі VibeVoice
Жасаушы Microsoft
Сапа
Жылдамдығы Тұрақты
Лицензия MIT
Клондау Қол жетпейді
Тақырып Стандартты (2 кредит/ 1K таңба)
Параметрлер 1.5B
Архитектура LLM + DAC
Оқыту деректері 100000 сағат
Жыл 2025

Пайдалану жағдайлары Speaker 2 (Chinese)

Бұл дауыстың қасиеттері бойынша ұсынылған қолданбалар

Аудиокітаптар мен әңгімелеуName

Speaker 2 (Chinese) дегенді қысқа мазмұнды табиғи интонациямен және өрнектермен баяндау үшін қолданыңыз.

Видео дыбыс жазулары

YouTube видеоларына, жарнамаларға және әлеуметтік медиа мазмұнына кәсіби баяндау қосыңыз.

Қолданбалар мен қолжетімділік

Жылдам құрылуы бұл дауысты нақты уақыт қолданбалары, экранды оқу құралдары және қолжетімділік құралдары үшін өте қолайлы етеді.

Подкасттар мен радио

Студиялық сапалы шығыс подкасттар, радио және кәсіби радио тарату үшін қолайлы.

Көбірек VibeVoice Дыбыстар

Бірдей TTS үлгідегі басқа да дыбыстар

Speaker 1

АғылшыншаName Neutral

Speaker 1 (Chinese)

ҚытайшаName Neutral

Speaker 2

АғылшыншаName Neutral

Speaker 3

АғылшыншаName Neutral

Speaker 4

АғылшыншаName Neutral

Жиі қойылатын сұрақтар

Microsoft VibeVoice екі түрі бар: 1. 5B моделі ұзақ мазмұн үшін (90 минутқа дейін, 4 динамик) және Realtime 0. 5B моделі ~200 мс алғашқы дыбыс кешігіп шығуымен. 1. 5B түрі подкасттар мен аудиокітаптарда дыбыс берушінің ұзақ фрагменттердегі біркелкілігін қамтамасыз етеді. Ескерту: Microsoft TTS кодын репозиториінен алып тастады, ал құрылған дыбыстар дыбыс шығаратын AI- дан бас тартуларды қамтиды.

VibeVoice Microsoft компаниясымен жасақталған және MIT (research-only intent) лицензиясы бойынша шығарылған, ол генерацияланған аудионы коммерциялық пайдалануға мүмкіндік береді.

1-ші сыныпқа арналған оқулық: Англия.

VibeVoice Premium деңгейінде - 1000 таңба үшін 4 кредит. VibeVoice дыбысын толық аудионы құрмас бұрын тегін қарап шыға аласыз.

VibeVoice- дің құру жылдамдығы орташа. Мәтіннің ұзындығына қарай, құру бір- екі секундқа созылады.

VibeVoice- тің дыбыс сапасы TTS.ai- да 5/ 5 бағаланған. Ол студиялық деңгейдегі, адамға ұқсас сөйлеуді ұсынады.

Жоқ, VibeVoice бірқатар ішкі дыбыстарды қолданады. Дыбысты клондау үшін CosyVoice 2, GPT- SoVITS немесе Chatterbox сияқты үлгілерді қолданыңыз.

Иә, VibeVoice- ті podcast- терге, аудиокітаптарға, ұзақ, бірнеше дыбыс шығарғыштармен жазылатын мазмұнға қолдануға болады. Ол бірнеше дыбыс шығарғыштармен, 90 минутқа дейінгі, podcast- ті құру мүмкіндігіне ие, сондықтан бұл қолданба үшін өте жақсы таңдау.

Иә, VibeVoice MIT лицензиясымен (тек зерттеу мақсатында) шығарылған, бұл коммерциялық пайдалануға рұқсат береді. VibeVoice дыбыстары арқылы жасалған дыбыстар бейне, подкаст, қолданба, ойындар және басқа да коммерциялық жобаларда қолданылуы мүмкін.

Иә, TTS.ai- дегі барлық дауыстар коммерциялық лицензияланған ашық кодты модельдерді қолданады (MIT, Apache 2. 0). Жіберілген дыбыстар Сіздің бейнелеріңізде, подкасттарыңызда, қолданбаларда, ойындарыңызда және басқа да коммерциялық қолданбаларда қолданылуы мүмкін.

/api/v1/tts/ дегенге үлгі атауы мен дауыс идентификаторы бар POST сұрауын жіберіңіз. Python, JavaScript, Go және cURL кодының мысалдарын API құжаттама бетінен қараңыз.

Иә, осы беттегі орындау батырмасын басып үлгіні тыңдаңыз. Сіз сондай- ақ Мәтіннен сөйлеуге бетінде өзіңіздің мәтініңізді енгізіп, кез келген дауыспен тегін нобайын жасауға болады.

Тексеру Speaker 2 (Chinese) Қазір

Кез келген мәтін енгізіп, оны тыңдауName Speaker 2 (Chinese). Қолдануға еркін.