VibeVoice

Speaker 1

Стандартные Английский Neutral VibeVoice

Этот голос говорит на языке и обеспечивает {качественный} качественный синтез речи. При скорости производства {скорости} и качественном рейтинге {рейтинг}/5 {название} хорошо подходит для {лучшего_ для}. Двигатель {модель} разрабатывается на основе {разработчика} {лицензии}, что делает его безопасным для коммерческого использования. К основным возможностям относятся: {характеры}.

Рейтингов пока нет.

VibeVoiceТиповая информация

Модель VibeVoice
Разработчик Microsoft
Качество
Скорость Быстрая
Лицензия MIT
Клонирование Данные отсутствуют
Тяжелый Стандартные (2 кредита/1K чары)
Параметры 1.5B
Архитектура LLM + DAC
Данные о профессиональной подготовке 100000 часы
Год 2025

Наилучшие варианты использования для Speaker 1

Рекомендуемые приложения, основанные на характеристиках этого голоса

Аудиовизуальные книги и рассказы

Используйте {имя} для описания содержания длинной формы с помощью естественного прозодия и выражения.

Video Voovers

Добавить профессиональную повествование в видео, рекламу и соцсети YouTube.

& Доступность приложений

Быстрое поколение делает этот голос идеальным для приложений в реальном времени, скриншотов и инструментов доступности.

Подкасты и вещание

Студийное качество, подходящее для подкастов, радио и профессионального вещания.

Больше VibeVoice Голоса

Другие голоса из той же модели TTS

Speaker 1 (Chinese)

Китайцы Neutral

Speaker 2

Английский Neutral

Speaker 2 (Chinese)

Китайцы Neutral

Speaker 3

Английский Neutral

Speaker 4

Английский Neutral

Часто задаваемые вопросы

VibeVoice Microsoft состоит из двух вариантов: модели 1,5B для длинноформатного контента (до 90 минут, 4 оратора) и модели в реальном времени 0,5B для ретрансляции с ~200 мс первой звуковой латентностью. Вариант 1.5B превосходит подкасты и аудиокниги с последовательности громкоговорителей на длинных отрывках. Примечание: Microsoft удалил код TTS из хранилища и создал звук, включающий звуковые диски AI.

VibeVoice была разработана компанией Microsoft и выпущена под лицензией MIT (только для исследований), которая допускает коммерческое использование генерированного звука.

VibeVoice поддерживает один язык: английский.

VibeVoice находится в премиальном уровне — 4 балла на 1 000 символов.

У VibeVoice умеренная скорость поколения. Поколение обычно занимает несколько секунд в зависимости от длины текста.

VibeVoice получил 5/5 за качество звука на TTS.ai, он произносит студийную, похожую на человека речь.

Нет, VibeVoice использует фиксированный набор встроенных голосов. Для клонирования голоса попробуйте модели, такие как CosyVoice 2, GPT-SOVITS, или Chatterbox.

Да, VibeVoice конкретно рекомендуется для подкастов, аудиокниги, длинноформатного многопикового контента. Его мультипикер, до 90 минут, генераторы подкастов делают его отличным выбором для этого варианта использования.

Да, VibeVoice лицензирована в рамках MIT (только для научных исследований), что позволяет коммерческое использование. Аудиоматериалы, созданные с голосами VibeVoice, могут использоваться в видео, подкастах, приложениях, играх и любых других коммерческих проектах.

Да, все голоса на TTS.ai используют модели с открытыми исходными кодами (MIT, Apache 2.0).

Отправьте запрос POST на /api/v1/tts с именем модели и ID голоса. Смотрите страницу API Documentation для примеров кодов в Python, JavaScript, Go, и CURL.

Да, нажмите кнопку для воспроизведения на этой странице, чтобы услышать образец. Вы также можете напечатать текст на текстовой странице и создать бесплатный просмотр с любым голосом.

Попробуй Speaker 1 Сейчас

Введите любой текст и услышьте его Speaker 1. Свободное использование.