Report Bug / Feature Request

Студия Голосового дизайна

Создайте индивидуальные голоса АИ, корректируя слайдеры.

Характеристики голоса

ГлубокаяВысокая
МедленноБыстрая
Холодный/профессиональныйТепло/дружелюбно
ОчиститьДыхание
МолодойПожилые люди
A young adult female voice with medium pitch and normal speed. Balanced warmth, clear delivery.

Текст для разговора

0/2000
2 символы Подписывайся. для отслеживания использования

Просмотр

Отрегулировать раздвижные устройства и нажать Генерировать, чтобы услышать ваш спланированный голос

Выращиваю голос...

Сохранённые предисловия к голосам

Найдите голос и оставьте его для последующего использования.

Планы Голосового дизайна

Начать бесплатно, обновить, когда нужно больше

Самые популярные
Свободный счет
  • 15 000 бесплатных символов при регистрации
  • Пол, подача, контроль скорости
  • Теплые и дыхательные скользящие устройства
  • Эмоции/прогнозирование стиля
  • 2 000 знаков в расчете на одно поколение
Не подписываться
Про
  • Сохранить заказные проекты голосовых сообщений
  • Откорректированный возрастный контроль
  • Поколение партии
  • Доступ к API
  • Использовать дизайны по всем инструментам
Модернизация

Часто задаваемые вопросы

Студия Voice Design Studio позволяет создавать заказные голоса AI, описывая такие характеристики, как стиль, скорость, теплота, дыхание и возраст — нет необходимости в записи. AI генерирует голос, соответствующий вашему описанию, с использованием режима Qwen3-TTS.

Вы корректируете ползунки (пичка, скорость, теплота, дыхание, возраст) или набираете свободно-текстовое описание, типа "теплый, дружелюбный, молодой женский голос с небольшим британским акцентом". МА интерпретирует ваше описание и создает речь совпадающим синтетическим голосом.

Голосовой дизайн использует Qwen3-TTS в режиме VoiceDesign. Эта модель может генерировать голоса из текстовых описаний без какого-либо справочного звука. Она поддерживает широкий диапазон характеристик голоса и производит естественную звуковую речь.

Да. Как только вы создадите свой голос, нажмите "Сохраните как пресет" для хранения описания. Затем вы можете использовать этот предварительный текст в поколениях TTS, голосовых разговорах и агентах — ваш заказный голос доступен везде.

Голосовое клонирование воссоздает голос конкретного реального человека с записи. Голосовой дизайн создает совершенно новый синтетический голос из описания. Дизайн быстрее (не нужен звук) и создает уникальные голоса, которые никого не копируют.

Питч (глубоко-высоко), скорость (медленно-быстро), теплое (холодное/профессиональное/теплое/доброе), дыхание (свободное к дыханию), возраст (молодой и престарелым), акцент (американский, британский, австралийский и т.д.) и пол. Вы также можете добавить описание конкретных особенностей.

Свободные счета могут сохранить до 5 предопределений голоса. Планы стартера включают в себя 20 предварительных параметров, а планы Pro включают неограниченные предопределения голоса. Каждый предустановочный параметр хранит полное описание, чтобы вы могли регенерировать точно такой же голос.

Да. Голоса, созданные в студии дизайна, синтетичны и не копируют никого, так что нет вопросов о правах. Qwen3-TTS лицензирована на Apache 2.0, что полностью допускает коммерческое использование.

В настоящее время речевой дизайн работает лучше всего на английском, китайском, японском и корейском языках, по которым прошли обучение языки Qwen3-TTS. По мере появления многоязычных моделей голосового дизайна будет добавлено больше языков.

Да. Студия обеспечивает мгновенный просмотр, когда вы регулируете ползунки. Короткий образец предложения генерируется (1-2 секунды), чтобы вы могли быстро итерировать. После того как вы будете удовлетворены, создайте более длинный текст с выбранным голосом.

Каждое создание голосового дизайна использует стандартное ценообразование (2 x персонажа). Жизненные просмотры используют короткое фиксированное предложение для сведения к минимуму стоимости. Свободные счета начинаются с 15 000 знаков.

Каждые карты ползучего к естественному языковому описанию. Например, слайдер на 80% карты к "высоковысокому голосу". Слайдер на 90% добавляет "теплый, дружелюбный тон". Эти описания объединены в один голосовой профиль, который Qwen3-TTS использует для создания голоса.
5.0/5 (1)

Твоя обратная связь помогает нам решать проблемы.

Готов начать?

Запишитесь бесплатно и получите 15 000 символов.