AI Audio Information ingraphing

Заменить часть звука на AI-синтезированную речь, которая совпадает с окружающим голосом.

Загрузить звук в инкраску

500 символов в секунду замены звука

Перетащите свой файл здесь, или Просмотр

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

файл mp3

0 MB

Источник звука — чистка, чтобы найти плохое решение

0.00s / 0.00s

Параметры краски

0 / 500 символы
Как долго можно смешать точки скрещивания. 80 мс - это по умолчанию — совпадающие отрубы чувствуют себя естественными, без звукового двойного трюка.
Подпишитесь свободно, чтобы использовать аудио-вкрашивание
Покраска звука...

Клонирование голоса и синтезирование замены...

Порезать β клонирование вокруг голоса · скрещивание с крестом
Твой результат появится в твоем доме. история поколения когда будет готова.
Готовность к раскраске звука

До (Подлинный текст на английском языке)

После (вкрашен)

Загрузка вкрашенного звука

Как работает звуковая икраска

Мы клонируем голос из звука, окружающего ваш выбор, синтезируем новую линию в этом голосе и скручиваем его короткой перекрестной фазой.

Лучшие результаты: оставить не менее трех секунд чистой речи непосредственно перед точкой редактирования, с тем чтобы клонер имел хороший справочный материал.

Рекомендации в отношении наилучших результатов

  • Держите помеченную дистанцию как можно теснее — только плохое взятие
  • Текст для замены должен быть примерно таким же, как и текст для замены.
  • Установите язык, соответствующий исходному звуку для лучшего голосового матча
  • Прыжок 80 мс с перекрестком обычно невидим; скачок до 150 мс, если вы слышите щелчок
  • Для длинных редактирования (>10s) вместо этого рассмотреть возможность перезаписать весь отрывок

Как работает звуковая икраска AI

Хирургические редактирование, голосовое сопоставление, без перезаписи.

Этап 1

Загрузка + диапазон отметки

Загрузить звук и использовать скруббер, чтобы отметить начало/конец раздела, который вы хотите заменить. Введите текст для замены.

Шаг 2

Голосовой клон + синтез

Мы извлекаем до 12 секунд чистого эталонного звука вокруг вашего выбора, клонируем голос оратора и синтезируем новую строку в этом голосе.

Шаг 3

Кроссфейд Сплис

Синхронизированный клип сворачивается в оригинальную запись с помощью перекрестка равной мощности в обоих точках редактирования. Границы неразборчивы.

Планы ввода аудиоматериалов

Начать бесплатно, обновить, когда нужно больше

Свободные
  • До 10 минут исходных файлов
  • Текст для замены 500 символов
  • 4-секундная краска на каждую просьбу
  • 80 мс перекрёстная скоба
  • OpenVoice + CosyVoice 2
Самые популярные
Свободный счет
  • До 10 минут исходных файлов
  • Текст для замены 5000 символов
  • Туманный перекресток (0-250 мс)
  • Переключение голосовой модели
  • История поколения + перередактирование
Не подписываться
Про
  • До 30-минутных исходных файлов
  • Текст для замены 100 000 символов
  • Приоритетная очередь GPU
  • Доступ к API (/v1/audio-inpaint/)
  • Покраска партии (множественные диапазоны)
Модернизация

Часто задаваемые вопросы

Аудиовизна (также называемая аудиозаполнением или перекраской речи) позволяет заменить часть существующей аудиозаписи новой синтетической речью, которая соответствует первоначальному голосу. Это аудиоэквивалент контент-заполнения Photoshop — краска над частью, которую вы не хотите, введите то, что должно быть там, и AI создаёт бесперебойную замену.

Отметьте диапазон времени для замены, введите новую линию диалога и нажмите Incraint. Наша AI клонирует голос из звука, окружающего ваш выбор, синтезирует новую линию в этом голосе и сжимает ее обратно в вашу запись коротким кроссвордом, так что редактирование неразборчиво.

Используйте его, когда у вас есть одно плохое слово, неправильное произношение, имя, ругательство или ошибка в фактах в иных выгодах. Перезапись всего отрывка часто приводит к тональному несоответствию с остальной частью проекта — краска исправляет только то, что нужно исправить, сохраняя при этом все другие слогалы неповрежденными.

Свободные пользователи могут раскрасить файлы в течение 10 минут. Подписчики могут раскрасить файлы в течение 30 минут. Сам текст для замены установлен на 500 символов для бесплатных пользователей, 5 000 для бесплатных счетов и 100 000 для оплачиваемых планов.

Очень близко. МА использует до 12 секунд звука вокруг редактирования в качестве ссылки на голос, что достаточно для любой из наших моделей, способных к клонированию (OpenVoice, CosyVoice 2), чтобы запечатлеть Тимбре, стиль выступления и стиль речи. Для наилучших результатов оставьте не менее 3 секунд чистой речи непосредственно перед точкой редактирования.

Мы нажимаем на обе точки сплытия (голова __ замещаю и заменяем Δхай) с частотой 80 мс по умолчанию. Вы можете настроить это от 0 мс (жесткий отруб) до 250 мс через раздвижник Crossfade. Более длинные поперечные фасады более тщательно скрывают редактирование, но могут смешать переплетающиеся слова на границе.

Аудиовизуальное инкрафтирование происходит на том же языке, что и клонирование голоса. Мы автоматически выбираем OpenVoice для большинства языков и CosyVoice 2 для китайского, японского и корейского языков. Вы можете обойти модель в передовых параметрах.

Вы заряжены 500 символов в секунду заменяемого звука. 4-секундная фиксация стоит 2 000 символов. Стоимость не зависит от продолжительности заменяющего текста, так как основной синтез клонов встроен во время запуска нового клипа, а не длины текста.

Согласно нашим терминам обслуживания, вы можете рисовать только звук, которым владеете, или иметь явное разрешение на редактирование. Создание фальшивых цитат, обманного контента или вымышленного лица запрещено. Мы помечаем звук и регистрируем все работы для просмотра злоупотреблений.

Обрезание клипа оставляет заметный пробел в щупании и дыхании; перекрещивание двух листьев делает тональное несоответствие. Вкрашивание заполняет пробел речью, которая совпадает с окружающим голосом, поэтому слушатели слышат непрерывный, естественно звучащий звук.

Да — POST — /v1/audio-inpaint/ с аудиофайлом, началом_sec, концом_sec и заменой_текстом. Конечный пункт возвращает работу UUID; опрос /v1/speech/результаты/?uuuuid=, чтобы получить вкрашенный звук, когда он будет готов. Подробнее см. API docs.

11Labs Говорение-Speech регенерирует всю голосовую линию с нуля в голосе цели. Наша звуковая покраска является хирургической: она редактирует только помеченный диапазон, сохраняет каждый другой байт вашей оригинальной записи нетронутым и совпадает с новым клипом с окружающим голосом, а не с отдельной голосовой библиотекой.
5.0/5 (1)

Твоя обратная связь помогает нам решать проблемы.

Исправь звук в секундах

Заменить любую часть любой записи на AI-синтезированную речь, которая соответствует первоначальному голосу. Запишитесь свободно для начала.