Доклад " Bugg " / " Особенности запроса "

AI Audio Information ingraphing

Заменить часть звука на AI-синтезированную речь, которая совпадает с окружающим голосом.

Не подписываться

Загрузить звук в инкраску

500 символов в секунду замены звука

Перетащите свой файл здесь, или Просмотр

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Параметры краски

Запуск (секунды)

Конец (секунды)

Текст замены — что следует сказать в пробеле 0 / 500 символы

Язык

Кроссфад 80 ms Как долго можно смешать точки скрещивания. 80 мс - это по умолчанию — совпадающие отрубы чувствуют себя естественными, без звукового двойного трюка.

Подпишитесь свободно, чтобы использовать аудио-вкрашивание

Как работает звуковая икраска

Мы клонируем голос из звука, окружающего ваш выбор, синтезируем новую линию в этом голосе и скручиваем его короткой перекрестной фазой.

Лучшие результаты: оставить не менее трех секунд чистой речи непосредственно перед точкой редактирования, с тем чтобы клонер имел хороший справочный материал.

Как работает звуковая икраска AI

Хирургические редактирование, голосовое сопоставление, без перезаписи.

Этап 1

Загрузка + диапазон отметки

Загрузить звук и использовать скруббер, чтобы отметить начало/конец раздела, который вы хотите заменить. Введите текст для замены.

Шаг 2

Голосовой клон + синтез

Мы извлекаем до 12 секунд чистого эталонного звука вокруг вашего выбора, клонируем голос оратора и синтезируем новую строку в этом голосе.

Шаг 3

Кроссфейд Сплис

Синхронизированный клип сворачивается в оригинальную запись с помощью перекрестка равной мощности в обоих точках редактирования. Границы неразборчивы.

Планы ввода аудиоматериалов

Начать бесплатно, обновить, когда нужно больше

Свободные

До 10 минут исходных файлов
Текст для замены 500 символов
4-секундная краска на каждую просьбу
80 мс перекрёстная скоба
OpenVoice + CosyVoice 2

Самые популярные

Свободный счет

До 10 минут исходных файлов
Текст для замены 5000 символов
Туманный перекресток (0-250 мс)
Переключение голосовой модели
История поколения + перередактирование

Не подписываться

Про

До 30-минутных исходных файлов
Текст для замены 100 000 символов
Приоритетная очередь GPU
Доступ к API (/v1/audio-inpaint/)
Покраска партии (множественные диапазоны)

Модернизация

Часто задаваемые вопросы

Аудиовизна (также называемая аудиозаполнением или перекраской речи) позволяет заменить часть существующей аудиозаписи новой синтетической речью, которая соответствует первоначальному голосу. Это аудиоэквивалент контент-заполнения Photoshop — краска над частью, которую вы не хотите, введите то, что должно быть там, и AI создаёт бесперебойную замену.

Отметьте диапазон времени для замены, введите новую линию диалога и нажмите Incraint. Наша AI клонирует голос из звука, окружающего ваш выбор, синтезирует новую линию в этом голосе и сжимает ее обратно в вашу запись коротким кроссвордом, так что редактирование неразборчиво.

Используйте его, когда у вас есть одно плохое слово, неправильное произношение, имя, ругательство или ошибка в фактах в иных выгодах. Перезапись всего отрывка часто приводит к тональному несоответствию с остальной частью проекта — краска исправляет только то, что нужно исправить, сохраняя при этом все другие слогалы неповрежденными.

Свободные пользователи могут раскрасить файлы в течение 10 минут. Подписчики могут раскрасить файлы в течение 30 минут. Сам текст для замены установлен на 500 символов для бесплатных пользователей, 5 000 для бесплатных счетов и 100 000 для оплачиваемых планов.

Очень близко. МА использует до 12 секунд звука вокруг редактирования в качестве ссылки на голос, что достаточно для любой из наших моделей, способных к клонированию (OpenVoice, CosyVoice 2), чтобы запечатлеть Тимбре, стиль выступления и стиль речи. Для наилучших результатов оставьте не менее 3 секунд чистой речи непосредственно перед точкой редактирования.

Мы нажимаем на обе точки сплытия (голова __ замещаю и заменяем Δхай) с частотой 80 мс по умолчанию. Вы можете настроить это от 0 мс (жесткий отруб) до 250 мс через раздвижник Crossfade. Более длинные поперечные фасады более тщательно скрывают редактирование, но могут смешать переплетающиеся слова на границе.

Аудиовизуальное инкрафтирование происходит на том же языке, что и клонирование голоса. Мы автоматически выбираем OpenVoice для большинства языков и CosyVoice 2 для китайского, японского и корейского языков. Вы можете обойти модель в передовых параметрах.

Вы заряжены 500 символов в секунду заменяемого звука. 4-секундная фиксация стоит 2 000 символов. Стоимость не зависит от продолжительности заменяющего текста, так как основной синтез клонов встроен во время запуска нового клипа, а не длины текста.

Согласно нашим терминам обслуживания, вы можете рисовать только звук, которым владеете, или иметь явное разрешение на редактирование. Создание фальшивых цитат, обманного контента или вымышленного лица запрещено. Мы помечаем звук и регистрируем все работы для просмотра злоупотреблений.

Обрезание клипа оставляет заметный пробел в щупании и дыхании; перекрещивание двух листьев делает тональное несоответствие. Вкрашивание заполняет пробел речью, которая совпадает с окружающим голосом, поэтому слушатели слышат непрерывный, естественно звучащий звук.

Да — POST — /v1/audio-inpaint/ с аудиофайлом, началом_sec, концом_sec и заменой_текстом. Конечный пункт возвращает работу UUID; опрос /v1/speech/результаты/?uid=, чтобы получить вкрашенный звук, когда он будет готов. Подробнее см. API docs.

11Labs Говорение-Speech регенерирует всю голосовую линию с нуля в голосе цели. Наша звуковая покраска является хирургической: она редактирует только помеченный диапазон, сохраняет каждый другой байт вашей оригинальной записи нетронутым и совпадает с новым клипом с окружающим голосом, а не с отдельной голосовой библиотекой.

5.0/5 (1)

Исправь звук в секундах

Заменить любую часть любой записи на AI-синтезированную речь, которая соответствует первоначальному голосу. Запишитесь свободно для начала.

Не подписываться Вид Ценообразование

AI Audio Information ingraphing

Загрузить звук в инкраску

Источник звука — чистка, чтобы найти плохое решение

Параметры краски

До (Подлинный текст на английском языке)

После (вкрашен)

Как работает звуковая икраска

Рекомендации в отношении наилучших результатов

Как работает звуковая икраска AI

Загрузка + диапазон отметки

Голосовой клон + синтез

Кроссфейд Сплис

Планы ввода аудиоматериалов

Часто задаваемые вопросы

Исправь звук в секундах

AI Audio Information ingraphing

Загрузить звук в инкраску

Источник звука — чистка, чтобы найти плохое решение

Параметры краски

До (Подлинный текст на английском языке)

После (вкрашен)

Как работает звуковая икраска

Рекомендации в отношении наилучших результатов

Как работает звуковая икраска AI

Загрузка + диапазон отметки

Голосовой клон + синтез

Кроссфейд Сплис

Планы ввода аудиоматериалов

Часто задаваемые вопросы

Что такое звуковая краска?

Как это работает?

Когда я должен использовать звукозапись вместо перезаписи?

Как долго может быть источник звука?

Будет ли эта накрашенная речь звучать точно так же, как и оригинальный оратор?

Что происходит на границах редактирования?

Какие языки поддерживаются?

Сколько стоит покраска аудио?

Могу я использовать это, чтобы вставить слова в чей-то рот, которого они никогда не говорили?

Почему вместо того, чтобы просто удалить плохую секцию, нужно красить?

А аудио-покраска API доступна?

Как это сравнивается с 11Labs Start-to-Speech?

Исправь звук в секундах