Надіслати звіт про помилку / запит на можливості

Малювання аудіо AI

Замінити розділ звукового мовлення на синтезований комп' ютер, який відповідає близькому голосу. Виправити невдалу дію без повторного запису всього.

Вільний підпис

Вивантажити аудіо на замальовування

500 символів на секунду відтворення аудіо

Перетягніть і скиньте ваш файл сюди або перегляд

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Параметри малювання

Почати (у секундах)

Кінець (у секундах)

Заміна тексту ⇩ те, що має бути сказано у пропускі 0 / 500 символи

Мова

Crossfade 80 ms Довжина змішування точок. 80 мс - це типова " match- cast" - відчувається природно, без чутного подвійного збільшення.

Вільно підписувати аудіо розмальовування

Як працює аудіозамальовування

Розмальовування - це звукове значення, що відповідає за заповнення контентів Photoshop. Ми клонуємо голос з аудіо, який оточує ваш вибір, синтезуємо новий рядок у цьому голосі, а потім перемішуємо його за допомогою короткої трансфади.

Найкращі результати: залиште принаймні 3 секунди чистого мовлення одразу перед точкою редагування, щоб клонувальник мав добрий довідковий матеріал.

Поради для найкращих результатів

Тримайте позначений діапазон якомога щільнішим ♫ тільки погані
Текст заміни має бути приблизно таким самим, як і заміна
Встановлює мову, яка відповідає звуковому джерелу для кращого пошуку голосів
Зазвичай, 80мс- перехрест є невидимим; удар до 150м, якщо ви чуєте клацання
Для довгих редагуваннях ( >10s), спробуйте перезаписати весь прохід

Як працює аудіозамальовування AI

Хірургічні зміни, відповідники голосу без повторного запису сеансу.

Крок 1

Вивантажити + позначити діапазон

Вивантажити ваш звуковий файл і скористатися засобом для вирізання, щоб позначити початковий/ кінець розділу, який ви бажаєте замінити. Введіть текст заміни.

Крок 2

Клон голосу + Синтезація

Ми витягуємо до 12 секунд чистого звукового запису, який оточує ваш вибір, клонуємо голос промовця і синтезуємо новий рядок цього голосу.

Крок 3

Пластиковий хрестик

Комбінований кліп перемішується з початковим записом з рівним потужним перетином у обох точках редагування. Межі непрозорі.

Плани замальовування аудіо

Запустити вільний, оновити, якщо потрібно більше

Вільно

До 10- хвилинних файлів джерела
Текст заміни 500 символів
Замальовування 4 секунд на запит
80 мс перетинається з кольором
Сервери OpenGore + Cosy Voice 2

Найпоширеніша

Вільний рахунок

До 10- хвилинних файлів джерела
текст заміни 5000 символів
Tunable crossfade (0- 250ms)
Режим " голос "
Створення історії + редагування

Вільний підпис

Pro

До 30- хвилинних файлів джерела
Текст заміни 100 000 символів
Черга пріоритету GPU
Доступ до API (/ v1/ audio- inpaint /)
Пакетне розмальовування (у декількох діапазонах)

Оновити

Часті запитання

Замальовування звуку (також називається перевищенням звукової інформації або мовлення) надасть вам змогу замінити розділ існуючого аудіозапису новою синтезом мовлення, яка відповідає оригінальному голосу. Це звуковий еквівалент контенту Photoshop' s fill ® part над частиною, яку ви не бажаєте, введіть те, що має бути там, а комп' ютер комп' ютер створює безперешкодну заміну.

Позначте діапазон часу, який слід замінити, введіть новий рядок діалогу і натисніть кнопку Замальовувати. Наш комп' ютер комп' ютер клонує голос з звуку, який оточує ваш вибір, синтезує новий рядок у цьому голосі, а потім перемішує його назад до вашого запису за допомогою короткого перехрещення, отже, редагування буде нечутливим.

Використовуйте його, якщо у вас є одне погане слово, помилкова вимова, ім'я ковзання, лайка слово або помилка факту в іншому хорошому прийманні. Записування всього проходу часто представляє тональний невідповідність з рештою проекту ⇩ виправлення тільки те, що потребує виправлення, під час збереження всіх інших складів непошкодженими.

Вільні користувачі можуть замальовувати файли до 10 хвилин. Підписанки можуть замальовувати файли до 30 хвилин. Текст заміни буде позначено 500 символами для вільних користувачів, 5000 - для вільних рахунків і 100 000 - для оплачуваних планів.

Дуже близько. I використовує до 12 секунд звуку, що оточує редагування, як посилання на голос, який достатньо для кожної з моделей, придатних для клонування (Open Voice, CosyGOCT 2) для захоплення тембре, тону і орфографічного стилю промовця. Найкращі результати можна отримати принаймні 3 секунди чистого мовлення одразу перед точкою редагування.

Типово, ми застосували 80 мс рівносильного перетину у обох точках розпірки (головка → заміна і заміна → tail). Ви можете налаштувати цю можливість за допомогою повзунка Crossfade у межах 0 мс (важке вирізання) до 250 мс. Довші перехрещення ховатимуть редагування, але змішають слова на межі.

Втулок для створення звукових файлів збігатиметься з тим самим описом мови, що і під час клонування голосів. Ми автоматично обираємо OpenGore для більшості мов, а для китайської, японської та корейської мов - II. Ви можете перевизначити модель за допомогою додаткових параметрів.

Ви маєте справу з 500 символами на секунду. 4- секундна фіксація 2 000 символів. Ціна не залежить від тривалості тексту заміни, оскільки основний синтез клону буде заблоковано на час виконання нового кліпу, а не на довжину тексту.

У наших термінах служби ви можете лише фарбувати звукові дані, які ви маєте, або мати явні права на редагування. Створення фальшивих лапок, оманливих даних або імітування заборонено. Ми створюємо аудіо- штампи і записуємо всі завдання для перевірки вад.

Вирізання кліпів залишає помітний проміжок між вставленням і диханням; переплетення двох дає листя тонального невідповідність. Замальовування заповнює розрив мовленням, що відповідає близькому голосу, тому слухачі чують безперервний, природний звук.

Так, } POST to / v1/ audiodio- inpaint / з звуковим файлом, start_ sec, end_ sec, and replace_ text. Кінцева точка повертає завдання UID; опитування / v1/ results /? uuid=, щоб отримати зафарбований звук, коли він готовий. Докладніше про це можна дізнатися з документації з API.

Одинадцять Лабів синтезує весь голосовий рядок з нуля. У нашому звуковому розфарбуванні є хірургічна операція: він редагує лише позначений діапазон, всі інші байти вашого початкового запису залишаються незадіяними, а збігатися з новим кліпом до навколишнього голосу, а не з окремою бібліотекою голосу.

5.0/5 (1)

Виправляти свій звук за допомогою секунд

Замінювати будь- яку частину будь- якого запису на синхронізовану мовлення, яка відповідає першому голосу. Підписатися можна і на початку.

Вільний підпис Перегляд Приоритет

Малювання аудіо AI

Вивантажити аудіо на замальовування

Source chise laughs to find the bad pourse

Параметри малювання

Перед (рядок)

Після (Замальовано)

Як працює аудіозамальовування

Поради для найкращих результатів

Як працює аудіозамальовування AI

Вивантажити + позначити діапазон

Клон голосу + Синтезація

Пластиковий хрестик

Плани замальовування аудіо

Часті запитання

Виправляти свій звук за допомогою секунд

Малювання аудіо AI

Вивантажити аудіо на замальовування

Source chise laughs to find the bad pourse

Параметри малювання

Перед (рядок)

Після (Замальовано)

Як працює аудіозамальовування

Поради для найкращих результатів

Як працює аудіозамальовування AI

Вивантажити + позначити діапазон

Клон голосу + Синтезація

Пластиковий хрестик

Плани замальовування аудіо

Часті запитання

Що таке фарбування аудіо?

Як це працює?

Коли слід використовувати звукове розмальовування замість запису?

Скільки часу може бути звуковий код?

Чи буде замальована мова такою ж, як і в оригінального промовця?

Що відбувається на межі редагування?

Які мови підтримуються?

Скільки коштує фарбування аудіо?

Чи можу я використати це, щоб вкласти слова в чиїсь уста, яких вони ніколи не говорили?

Навіщо використовувати фарбування замість вилучення пошкодженого розділу?

Чи доступний програмний інтерфейс для малювання звуку?

Як це співставляється з Одинадцятьма Лабами синтезу мовлення?

Виправляти свій звук за допомогою секунд