AI- аўдыё- маляванне

Замяніць частку гуку на сінтэзаваную штучным інтэлектам мову, якая адпавядае навакольнаму голасу. Выправіць няправільны запіс без перазапісу ўсяго.

Перазапісаць файл?

500 знакаў на секунду замены гуку

Перацягніце файл сюды, або прагляд

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

файл.mp3

0 MB

Крыніца гуку - чыстка для пошуку няправільнага здымак

0.00s / 0.00s

Настаўленні малюнка

0 / 500 сімвалы
Колькі часу трэба для перамешвання кропак злучэння. Па змаўчанні 80 мілісекундаў - падобныя перарэзкі выглядаюць натуральна, няма гукавога падвойнага трыгера.
Зарэгіструйцеся бясплатна, каб выкарыстоўваць аўдыё-малюнак
Накладанне гуку...

Клонаванне голасу і сінтэзаванне замены...

Сістэма вымярэння даўжыні жыцця на аснове вымярэння даўжыні жыцця
Заняло шмат часу? Вашы вынікі з' явяцца ў вашым рахунку Выдаліць спіс калі гатовы.
Name=Праграма для стварэння аўдыё

Да (пачатковага)

Пасля (пафарбаваны)

Сцягнуць

Як працуе аўдыё- маляванне

Інмайнтынгу - гэта аўдыёэквівалент запаўнення з улікам зместу ў Photoshop. Мы клануем голас з аўдыё, што акружае ваш выбар, сінтэзуем новы радок у гэтым голасу і злучаем яго зноў з кароткім пераходам.

Найлепшыя вынікі: пакіньце не менш за 3 секунды чыстай мовы непасрэдна перад кропкай рэдагавання, каб клонер меў добры матэрыял для спасылкі.

Парады для лепшых вынікаў

  • Захоўваць вылучаны дыяпазон як мага больш сціснутым - толькі няправільныя кадры
  • Тэкст замены павінен быць даўжынёй прыкладна роўнай даўжыні тэкст, які ён заменіць
  • Вызначыць мову, якая адпавядае зыходнаму гуку для найлепшага адпаведнасці голасу
  • 80- мільсекунднае пераходнае знікненне звычайна не бачна; пераключыцеся на 150- мільсекунднае, калі чуеце клік
  • Для доўгіх рэдагаванняў (> 10 сек.) перазапісваць увесь тэкст

Як працуе AI Audio Inpainting

Усе тэксты, акрамя тэкстаў, якія не звязаны з фільмам.

Крок 1

Перазапісаць файл?

Загрузіце свой гукавы файл і скарыстайцеся сканерам, каб пазначыць пачатак/ канец раздзела, які вы хочаце замяніць. Увядзіце тэкст замены.

Крок 2

Клон голасу і сінтэзатарName

Мы выцягваем да 12 секундаў чыстай аўдыё-рэферэнцыі вакол вашага выбару, клануем голас гаворцы і сінтэзуем новы радок у гэтым голасе.

Крок 3

Зліванне

Сінтэзаваны кліп злучаецца з арыгінальным запісам з пераходам у аднолькавай сіле ў абедзвюх кропках рэдагавання. Граніца не чуецца.

Планы апрацоўкі гуку

Пачаць бясплатна, абнавіць, калі спатрэбіцца больш

Вольна
  • Да 10- х хвілінных файлаў
  • Тэкст замены 500 знакаў
  • 4- секундная маляванне на запыт
  • Злучэнне пераходаў 80 мкс
  • Comment=Праграма для працы з файламі
Самыя папулярныя
Вольны рахунак
  • Да 10- х хвілінных файлаў
  • Тэкст замены 5000 знакаў
  • Наладжвальнае перацяканне (0- 250 мс)
  • Пераключэнне мадэлі голасу
  • Генераваць гісторыю і зноў рэдагаваць
Падпісацца бясплатна
Прафесійны
  • Да 30 хвілін
  • Тэкст замены 100 000 знакаў
  • Чарга прыярытэтнага GPU
  • Даступ да API (/v1/audio-inpaint/)
  • Пакетная маляванне (некалькі дыяпазонаў)
Абнавіць

Частыя пытанні

Аўдыё- запаўненне (таксама званае аўдыёзапоўненне або перазапіс гучання) дазваляе вам замяніць частку існуючага гукавога запісу новым сінтэзаваным машынным голасам, які адпавядае арыгінальнаму голасу. Гэта гукавы эквівалент Photoshop- актыўнага запаўнення - перакрыйце частку, якую вы не хочаце, напішыце тое, што павінна быць, і машынны голас бяспечна замяніць яе.

Пазначце час, які трэба замяніць, увядзіце новы радок дыялогу і націсніце кнопку Намаліць. Наш машынны інтэлект скапіруе голас з аўдыё, што акружае ваш выбар, сінтэзуе новы радок у гэтым голасе і злучае яго з вашым запісам з кароткім пераходам, так што рэдагаванне будзе нечутым.

Выкарыстоўвайце гэта, калі ў вашым тэксце ёсць памылка ў вымаўленні, неправільнае слова, неправільнае імя, неправільнае слова ці памылка ў фактах. Перазапіс усяго тэкстовага паслання часта прыводзіць да тональнага неадпаведнасці з астатняй часткай праекта - устаўка выпраўляе толькі тое, што трэба выправіць, і пакідае ўсе іншыя склады нязменным.

Бездакорныя карыстальнікі могуць маляваць файлы даўжынёй да 10 хвілін. Падпісчыкі могуць маляваць файлы даўжынёй да 30 хвілін. Сам тэкст замены абмежаваны 500 знакамі для бясплатных карыстальнікаў, 5000 для бясплатных рахункаў і 100 000 для платных.

Вельмі блізка. АНІ выкарыстоўвае да 12 секундаў гуку вакол рэдагавання як голасную спасылку, якой дастаткова для любой з нашых мадэляў з магчымасцю клонавання (OpenVoice, CosyVoice 2) для захопу гуку, тону і стылю гаворкі гаворкі. Для лепшых вынікаў пакіньце прыблізна 3 секунды чыстага гуку перад кропкай рэдагавання.

Па змаўчанні мы выкарыстоўваем 80- мілісекундавае перацяканне з роўнай сілай на абодвух кропках злучэння (глава→замена і замена→хвост). Вы можаце настроіць гэта ад 0 мілісекундаў (цяжкае злучэнне) да 250 мілісекундаў з дапамогай палітара перацякання. Доўгія перацяканні больш дакладна схуюць змены, але могуць гучна перамешваць перакрываючыяся словы на мяжы.

Аўдыё- ўвасабленне выконвае тое ж самае моўнае пакрыццё, што і клонаванне голасу. Мы аўтаматычна выбіраем OpenVoice для большасці моў і CosyVoice 2 для кітайскай, японскай і карэйскай. Вы можаце перапісаць гэты мадэлі ў дадатковых наладах.

Вы плаціце 500 знакаў за секунду замены гуку. 4- секундная замена каштуе 2000 знакаў. Кошт не залежыць ад даўжыні замены тэксту, бо падставовы сінтэз клонаў вызначаецца часом выканання новага клёна, а не даўжынёй тэксту.

Згодна з умовамі выкарыстання, вы можаце ўкладваць толькі аўдыё, якое вам належыць або вы маеце дазвол на яго рэдагаванне. Выкарыстанне фальшывых цытаванняў, падманутых зместаў ці падманутых асобаў забаронена. Мы ставім вадзяны знак на створаны аўдыё і запісваем усе задання ўкладвання для праверкі на злоўжыванне.

Выразанне клипов пакідае заўважны прабел у тэмпе і дыханні; перакрыжаванне двух запісаў пакідае тональнае неадпаведнасць. Устаўка запаўняе прабел размовай, якая адпавядае вакол галасу, так што слухачы чуюць неперарывісты, натуральна гучны гук.

Так — POST у /v1/audio-inpaint/ з аўдыёфайлам, start_sec, end_sec і replacement_text. Канечная кропка вяртае UUID задання; запыт /v1/speech/results/?uuid= для атрымання напісанага аўдыё, калі гэта гатова. Падрабязнасці глядзіце ў дакументацыі API.

Праграма ElevenLabs Speech-to-Speech рэгенеруе ўсю галасавую лінію з нуля ў мэтавы голас. Наша анімацыйная апрацоўка гуку хірургічная: яна рэдагуе толькі вылучаныя дыяпазоны, захоўвае кожны другі байт вашага першапачатковага запісу некранутым і адпавядае новаму кліпу з навакольным голасам, а не з асобнай бібліятэкай голасаў.
5.0/5 (1)

Што мы можам палепшыць? Ваша ацэнка дапаможа нам выправіць праблемы.

Выпраўце свой гук за некалькі секунд

Замяніць любую частку любога запісу на сінтэзаваную штучным інтэлектам мову, якая адпавядае арыгінальнаму голасу. Зарэгіструйцеся бясплатна, каб пачаць.