Ang AI Audio Inpainting ay isang seryeng manga.

> Palitan ang isang seksyon ng audio na may AI-synthesized na pagsasalita na tumutugma sa nakapalibot na boses. Ayusin ang isang masamang kumuha nang hindi muling naka-record ang buong bagay.

Hindi pa kami may mga boses ng TTS sa iyong wika. Tulungan mo kaming magdagdag ng iyong mga ito! Ibenta ang Iyong Tinig

> I-upload ang Audio sa Inpaint

> 500 mga character sa bawat segundo ng audio na pinalitan

> I-drag & drop ang iyong file dito, o tl> mag-browse

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

tl> file.mp3

0 MB

> Source audio — maghugas upang mahanap ang masamang kumuha

0.00s / 0.00s

Mga Setting ng Inpaint

0 / 500 Mga character
> Gaano katagal upang pagsamahin ang mga puntos splice. 80ms ay ang default — tugma-cuts pakiramdam natural, walang maririnig double-trigger.
> Mag-sign up para sa libreng upang gamitin ang audio inpainting
Pagpipinta ng audio...

> Cloning ang boses at synthesizing ang kapalit...

> Slicing → cloning nakapalibot na boses → splicing sa crossfade
> Pagkuha ng isang habang? Ang iyong resulta ay lilitaw sa iyong > kasaysayan ng henerasyon kapag handa na.
> Inpainted Audio handa

Bago (Original)

Pagkatapos (Ipininta)

> I-download ang Inpainted Audio

> Paano gumagana ang Audio Inpainting

> Inpainting ay ang audio katumbas ng Photoshop ng nilalaman-aware punan. Kami clone ang boses mula sa audio na nakapalibot sa iyong pagpili, synthesize ang bagong linya sa boses na iyon, at splice ito bumalik sa isang maikling crossfade.

> Pinakamahusay na mga resulta: iwanan ang hindi bababa sa3segundo ng malinis na pananalita kaagad bago ang punto ng edit kaya ang cloner ay may magandang reference materyal.

> Mga Tip para sa Pinakamahusay na Resulta

  • > Panatilihin ang minarkahang hanay bilang mahigpit hangga't maaari - lamang ang masamang kumuha
  • > Replacement text ay dapat na humigit-kumulang ang parehong haba bilang kung ano ito ay papalitan
  • > Itakda ang wika upang tumugma sa source audio para sa pinakamahusay na boses tugma
  • > 80ms crossfade ay karaniwang hindi nakikita; bump sa 150ms kung marinig mo ang isang click
  • Para sa mahabang mga edit (> 10s), isaalang-alang ang muling pag-record ng buong pasahe sa halip

Paano gumagana ang AI Audio Inpainting

Ang mga ito ay mga karaniwang mga selula, hindi mga selulang eukaryotiko.

Hakbang 1

> I-upload + Markahan ang hanay

> I-upload ang iyong audio at gamitin ang scrubber upang markahan ang simula / dulo ng seksyon na nais mong palitan. I-type ang teksto ng pagpapalit.

Hakbang 2

> Voice Clone + synthesize

> Namin i-extract hanggang sa 12 segundo ng malinis na reference audio nakapalibot sa iyong pagpili, clone ang boses ng tagapagsalita, at synthesize ang bagong linya sa boses na iyon.

Hakbang 3

Mga crossfade splice

> Ang synthesized clip ay spliced sa orihinal na pag-record na may isang pantay-power crossfade sa parehong mga puntos ng edit. Ang mga hangganan ay hindi maririnig.

> Audio Inpainting Plano

> Magsimula nang libre, i-upgrade kapag kailangan mo ng higit pa

Libre
  • > Hanggang sa 10-minuto na mga file ng pinagmulan
  • > 500-karakter na teksto ng pagpapalit
  • >4na segundo inpaint bawat kahilingan
  • > 80ms crossfade splice
  • Ang 2Cosmo ay isang seryeng manga.
Karamihan Popular
Libreng Account
  • > Hanggang sa 10-minuto na mga file ng pinagmulan
  • > 5,000-karakter na teksto ng pagpapalit
  • > Tunable crossfade (0-250ms)
  • > Voice-modelo ng pag-override
  • > Generation kasaysayan + muling i-edit
Mag-sign up para sa libreng
Pro
  • > Hanggang sa 30-minuto na mga file ng pinagmulan
  • > 100,000-karakter na teksto ng pagpapalit
  • < Prioridad GPU queue
  • > API access (/v1/audio-inpaint/)
  • > Batching inpainting (maramihang mga hanay)
I-upgrade

Mga Madalas Itanong

Ang inpainting ng audio (tinatawag ding audio fill o speech overdub) ay nagbibigay-daan sa iyo na palitan ang isang bahagi ng isang umiiral na pag-record ng audio ng bagong AI-synthesized na pagsasalita na tumutugma sa orihinal na boses. Ito ang audio na katumbas ng content-aware fill ng Photoshop — pinturahan ang bahaging hindi mo gusto, i-type kung ano ang dapat na nasa lugar, at ang AI ay bumubuo ng isang walang putol na pagpapalit.

> I-mark ang oras na hanay upang palitan, i-type ang bagong linya ng dialogue, at i-click ang Inpaint. Ang aming AI clones ang boses mula sa audio na nakapalibot sa iyong pagpili, synthesizes ang bagong linya sa boses na iyon, at splices ito pabalik sa iyong pag-record sa isang maikling crossfade kaya ang edit ay hindi maririnig.

> Gamitin ito kapag mayroon kang isang solong masamang salita, maling pagsasalita, pangalan slip, pangako salita, o katotohanan error sa isang kung hindi man-mabuti kumuha. Re-recording ang buong talata madalas na nagpasimula tonal hindi pagkakatugma sa natitirang bahagi ng proyekto - inpainting ayusin lamang kung ano ang kailangang ayusin habang pinapanatili ang bawat iba pang mga syllable intact.

Ang mga subscriber ay maaaring mag-inpaint ng mga file hanggang sa 30 minuto. Ang tekstong palitan mismo ay may limitasyon na 500 character para sa mga libreng user, 5,000 para sa mga libreng account, at 100,000 para sa mga bayad na plano.

> Malapit. Ginagamit ng AI ang hanggang sa 12 segundo ng audio na nakapalibot sa edit bilang isang reference ng boses, na sapat para sa anumang ng aming mga modelo na may kakayahang cloning (OpenVoice, CosyVoice 2) upang makuha ang timbre ng tagapagsalita, pitch, at estilo ng pagsasalita. Para sa pinakamahusay na mga resulta, iwanan ang hindi bababa sa3segundo ng malinis na pagsasalita kaagad bago ang punto ng edit.

> Ilalapat namin ang isang 80ms pantay-power crossfade sa parehong mga puntos splice (head→replacement at replacement→tail) sa pamamagitan ng default. Maaari mong i-tune ito mula sa 0ms (hard cut) hanggang sa 250ms sa pamamagitan ng Crossfade slider.

> Ang inpainting ng audio ay sumusunod sa parehong coverage ng wika tulad ng cloning ng boses. Awtomatikong pinili namin ang OpenVoice para sa karamihan ng mga wika at CosyVoice2para sa Intsik, Hapon, at Koreano. Maaari mong i-override ang modelo sa mga advanced na setting.

Ang isang4na segundo na pag-aayos ay nagkakahalaga ng 2,000 mga character. Ang gastos ay independiyenteng kung gaano katagal ang teksto ng pagpapalit ay, dahil ang pangunahing klon synthesis ay gated sa pamamagitan ng run time ng bagong clip, hindi ang haba ng teksto.

> Ayon sa aming Mga Tuntunin ng Serbisyo, maaari mo lamang inpaint audio na iyong pag-aari o may malinaw na pahintulot upang i-edit. pagbuo ng mga pekeng quotes, mapanlinlang na nilalaman, o impersonations ay ipinagbabawal. Kami watermark binuo audio at mag-log ng lahat ng inpainting trabaho para sa pagsusuri ng pang-aabuso.

> Ang pag-cut ng isang clip ay nag-iiwan ng isang makikitang puwang sa pacing at paghinga; ang cross-fading ng dalawang takes ay nag-iiwan ng isang tonal mismatch. Ang inpainting ay pinupuno ang puwang sa pagsasalita na tumutugma sa nakapalibot na boses, kaya naririnig ng mga tagapakinig ang patuloy na, natural na tunog na audio.

> Oo — POST sa /v1/audio-inpaint/ na may audio file, start_sec, end_sec, at replacement_text. Ang endpoint ay nagbabalik ng isang trabaho UUID; poll /v1/speech/results/?uuid= upang mabawi ang inpainted audio kapag handa. Tingnan ang API docs para sa mga detalye.

Ang aming audio inpainting ay surgical: ito ay nag-e-edit lamang ng mga markadong hanay, pinapanatili ang bawat iba pang byte ng iyong orihinal na pag-record na hindi nababago, at tumutugma sa bagong clip sa nakapalibot na boses sa halip na isang hiwalay na boses library.
5.0/5 (1)

> Ano ang maaari naming mapabuti? Tutulong sa amin ang iyong feedback na ayusin ang mga isyu.

> Ayusin ang iyong Audio sa mga segundo

> Palitan ang anumang bahagi ng anumang pag-record sa AI-synthesized na pagsasalita na tumutugma sa orihinal na boses. Mag-sign up nang libre upang magsimula.