Iulat ang Bug / Feature Request

Ang AI Audio Inpainting ay isang seryeng manga.

Palitan ang isang seksyon ng audio na may AI-synthesized na pagsasalita na tumutugma sa nakapalibot na boses. Ayusin ang isang masamang kumuha nang hindi muling naka-record ang buong bagay.

Mag-sign up para sa libreng

Hindi pa kami may mga boses ng TTS sa iyong wika. Tulungan mo kaming magdagdag ng iyong mga ito! Ibenta ang Iyong Tinig

I-upload ang Audio sa Inpaint

500 mga character sa bawat segundo ng audio na pinalitan

I-drag & drop ang iyong file dito, o mag-browse

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Mga Setting ng Inpaint

Simula (segundo)

End (segundo)

Pagpapalit ng teksto — kung ano ang dapat sabihin sa puwang 0 / 500 Mga character

Wika

Crossfade 80 ms Gaano katagal upang pagsamahin ang mga puntos splice. 80ms ay ang default — tugma-cuts pakiramdam natural, walang maririnig double-trigger.

Mag-sign up para sa libreng upang gamitin ang audio inpainting

Paano gumagana ang Audio Inpainting

Inpainting ay ang audio katumbas ng Photoshop ng nilalaman-aware punan. Kami clone ang boses mula sa audio na nakapalibot sa iyong pagpili, synthesize ang bagong linya sa boses na iyon, at splice ito bumalik sa isang maikling crossfade.

Pinakamahusay na mga resulta: iwanan ang hindi ba sa3segundo ng malinis na pananalita kaagad bago ang punto ng edit kaya ang cloner ay may magandang reference materyal.

Mga Tip para sa Pinakamahusay na Resulta

Panatilihin ang minarkahang hanay bilang mahigpit hangga't maaari - lamang ang masamang kumuha
Replacement text ay dapat na humigit-kumulang ang parehong haba bilang kung ano ito ay papalitan
Itakda ang wika upang tumugma sa source audio para sa pinakamahusay na boses tugma
80ms crossfade ay karaniwang hindi nakikita; bump sa 150ms kung marinig mo ang isang click
Para sa mahabang mga edit (> 10s), isaalang-alang ang muling pag-record ng buong pasahe sa halip

Paano gumagana ang AI Audio Inpainting

Ang mga ito ay mga karaniwang mga selula, hindi mga selulang eukaryotiko.

Hakbang 1

I-upload + Markahan ang hanay

I-upload ang iyong audio at gamitin ang scrubber upang markahan ang simula / dulo ng seksyon na nais mong palitan. I-type ang teksto ng pagpapalit.

Hakbang 2

Voice Clone + synthesize

Namin i-extract hanggang sa 12 segundo ng malinis na reference audio nakapalibot sa iyong pagpili, clone ang boses ng tagapagsalita, at synthesize ang bagong linya sa boses na iyon.

Hakbang 3

Mga crossfade splice

Ang synthesized clip ay spliced sa orihinal na pag-record na may isang pantay-power crossfade sa parehong mga puntos ng edit. Ang mga hangganan ay hindi maririnig.

Audio Inpainting Plano

Magsimula nang libre, i-upgrade kapag kailangan mo ng higit pa

Libre

Hanggang sa 10-minuto na mga file ng pinagmulan
500-karakter na teksto ng pagpapalit
4na segundo inpaint bawat kahilingan
80ms crossfade splice
Ang 2Cosmo ay isang seryeng manga.

Karamihan Popular

Libreng Account

Hanggang sa 10-minuto na mga file ng pinagmulan
5,000-karakter na teksto ng pagpapalit
Tunable crossfade (0-250ms)
Voice-modelo ng pag-override
Generation kasaysayan + muling i-edit

Mag-sign up para sa libreng

Pro

Hanggang sa 30-minuto na mga file ng pinagmulan
100,000-karakter na teksto ng pagpapalit
< Prioridad GPU queue
API access (/v1/audio-inpaint/)
Batching inpainting (maramihang mga hanay)

I-upgrade

Mga Madalas Itanong

Ang inpainting ng audio (tinatawag ding audio fill o speech overdub) ay nagbibigay-daan sa iyo na palitan ang isang bahagi ng isang umiiral na pag-record ng audio ng bagong AI-synthesized na pagsasalita na tumutugma sa orihinal na boses. Ito ang audio na katumbas ng content-aware fill ng Photoshop — pinturahan ang bahaging hindi mo gusto, i-type kung ano ang dapat na nasa lugar, at ang AI ay bumubuo ng isang walang putol na pagpapalit.

I-mark ang oras na hanay upang palitan, i-type ang bagong linya ng dialogue, at i-click ang Inpaint. Ang aming AI clones ang boses mula sa audio na nakapalibot sa iyong pagpili, synthesizes ang bagong linya sa boses na iyon, at splices ito pabalik sa iyong pag-record sa isang maikling crossfade kaya ang edit ay hindi maririnig.

Gamitin ito kapag mayroon kang isang solong masamang salita, maling pagsasalita, pangalan slip, pangako salita, o katotohanan error sa isang kung hindi man-mabuti kumuha. Re-recording ang buong talata madalas na nagpasimula tonal hindi pagkakatugma sa natitirang bahagi ng proyekto - inpainting ayusin lamang kung ano ang kailangang ayusin habang pinapanatili ang bawat iba pang mga syllable intact.

Ang mga subscriber ay maaaring mag-inpaint ng mga file hanggang sa 30 minuto. Ang tekstong palitan mismo ay may limitasyon na 500 character para sa mga libreng user, 5,000 para sa mga libreng account, at 100,000 para sa mga bayad na plano.

Malapit. Ginagamit ng AI ang hanggang sa 12 segundo ng audio na nakapalibot sa edit bilang isang reference ng boses, na sapat para sa anumang ng aming mga modelo na may kakayahang cloning (OpenVoice, CosyVoice 2) upang makuha ang timbre ng tagapagsalita, pitch, at estilo ng pagsasalita. Para sa pinakamahusay na mga resulta, iwanan ang hindi ba sa3segundo ng malinis na pagsasalita kaagad bago ang punto ng edit.

Ilalapat namin ang isang 80ms pantay-power crossfade sa parehong mga puntos splice (head→replacement at replacement→tail) sa pamamagitan ng default. Maaari mong i-tune ito mula sa 0ms (hard cut) hanggang sa 250ms sa pamamagitan ng Crossfade slider.

Ang inpainting ng audio ay sumusunod sa parehong coverage ng wika tulad ng cloning ng boses. Awtomatikong pinili namin ang OpenVoice para sa karamihan ng mga wika at CosyVoice2para sa Intsik, Hapon, at Koreano. Maaari mong i-override ang modelo sa mga advanced na setting.

Ang isang4na segundo na pag-aayos ay nagkakahalaga ng 2,000 mga character. Ang gastos ay independiyenteng kung gaano katagal ang teksto ng pagpapalit ay, dahil ang pangunahing klon synthesis ay gated sa pamamagitan ng run time ng bagong clip, hindi ang haba ng teksto.

Ayon sa aming Mga Tuntunin ng Serbisyo, maaari mo lamang inpaint audio na iyong pag-aari o may malinaw na pahintulot upang i-edit. pagbuo ng mga pekeng quotes, mapanlinlang na nilalaman, o impersonations ay ipinagbabawal. Kami watermark binuo audio at mag-log ng lahat ng inpainting trabaho para sa pagsusuri ng pang-aabuso.

Ang pag-cut ng isang clip ay nag-iiwan ng isang makikitang puwang sa pacing at paghinga; ang cross-fading ng dalawang takes ay nag-iiwan ng isang tonal mismatch. Ang inpainting ay pinupuno ang puwang sa pagsasalita na tumutugma sa nakapalibot na boses, kaya naririnig ng mga tagapakinig ang patuloy na, natural na tunog na audio.

Oo — POST sa /v1/audio-inpaint/ na may audio file, start_sec, end_sec, at replacement_text. Ang endpoint ay nagbabalik ng isang trabaho UUID; poll /v1/speech/results/?uuid= upang mabawi ang inpainted audio kapag handa. Tingnan ang API docs para sa mga detalye.

Ang aming audio inpainting ay surgical: ito ay nag-e-edit lamang ng mga markadong hanay, pinapanatili ang bawat iba pang byte ng iyong orihinal na pag-record na hindi nababago, at tumutugma sa bagong clip sa nakapalibot na boses sa halip na isang hiwalay na boses library.

5.0/5 (1)

Ayusin ang iyong Audio sa mga segundo

Palitan ang anumang bahagi ng anumang pag-record sa AI-synthesized na pagsasalita na tumutugma sa orihinal na boses. Mag-sign up nang libre upang magsimula.

Mag-sign up para sa libreng Tingnan ang Pagpepresyo

Ang AI Audio Inpainting ay isang seryeng manga.

I-upload ang Audio sa Inpaint

Source audio — maghugas upang mahanap ang masamang kumuha

Mga Setting ng Inpaint

Bago (Original)

Pagkatapos (Ipininta)

Paano gumagana ang Audio Inpainting

Mga Tip para sa Pinakamahusay na Resulta

Paano gumagana ang AI Audio Inpainting

I-upload + Markahan ang hanay

Voice Clone + synthesize

Mga crossfade splice

Audio Inpainting Plano

Mga Madalas Itanong

Ayusin ang iyong Audio sa mga segundo

Ang AI Audio Inpainting ay isang seryeng manga.

I-upload ang Audio sa Inpaint

Source audio — maghugas upang mahanap ang masamang kumuha

Mga Setting ng Inpaint

Bago (Original)

Pagkatapos (Ipininta)

Paano gumagana ang Audio Inpainting

Mga Tip para sa Pinakamahusay na Resulta

Paano gumagana ang AI Audio Inpainting

I-upload + Markahan ang hanay

Voice Clone + synthesize

Mga crossfade splice

Audio Inpainting Plano

Mga Madalas Itanong

Ano ang audio inpainting?

Paano ito gumagana?

Kailan dapat gamitin ang inpainting ng audio sa halip na muling pag-record?

Gaano katagal ang source audio ay?

Ang mga salitang ito ay maaaring tumukoy sa: Ang salitang ito ay maaaring tumukoy sa: Ang salitang ito ay maaaring tumukoy sa:

Ano ang nangyayari sa mga hangganan ng edit?

Ano ang mga wika ay suportado?

Gaano kahalaga ang audio inpainting?

Maaari ko bang gamitin ito upang ilagay ang mga salita sa bibig ng isang tao na hindi nila sinabi?

Bakit gamitin inpainting sa halip ng lamang pagtanggal ng masamang seksyon?

Ang audio inpainting API ay magagamit?

Paano ito ihahambing sa ElevenLabs Speech-to-Speech?

Ayusin ang iyong Audio sa mga segundo