AI audio inkrustācija

Aizvietot sadaļu audio ar AI sintezētu runu, kas atbilst apkārtējai balsij. Nokārtot sliktu veikt bez atkārtoti ierakstīt visu lietu.

Mums vēl nav TTS balsis jūsu valodā. Palīdziet mums pievienot savu! Pārdod savu balsi

Augšupielādēt audio uz nekrāsoto

500 rakstzīmes sekundē audio nomainīts

Velciet un nometiet failu šeit, vai pārlūkot

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

file.mp3

0 MB

Avots audio — skrubis, lai atrastu slikti veikt

0.00s / 0.00s

Nekrāsotie iestatījumi

0 / 500 rakstzīmes
Cik ilgi, lai jauktu splite punktus. 80ms ir noklusējuma — Match-cuts justies dabiski, bez skaņas dubult-trigger.
Pierakstīties bez maksas, lai izmantotu audio iekrāsošanu
Iekrāso audio...

Klonēšana balss un sintezējot aizstājēju...

Sašķiebšana → klonēšana apkārtējo balsi → sašķiebšana ar krustu
Vai jūsu rezultāts parādīsies jūsu paaudzes vēsture Gatavs.
Nekrāsots audio gatavs

Pirms (Original)

Pēc (nekrāsots)

Lejupielādēt nekrāsoto audio

Kā darbojas audio iekrāsošana

Iekrāsošana ir Photoshop satura-programmatūras aizpildījuma audio ekvivalents. Mēs klonējam balsi no audio ap jūsu izvēli, sintezējam jauno līniju šajā balsī un saspiežam to atpakaļ ar īsu krustiņu.

Labākie rezultāti: atstāt vismaz 3 sekundes tīru runu tieši pirms rediģēšanas punkta, lai klons ir labs references materiāls.

Labāko rezultātu padomi

  • Paturēt iezīmēto diapazonu pēc iespējas šaurāku — tikai slikti ņemt
  • Aizstājējam tekstam vajadzētu būt apmēram tādam pašam garumam kā tam, ko tas aizstāj
  • Iestatīt valodu, lai atbilstu avota audio labākai balss atbilstībai
  • 80ms crossfade parasti ir neredzams; pacēlums uz 150ms, ja jūs dzirdat klikšķi
  • Ilgiem rediģējumiem (> 10s) apsver iespēju atkārtoti ierakstīt visu fragmentu

Kā AI audio iekrāsošana darbojas

Ķirurģiski rediģējumi, balss pieskaņojumi, bez atkārtotas ierakstīšanas sesijas.

darbība

Augšupielādēt + Atzīmēt Range

Ielādējiet audio un izmantojiet skruberi, lai atzīmētu sadaļas, kuru vēlaties aizstāt, sākumu/ beigām. Ievadiet aizvietojošo tekstu.

darbība

Balss klons + sintēzes izmērs

Mēs iegūstam līdz pat 12 sekundēm tīras atsauces audio ap jūsu izvēli, klonēt skaļrunis balss, un sintezēt jauno līniju šajā balsī.

3. darbība

Crossfade Splice

Sintētiskais klips tiek iespiests oriģinālajā ierakstā ar vienlīdzīgas jaudas krustojumu abos rediģēšanas punktos. Robežas nav pieejamas.

Audio iekrāsošanas plāni

Sākt bezmaksas, uzlabot, kad jums ir nepieciešams vairāk

Bezmaksas
  • Līdz 10 minūšu avota faili
  • 500 zīmju aizstājējteksts
  • 4 sekunžu inkrustāts uz pieprasījumu
  • 80 m šķērsgriezuma griezums
  • OpenVoice + jaukaVoice 2 aizmugures
Populārākais
Bezmaksas konts
  • Līdz 10 minūšu avota faili
  • 5 000 zīmju aizstājējteksts
  • Izlīdzināms krustojums (0–250 ms)
  • Balss modeļa pārslēgšanās
  • Paaudžu vēsture + rediģēšana
Pierakstīties brīvībā
Pro
  • Līdz 30 minūšu avota faili
  • 100 000 zīmju aizstājējteksts
  • Prioritārais GPU rinda
  • API piekļuve (/v1/audio-inpaint/)
  • Partijas iekrāsošana (daudzi diapazoni)
Atjaunināt

Bieži uzdoti jautājumi

Audio inkrustācija (saukta arī par audio aizpildīšanu vai runas pārpildīšanu) ļauj aizvietot esošā audio ieraksta sadaļu ar jaunu AI sintezētu runu, kas atbilst oriģinālajai balsij. Tas ir Photoshop satura-aware aizpildījuma audio ekvivalents — krāsu pār daļu, kuru nevēlaties, ierakstiet, kas tur būtu, un AI rada vienlaidu nomaiņu.

Atzīmējiet laika diapazonu, lai aizstātu, ierakstiet jauno dialoga līniju, un noklikšķiniet uz Inpaint. Mūsu AI klonē balsi no audio ap jūsu izvēli, sintezē jauno līniju šajā balsī, un saspiež to atpakaļ jūsu ierakstā ar īsu krustiņu, lai rediģējums ir neveikls.

Izmantojiet to, kad jums ir viens slikts vārds, nepatiess, vārds slīdēt, zvērests vārds, vai faktu kļūdu citā labā pieņemt. Atkārtot ierakstu visu fragmentu bieži ievieš tonālu nesakritību ar pārējo projekta — iekrāsošana nosaka tikai to, kas nepieciešams, nosakot, vienlaikus saglabājot visu citu zilo neskartu.

Bezmaksas lietotāji var iekrāsot failus līdz 10 minūtēm ilgi. Abonenti var iekrāsot failus līdz 30 minūtēm. Rezerves teksts pats par sevi ir ierobežots ar 500 rakstzīmēm bezmaksas lietotājiem, 5000 bezmaksas kontiem un 100 000 maksas plāniem.

Ļoti tuvu. AI izmanto līdz 12 sekunžu audio ap rediģēt kā balss atsauces, kas ir pietiekami, lai jebkurš no mūsu klonējamiem modeļiem (OpenVoice, CosyVoice 2), lai uztvertu runātāja timbre, piķis, un runāšanas stilu. Lai iegūtu labākos rezultātus, atstājiet vismaz 3 sekundes tīras runas tieši pirms rediģēšanas punkta.

Mēs pēc noklusējuma piemērojam 80 m līdzvērtīgas jaudas krustojumu abos sašķeltajos punktos (galva→ aizvietošana un aizvietošana→ retaitage). Jūs varat to noskaņot no 0 ms (ciets griezums) līdz 250 ms caur Crossfade slāpētāju. Ilgākas krustpunktus noslēpt detalizētāk, bet varat audiobly sajaukt vārdus, kas pārklājas pie robežas.

Audio inpainting seko tiem pašiem valodas aptvērumiem kā balss klonēšana. Mēs auto-pick OpenVoice vairumam valodu un CosyVoice 2 ķīniešu, japāņu un korejiešu. Jūs varat pārspēt modeli uzlabotos iestatījumos.

Jums tiek prasīta 500 rakstzīmes sekundē audio nomainīts. 4 sekunžu fiksēt izmaksas ir 2000 rakstzīmes. Izmaksas nav atkarīgas no tā, cik ilgi ir aizvietošanas teksts, jo pamatā esošo klona sintēzi gated ar jaunā klipa palaišanas laiku, nevis teksta garumu.

Saskaņā ar mūsu Pakalpojuma Noteikumiem, jūs varat tikai iekrāsot audio jums pieder vai ir nepārprotama atļauja rediģēt. Ģenerēt viltotas cenas, maldinošu saturu, vai personības ir aizliegts. Mēs ūdenszīmi ģenerēja audio un pierakstīt visus iekrāsošanas darbu ļaunprātīgas pārskatīšanas.

Griezot klipu, rodas pamanāma plaisa, kas izpaužas maskēšanā un elpā. Divi krustojumi atstāj tonālu nesakritību. Iekrāsošana aizpilda plaisu ar runu, kas atbilst apkārtējai balsij, lai klausītāji dzirdētu nepārtrauktu, dabīgu skaņu audio.

Jā — Post to /v1/audio- inpaint/ ar audio failu, start_ sec, end_ sec, un aizstājējs_ text. Parametrs atgriež darbu UUID; aptauja /v1/ speech/results/?uid=, lai iegūtu nekrāsotu audio, kad gatavs. Lai iegūtu informāciju, skatīt API docs.

Vienpadsmit Locekļi Runā-to-Speech reģenerē visu balss līniju no nulles mērķa balsī. Mūsu audio inkrustācija ir ķirurģiska: tā rediģē tikai iezīmēto diapazonu, uztur visus pārējos oriģinālā ieraksta baitus un sakrīt ar jauno klipu ar apkārtējo balsi, nevis atsevišķu balss bibliotēku.
5.0/5 (1)

Ko mēs varam uzlabot? Jūsu atgriezeniskā saite palīdz mums atrisināt problēmas.

Pielāgot skaņu sekundēs

Aizvietot jebkuru ieraksta daļu ar AI sintezētu runu, kas atbilst oriģinālajai balsij. Pierakstīties brīvi, lai sāktu.