Ziņot par kļūdu / funkciju pieprasījumu

AI audio inkrustācija

Aizvietot sadaļu audio ar AI sintezētu runu, kas atbilst apkārtējai balsij. Nokārtot sliktu veikt bez atkārtoti ierakstīt visu lietu.

Pierakstīties brīvībā

Mums vēl nav TTS balsis jūsu valodā. Palīdziet mums pievienot savu! Pārdod savu balsi

Augšupielādēt audio uz nekrāsoto

500 rakstzīmes sekundē audio nomainīts

Velciet un nometiet failu šeit, vai pārlūkot

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Nekrāsotie iestatījumi

Sākt (sekundes)

Beigas (sekundes)

Aizstāšanas teksts — kas būtu jāpasaka plaisā 0 / 500 rakstzīmes

Valoda

Crossfade 80 ms Cik ilgi, lai jauktu splite punktus. 80ms ir noklusējuma — Match-cuts justies dabiski, bez skaņas dubult-trigger.

Pierakstīties bez maksas, lai izmantotu audio iekrāsošanu

Kā darbojas audio iekrāsošana

Iekrāsošana ir Photoshop satura-programmatūras aizpildījuma audio ekvivalents. Mēs klonējam balsi no audio ap jūsu izvēli, sintezējam jauno līniju šajā balsī un saspiežam to atpakaļ ar īsu krustiņu.

Labākie rezultāti: atstāt vismaz 3 sekundes tīru runu tieši pirms rediģēšanas punkta, lai klons ir labs references materiāls.

Labāko rezultātu padomi

Paturēt iezīmēto diapazonu pēc iespējas šaurāku — tikai slikti ņemt
Aizstājējam tekstam vajadzētu būt apmēram tādam pašam garumam kā tam, ko tas aizstāj
Iestatīt valodu, lai atbilstu avota audio labākai balss atbilstībai
80ms crossfade parasti ir neredzams; pacēlums uz 150ms, ja jūs dzirdat klikšķi
Ilgiem rediģējumiem (> 10s) apsver iespēju atkārtoti ierakstīt visu fragmentu

Kā AI audio iekrāsošana darbojas

Ķirurģiski rediģējumi, balss pieskaņojumi, bez atkārtotas ierakstīšanas sesijas.

darbība

Augšupielādēt + Atzīmēt Range

Ielādējiet audio un izmantojiet skruberi, lai atzīmētu sadaļas, kuru vēlaties aizstāt, sākumu/ beigām. Ievadiet aizvietojošo tekstu.

darbība

Balss klons + sintēzes izmērs

Mēs iegūstam līdz pat 12 sekundēm tīras atsauces audio ap jūsu izvēli, klonēt skaļrunis balss, un sintezēt jauno līniju šajā balsī.

3. darbība

Crossfade Splice

Sintētiskais klips tiek iespiests oriģinālajā ierakstā ar vienlīdzīgas jaudas krustojumu abos rediģēšanas punktos. Robežas nav pieejamas.

Audio iekrāsošanas plāni

Sākt bezmaksas, uzlabot, kad jums ir nepieciešams vairāk

Bezmaksas

Līdz 10 minūšu avota faili
500 zīmju aizstājējteksts
4 sekunžu inkrustāts uz pieprasījumu
80 m šķērsgriezuma griezums
OpenVoice + jaukaVoice 2 aizmugures

Populārākais

Bezmaksas konts

Līdz 10 minūšu avota faili
5 000 zīmju aizstājējteksts
Izlīdzināms krustojums (0–250 ms)
Balss modeļa pārslēgšanās
Paaudžu vēsture + rediģēšana

Pierakstīties brīvībā

Pro

Līdz 30 minūšu avota faili
100 000 zīmju aizstājējteksts
Prioritārais GPU rinda
API piekļuve (/v1/audio-inpaint/)
Partijas iekrāsošana (daudzi diapazoni)

Atjaunināt

Bieži uzdoti jautājumi

Audio inkrustācija (saukta arī par audio aizpildīšanu vai runas pārpildīšanu) ļauj aizvietot esošā audio ieraksta sadaļu ar jaunu AI sintezētu runu, kas atbilst oriģinālajai balsij. Tas ir Photoshop satura-aware aizpildījuma audio ekvivalents — krāsu pār daļu, kuru nevēlaties, ierakstiet, kas tur būtu, un AI rada vienlaidu nomaiņu.

Atzīmējiet laika diapazonu, lai aizstātu, ierakstiet jauno dialoga līniju, un noklikšķiniet uz Inpaint. Mūsu AI klonē balsi no audio ap jūsu izvēli, sintezē jauno līniju šajā balsī, un saspiež to atpakaļ jūsu ierakstā ar īsu krustiņu, lai rediģējums ir neveikls.

Izmantojiet to, kad jums ir viens slikts vārds, nepatiess, vārds slīdēt, zvērests vārds, vai faktu kļūdu citā labā pieņemt. Atkārtot ierakstu visu fragmentu bieži ievieš tonālu nesakritību ar pārējo projekta — iekrāsošana nosaka tikai to, kas nepieciešams, nosakot, vienlaikus saglabājot visu citu zilo neskartu.

Bezmaksas lietotāji var iekrāsot failus līdz 10 minūtēm ilgi. Abonenti var iekrāsot failus līdz 30 minūtēm. Rezerves teksts pats par sevi ir ierobežots ar 500 rakstzīmēm bezmaksas lietotājiem, 5000 bezmaksas kontiem un 100 000 maksas plāniem.

Ļoti tuvu. AI izmanto līdz 12 sekunžu audio ap rediģēt kā balss atsauces, kas ir pietiekami, lai jebkurš no mūsu klonējamiem modeļiem (OpenVoice, CosyVoice 2), lai uztvertu runātāja timbre, piķis, un runāšanas stilu. Lai iegūtu labākos rezultātus, atstājiet vismaz 3 sekundes tīras runas tieši pirms rediģēšanas punkta.

Mēs pēc noklusējuma piemērojam 80 m līdzvērtīgas jaudas krustojumu abos sašķeltajos punktos (galva→ aizvietošana un aizvietošana→ retaitage). Jūs varat to noskaņot no 0 ms (ciets griezums) līdz 250 ms caur Crossfade slāpētāju. Ilgākas krustpunktus noslēpt detalizētāk, bet varat audiobly sajaukt vārdus, kas pārklājas pie robežas.

Audio inpainting seko tiem pašiem valodas aptvērumiem kā balss klonēšana. Mēs auto-pick OpenVoice vairumam valodu un CosyVoice 2 ķīniešu, japāņu un korejiešu. Jūs varat pārspēt modeli uzlabotos iestatījumos.

Jums tiek prasīta 500 rakstzīmes sekundē audio nomainīts. 4 sekunžu fiksēt izmaksas ir 2000 rakstzīmes. Izmaksas nav atkarīgas no tā, cik ilgi ir aizvietošanas teksts, jo pamatā esošo klona sintēzi gated ar jaunā klipa palaišanas laiku, nevis teksta garumu.

Saskaņā ar mūsu Pakalpojuma Noteikumiem, jūs varat tikai iekrāsot audio jums pieder vai ir nepārprotama atļauja rediģēt. Ģenerēt viltotas cenas, maldinošu saturu, vai personības ir aizliegts. Mēs ūdenszīmi ģenerēja audio un pierakstīt visus iekrāsošanas darbu ļaunprātīgas pārskatīšanas.

Griezot klipu, rodas pamanāma plaisa, kas izpaužas maskēšanā un elpā. Divi krustojumi atstāj tonālu nesakritību. Iekrāsošana aizpilda plaisu ar runu, kas atbilst apkārtējai balsij, lai klausītāji dzirdētu nepārtrauktu, dabīgu skaņu audio.

Jā — Post to /v1/audio- inpaint/ ar audio failu, start_ sec, end_ sec, un aizstājējs_ text. Parametrs atgriež darbu UUID; aptauja /v1/ speech/results/?uid=, lai iegūtu nekrāsotu audio, kad gatavs. Lai iegūtu informāciju, skatīt API docs.

Vienpadsmit Locekļi Runā-to-Speech reģenerē visu balss līniju no nulles mērķa balsī. Mūsu audio inkrustācija ir ķirurģiska: tā rediģē tikai iezīmēto diapazonu, uztur visus pārējos oriģinālā ieraksta baitus un sakrīt ar jauno klipu ar apkārtējo balsi, nevis atsevišķu balss bibliotēku.

5.0/5 (1)

Pielāgot skaņu sekundēs

Aizvietot jebkuru ieraksta daļu ar AI sintezētu runu, kas atbilst oriģinālajai balsij. Pierakstīties brīvi, lai sāktu.

Pierakstīties brīvībā Skatīt cenu

AI audio inkrustācija

Augšupielādēt audio uz nekrāsoto

Avots audio — skrubis, lai atrastu slikti veikt

Nekrāsotie iestatījumi

Pirms (Original)

Pēc (nekrāsots)

Kā darbojas audio iekrāsošana

Labāko rezultātu padomi

Kā AI audio iekrāsošana darbojas

Augšupielādēt + Atzīmēt Range

Balss klons + sintēzes izmērs

Crossfade Splice

Audio iekrāsošanas plāni

Bieži uzdoti jautājumi

Pielāgot skaņu sekundēs

AI audio inkrustācija

Augšupielādēt audio uz nekrāsoto

Avots audio — skrubis, lai atrastu slikti veikt

Nekrāsotie iestatījumi

Pirms (Original)

Pēc (nekrāsots)

Kā darbojas audio iekrāsošana

Labāko rezultātu padomi

Kā AI audio iekrāsošana darbojas

Augšupielādēt + Atzīmēt Range

Balss klons + sintēzes izmērs

Crossfade Splice

Audio iekrāsošanas plāni

Bieži uzdoti jautājumi

Kas ir audio inkrustēšana?

Kā tas darbojas?

Kad man vajadzētu izmantot audio inkrustāciju, nevis pārrakstīšanas?

Cik ilgi var būt avots audio?

Vai iekrāsotā runa izklausīsies tieši tāpat kā sākotnējais runātājs?

Kas notiek pie rediģēšanas robežām?

Kādas valodas tiek atbalstītas?

Cik izmaksā audio apkrāpšana?

Vai es varu to izmantot, lai ieliktu vārdus muti, ko viņi neteica?

Kāpēc lietot apkrāpšanu, nevis vienkārši svītrot sliktu sadaļu?

Vai ir pieejams audio apkrāsojošs API?

Kā to salīdzināt ar vienpadsmit darbnīcām, kurās runā no vienas puses uz otru?

Pielāgot skaņu sekundēs