Raporto një gabim / kërkesë për funksion

AI Audio Inpainting

Zëvendëso një pjesë të audios me një fjalim të sintetizuar nga AI që përputhet me zërin rrethues. Korrigjo një regjistrim të keq pa ri-inçizuar të gjithë.

Regjistrohu pa pagesë

Ende nuk kemi zëra TTS në gjuhën tuaj. Na ndihmoni të shtojmë të tuajat! Shit zërin tënd

Ngarko audio tek Inpaint

500 karakterë për sekond të zërit të zëvendësuar

Tërhiq dhe lësho file këtu ose shfleto

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Rregullimet e InPaint

Fillo (sekonda)

Fundi (sekonda)

Zëvendëso tekstin - çfarë duhet të thuhet në boshllëk 0 / 500 gërma

Gjuha

Përzihet 80 ms Sa gjatë duhet të përzihen pikat e bashkimi. 80ms është e prezgjedhur - prerja e përputhshme duket natyrale, nuk dëgjohet shtytja e dyfishtë.

Regjistrohu falas për të përdorur audio inpainting

Si funksionon Inpainting Audio

Inpainting është ekuivalenti audio i mbushjes së përmbajtjes së Photoshop. Ne klonojmë zërin nga audio që rrethon zgjedhjen tuaj, sintetizojmë rreshtin e ri në atë zë, dhe e lidhim atë me një crossfade të shkurtër.

Rezultatet më të mira: lë të paktën 3 sekonda të foljes së pastër menjëherë para pikës së modifikimit kështu që klonuesi ka material të mirë referuese.

Këshillat për rezultatet më të mira

Mbaje intervalin e shënuar sa më të ngushtë të jetë e mundur — vetëm për të marrët e këqija
Teksti i zëvendësimit duhet të jetë afërsisht i njëjtë në gjatësi me atë që zëvendëson
Përcakto gjuhën për të përshtatur audion burimor për përputhje më të mirë zëri
80ms crossfade është zakonisht i padukshëm; përplasje në 150ms nëse dëgjohet një klikim
Për ndryshime të gjata (>10s), konsidero ri-inçizimin e të gjithë pasazhit

Si funksionon AI Audio Inpainting

Modifikime kirurgjike, zëri i përshtatshëm, pa seancë ri-inxhinierimi.

Hapi 1

Shto

Ngarko audion dhe përdor skuqësin për të shënuar fillimin/fundin e seksionit që dëshiron të zëvendësosh. Shkruaj tekstin e zëvendësimit.

Hapi 2

Klono zërin + sintetizo

Ne nxjerrim deri në 12 sekonda të referencës së pastër të zërit që rrethon zgjedhjen tënde, klonojmë zërin e folësit, dhe sintetizojmë rreshtin e ri në atë zë.

Hapi 3

Crossfade Splice

Klip sintetizuar është e lidhur në regjistrimin origjinal me një crossfade e barabartë-fuqi në të dyja pikat e edit. Kufijtë janë të padukshme.

Plani i pikturës së audios

Fillo falas, përmirëso kur të duash më shumë

I lirë

File burim deri në 10 minuta
Zëvendëso tekstin me 500 gërma
4 sekonda pikturim për kërkesë
80ms crossfade splice
Backend-et e OpenVoice + CosyVoice 2

Popullariteti

Profili i lirë

File burim deri në 10 minuta
Zëvendëso tekstin me 5,000 gërma
Përshtatshmëria e ndërprerjes së ndriçimit (0-250ms)
Zëri
Gjenerati historik + ri-ndrysho

Regjistrohu

Pro

File burim deri në 30 minuta
Zëvendëso tekstin me 100,000 gërma
Prioriteti i GPU
API access (/v1/audio-inpaint/)
Ngjyrosja e grupeve (intervali të shumtë)

Përmirëso

Pyetje të shpeshta

Zëvendësimi i zërit (i quajtur gjithashtu mbushim i zërit ose mbishkrim i zërit) të lejon të zëvendësosh një pjesë të një regjistrimi ekzistues me zërin e ri të sintetizuar nga AI që përputhet me zërin origjinal. Është ekuivalenti i zërit i mbushimit të përmbajtjes së Photoshop - pikturo mbi pjesën që nuk e do, shkruaj atë që duhet të jetë atje në vend të saj dhe AI gjeneron një zëvendësim të pafund.

Shëno intervalin kohor për të zëvendësuar, shkruaj rreshtin e ri të dialogut dhe kliko Inpicture. AI jonë klonon zërin nga audio që rrethon zgjedhjen tënde, sintetizon rreshtin e ri në atë zë, dhe e kthen atë në regjistrimin tënd me një ndërprerje të shkurtër në mënyrë që modifikimi të jetë i padukshëm.

Përdoret kur keni një fjalë të vetme të keqe, një përkthim të gabuar, një fjalë të përbuzur, një fjalë të përbuzur, ose një gabim faktesh në një regjistrim të mirë. Ri-inxhinieria e të gjithë pasazhit shpesh sjell një mospërputhje tonale me pjesën tjetër të projektit - inpicturating rregullon vetëm atë që ka nevojë të rregullohet ndërsa mban të paprekura çdo gërmë tjetër.

Përdoruesit e lirë mund të pikturojne file deri në 10 minuta të gjatë. Abonuesve mund t'u lejohet të pikturojne file deri në 30 minuta. Teksti i zëvendësimit është i kufizuar në 500 karaktere për përdoruesit e lirë, 5,000 për llogaritë e lirë dhe 100,000 për llogaritë me pagesë.

Shumë afër. AI përdor deri në 12 sekonda të audios rreth editimit si një referencë zëri, e cila është e mjaftueshme për të gjithë modelet tona të klonuara (OpenVoice, CosyVoice 2) për të kapur tingullin, tonin dhe stilin e foljes së folësit. Për rezultatet më të mira, lëre të paktën 3 sekonda të foljes së pastër menjëherë para pikës së editimit.

Ne aplikojmë një ndërprerje të barabartë 80ms në të dy pikat e lidhjes (krye→zëvendësim dhe zëvendësim→bisht) në mënyrë të prezgjedhur. Mund ta rregulloni këtë nga 0ms (prerje e vështirë) deri në 250ms nëpërmjet rrëshqitësit të ndërprerjes. Ndërprerjet më të gjata fshehin ndryshimin më thellë, por mund të përzihen me zë fjalët që mbivendoset në kufi.

Zëri i shkruar ndjek të njëjtën gjuhë si klonimi i zërit. Zgjedhim automatikisht OpenVoice për shumicën e gjuhëve dhe CosyVoice 2 për gjuhët kineze, japoneze dhe koreane. Mund të mbishkruash modelin në rregullimet e avancuara.

Do të paguheni për 500 karaktere për sekond të zërit të zëvendësuar. Një rregullim 4 sekondash kushton 2,000 karaktere. Kostoja është e pavarur nga sa i gjatë është teksti i zëvendësimit, pasi sinteza e klonit nënshtrohet nga koha e ekzekutimit të klipit të ri, jo gjatësia e tekstit.

Sipas kushteve tona të shërbimit, mund të pikturizoni vetëm audio që ju e posedoni ose keni leje të qartë për të ndryshuar. Gjeneratimi i citateve të rreme, përmbajtjes mashtruese, apo impersonimeve është i ndaluar. Ne i nënshkruajm audiot e gjeneruara dhe regjistrojmë të gjitha punët e pikturës për shqyrtim të abuzimit.

Prerja e një klipi lë një hapësirë të dukshme në ritm dhe frymëmarrje; kryqëzimi i dy të dhënave lë një mospërputhje tonale. Inpainting mbulon hapësirën me fjalë që përputhet me zërin rrethues, kështu që dëgjuesit dëgjojnë vazhdimisht, tingullin natyror.

Po — POST tek /v1/audio-inpaint/ me file audio, start_sec, end_sec dhe replacement_text. Pika e fundit kthen një UUID të punës; pyet /v1/speech/results/?uuid= për të marrë audion e pikturuar kur të jetë gati. Shiko dokumentet e API për hollësi.

ElevenLabs Speech-to-Speech rigjeneron të gjithë rreshtin e zërit nga zero në një zë të synuar. Inpikturimi ynë i zërit është kirurgjik: ndryshon vetëm intervalin e shënuar, mban të paprekur çdo byte tjetër të regjistrimit tënd origjinal dhe i përshtat klipin e ri me zërin rrethues në vend të një biblioteke të veçantë zëri.

5.0/5 (1)

Korrigjo zërin tënd në sekonda

Zëvendëso çdo pjesë të regjistrimit me një fjalim të sintetizuar nga AI që përputhet me zërin origjinal. Regjistrohu pa pagesë për të filluar.

Regjistrohu pa pagesë Shiko çmimin

AI Audio Inpainting

Ngarko audio tek Inpaint

Burimi audio — fshi për të gjetur regjistrimin e gabuar

Rregullimet e InPaint

Para (origjinal)

Pas (I pikturuar)

Si funksionon Inpainting Audio

Këshillat për rezultatet më të mira

Si funksionon AI Audio Inpainting

Shto

Klono zërin + sintetizo

Crossfade Splice

Plani i pikturës së audios

Pyetje të shpeshta

Korrigjo zërin tënd në sekonda

AI Audio Inpainting

Ngarko audio tek Inpaint

Burimi audio — fshi për të gjetur regjistrimin e gabuar

Rregullimet e InPaint

Para (origjinal)

Pas (I pikturuar)

Si funksionon Inpainting Audio

Këshillat për rezultatet më të mira

Si funksionon AI Audio Inpainting

Shto

Klono zërin + sintetizo

Crossfade Splice

Plani i pikturës së audios

Pyetje të shpeshta

Çfarë është audio inpainting?

Si funksionon?

Kur duhet të përdorë audio inpainting në vend të ri-inçizimit?

Sa i gjatë mund të jetë audio burimi?

A do të tingëllojë fjalimi i pikturuar tamam si folësi origjinal?

Çfarë ndodh në kufijtë e modifikimit?

Çfarë gjuhësh janë të suportuara?

Sa kushton piktura e zërit?

A mund ta përdor këtë për të vënë fjalë në gojën e dikujt që nuk i kanë thënë?

Pse përdorin inpainting në vend të thjeshtë fshirjes së seksionit të keq?

A është në dispozicion API e inpicture audio?

Si krahasohet kjo me ElevenLabs Speech-to-Speech?

Korrigjo zërin tënd në sekonda