AI Audio Inpainting

Zëvendëso një pjesë të audios me një fjalim të sintetizuar nga AI që përputhet me zërin rrethues. Korrigjo një regjistrim të keq pa ri-inçizuar të gjithë.

Ende nuk kemi zëra TTS në gjuhën tuaj. Na ndihmoni të shtojmë të tuajat! Shit zërin tënd

Ngarko audio tek Inpaint

500 karakterë për sekond të zërit të zëvendësuar

Tërhiq dhe lësho file këtu ose shfleto

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

file.mp3

0 MB

Burimi audio — fshi për të gjetur regjistrimin e gabuar

0.00s / 0.00s

Rregullimet e InPaint

0 / 500 gërma
Sa gjatë duhet të përzihen pikat e bashkimi. 80ms është e prezgjedhur - prerja e përputhshme duket natyrale, nuk dëgjohet shtytja e dyfishtë.
Regjistrohu falas për të përdorur audio inpainting
Duke pikturuar audion...

Klonimi i zërit dhe sintetizimi i zëvëndësimit...

Prerja → klonimi i zërit rrethues → shkëputja me ndërprerjen
Rezultati do të shfaqet në historiki i krijimit Kur të jesh gati.
Audio Inpainted gati

Para (origjinal)

Pas (I pikturuar)

Shkarko audion e Inpainted

Si funksionon Inpainting Audio

Inpainting është ekuivalenti audio i mbushjes së përmbajtjes së Photoshop. Ne klonojmë zërin nga audio që rrethon zgjedhjen tuaj, sintetizojmë rreshtin e ri në atë zë, dhe e lidhim atë me një crossfade të shkurtër.

Rezultatet më të mira: lë të paktën 3 sekonda të foljes së pastër menjëherë para pikës së modifikimit kështu që klonuesi ka material të mirë referuese.

Këshillat për rezultatet më të mira

  • Mbaje intervalin e shënuar sa më të ngushtë të jetë e mundur — vetëm për të marrët e këqija
  • Teksti i zëvendësimit duhet të jetë afërsisht i njëjtë në gjatësi me atë që zëvendëson
  • Përcakto gjuhën për të përshtatur audion burimor për përputhje më të mirë zëri
  • 80ms crossfade është zakonisht i padukshëm; përplasje në 150ms nëse dëgjohet një klikim
  • Për ndryshime të gjata (>10s), konsidero ri-inçizimin e të gjithë pasazhit

Si funksionon AI Audio Inpainting

Modifikime kirurgjike, zëri i përshtatshëm, pa seancë ri-inxhinierimi.

Hapi 1

Shto

Ngarko audion dhe përdor skuqësin për të shënuar fillimin/fundin e seksionit që dëshiron të zëvendësosh. Shkruaj tekstin e zëvendësimit.

Hapi 2

Klono zërin + sintetizo

Ne nxjerrim deri në 12 sekonda të referencës së pastër të zërit që rrethon zgjedhjen tënde, klonojmë zërin e folësit, dhe sintetizojmë rreshtin e ri në atë zë.

Hapi 3

Crossfade Splice

Klip sintetizuar është e lidhur në regjistrimin origjinal me një crossfade e barabartë-fuqi në të dyja pikat e edit. Kufijtë janë të padukshme.

Plani i pikturës së audios

Fillo falas, përmirëso kur të duash më shumë

I lirë
  • File burim deri në 10 minuta
  • Zëvendëso tekstin me 500 gërma
  • 4 sekonda pikturim për kërkesë
  • 80ms crossfade splice
  • Backend-et e OpenVoice + CosyVoice 2
Popullariteti
Profili i lirë
  • File burim deri në 10 minuta
  • Zëvendëso tekstin me 5,000 gërma
  • Përshtatshmëria e ndërprerjes së ndriçimit (0-250ms)
  • Zëri
  • Gjenerati historik + ri-ndrysho
Regjistrohu
Pro
  • File burim deri në 30 minuta
  • Zëvendëso tekstin me 100,000 gërma
  • Prioriteti i GPU
  • API access (/v1/audio-inpaint/)
  • Ngjyrosja e grupeve (intervali të shumtë)
Përmirëso

Pyetje të shpeshta

Zëvendësimi i zërit (i quajtur gjithashtu mbushim i zërit ose mbishkrim i zërit) të lejon të zëvendësosh një pjesë të një regjistrimi ekzistues me zërin e ri të sintetizuar nga AI që përputhet me zërin origjinal. Është ekuivalenti i zërit i mbushimit të përmbajtjes së Photoshop - pikturo mbi pjesën që nuk e do, shkruaj atë që duhet të jetë atje në vend të saj dhe AI gjeneron një zëvendësim të pafund.

Shëno intervalin kohor për të zëvendësuar, shkruaj rreshtin e ri të dialogut dhe kliko Inpicture. AI jonë klonon zërin nga audio që rrethon zgjedhjen tënde, sintetizon rreshtin e ri në atë zë, dhe e kthen atë në regjistrimin tënd me një ndërprerje të shkurtër në mënyrë që modifikimi të jetë i padukshëm.

Përdoret kur keni një fjalë të vetme të keqe, një përkthim të gabuar, një fjalë të përbuzur, një fjalë të përbuzur, ose një gabim faktesh në një regjistrim të mirë. Ri-inxhinieria e të gjithë pasazhit shpesh sjell një mospërputhje tonale me pjesën tjetër të projektit - inpicturating rregullon vetëm atë që ka nevojë të rregullohet ndërsa mban të paprekura çdo gërmë tjetër.

Përdoruesit e lirë mund të pikturojne file deri në 10 minuta të gjatë. Abonuesve mund t'u lejohet të pikturojne file deri në 30 minuta. Teksti i zëvendësimit është i kufizuar në 500 karaktere për përdoruesit e lirë, 5,000 për llogaritë e lirë dhe 100,000 për llogaritë me pagesë.

Shumë afër. AI përdor deri në 12 sekonda të audios rreth editimit si një referencë zëri, e cila është e mjaftueshme për të gjithë modelet tona të klonuara (OpenVoice, CosyVoice 2) për të kapur tingullin, tonin dhe stilin e foljes së folësit. Për rezultatet më të mira, lëre të paktën 3 sekonda të foljes së pastër menjëherë para pikës së editimit.

Ne aplikojmë një ndërprerje të barabartë 80ms në të dy pikat e lidhjes (krye→zëvendësim dhe zëvendësim→bisht) në mënyrë të prezgjedhur. Mund ta rregulloni këtë nga 0ms (prerje e vështirë) deri në 250ms nëpërmjet rrëshqitësit të ndërprerjes. Ndërprerjet më të gjata fshehin ndryshimin më thellë, por mund të përzihen me zë fjalët që mbivendoset në kufi.

Zëri i shkruar ndjek të njëjtën gjuhë si klonimi i zërit. Zgjedhim automatikisht OpenVoice për shumicën e gjuhëve dhe CosyVoice 2 për gjuhët kineze, japoneze dhe koreane. Mund të mbishkruash modelin në rregullimet e avancuara.

Do të paguheni për 500 karaktere për sekond të zërit të zëvendësuar. Një rregullim 4 sekondash kushton 2,000 karaktere. Kostoja është e pavarur nga sa i gjatë është teksti i zëvendësimit, pasi sinteza e klonit nënshtrohet nga koha e ekzekutimit të klipit të ri, jo gjatësia e tekstit.

Sipas kushteve tona të shërbimit, mund të pikturizoni vetëm audio që ju e posedoni ose keni leje të qartë për të ndryshuar. Gjeneratimi i citateve të rreme, përmbajtjes mashtruese, apo impersonimeve është i ndaluar. Ne i nënshkruajm audiot e gjeneruara dhe regjistrojmë të gjitha punët e pikturës për shqyrtim të abuzimit.

Prerja e një klipi lë një hapësirë të dukshme në ritm dhe frymëmarrje; kryqëzimi i dy të dhënave lë një mospërputhje tonale. Inpainting mbulon hapësirën me fjalë që përputhet me zërin rrethues, kështu që dëgjuesit dëgjojnë vazhdimisht, tingullin natyror.

Po — POST tek /v1/audio-inpaint/ me file audio, start_sec, end_sec dhe replacement_text. Pika e fundit kthen një UUID të punës; pyet /v1/speech/results/?uuid= për të marrë audion e pikturuar kur të jetë gati. Shiko dokumentet e API për hollësi.

ElevenLabs Speech-to-Speech rigjeneron të gjithë rreshtin e zërit nga zero në një zë të synuar. Inpikturimi ynë i zërit është kirurgjik: ndryshon vetëm intervalin e shënuar, mban të paprekur çdo byte tjetër të regjistrimit tënd origjinal dhe i përshtat klipin e ri me zërin rrethues në vend të një biblioteke të veçantë zëri.
5.0/5 (1)

Çfarë mund të përmirësojmë? Feedback-i juaj na ndihmon të zgjidhim problemet.

Korrigjo zërin tënd në sekonda

Zëvendëso çdo pjesë të regjistrimit me një fjalim të sintetizuar nga AI që përputhet me zërin origjinal. Regjistrohu pa pagesë për të filluar.