AI hljóð innmálun

Skipta um hluta af hljóði með AI-samsettri ræðu sem passar við umhverfis rödd.Laga slæmt taka án þess að taka upp allt.

Senda hljóð til Inpaint

500 stafir á sekúndu af hljóði skipt út

Dragðu og slepptu skránni hér, eða fletta

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

skrá.mp3

0 MB

Source hljóð - skola til að finna slæma taka

0.00s / 0.00s

Stillingar innmála

0 / 500 stafir
Hversu lengi á að blanda splice stig.80ms er sjálfgefið - passa-skurður finnst eðlilegt, engin heyranleg tvöfaldur-kveikja.
Skráðu þig ókeypis til að nota hljóð inpainting
Mála hljóð...

Klónun röddarinnar og myndun í staðinn...

Slípa → klónun umhverfis rödd → splicing með crossfade
Niðurstaðan þín birtist í skoðunarglugganum þínum. generation history Ūegar ūú ert tilbúinn.
Inpainted Audio Ready

Áður (upprunalegt)

Eftir (málað)

Hvernig hljóð innmálun virkar

Við klónum röddina úr hljóðinu í kringum val þitt, myndum nýja línuna í þeirri rödd og splice það aftur með stuttum crossfade.

Bestu niðurstöður: Skildu eftir að minnsta kosti 3 sekúndur af hreinu tali strax fyrir breytingarpunktinn svo að klóninn hafi gott viðmiðunarefni.

Ábendingar fyrir bestu niðurstöður

  • Haltu merktu sviðinu eins þétt og mögulegt er - aðeins slæmt að taka
  • Skiptitextinn ætti að vera um það bil jafn langur og sá sem hann kemur í staðinn fyrir
  • Stilltu tungumálið til að passa við uppruna hljóð fyrir bestu rödd samsvörun
  • 80ms crossfade er venjulega ósýnilegt; högg til 150ms ef þú heyrir smell
  • Fyrir langar breytingar (> 10s), íhuga að taka upp alla leiðina í staðinn

Hvernig AI Audio Inpainting virkar

Skurđlækningar, rödd-samsvarandi, án endurupptöku.

Skref 1

Senda + Merkja Svið

Hladdu upp hljóðinu og notaðu rennibrautina til að merkja upphaf/endir hlutans sem þú vilt skipta út.Sláðu inn textann sem þú vilt skipta út.

Skref 2

Voice Clone + SynthesizeName

Við dregum allt að 12 sekúndur af hreinu tilvísunarhljóði í kringum val þitt, klóna rödd hátalara og samþætta nýja línuna í þeirri rödd.

Skref 3

Crossfade splice

Samsettu klippurnar eru tengdar saman við upprunalegu upptökuna með jafna crossfade á báðum klippipunktum.

Hljóðmálun

Byrjaðu ókeypis, uppfærðu þegar þú þarft meira

Frjáls
  • Allt að 10 mínútna upprunaskrár
  • 500 stafa texti í staðinn
  • 4 sekúndur í mála á beiðni
  • 80ms crossfade splice
  • OpenVoice + CosyVoice 2 bakenda
Vinsælasta
Ókeypis reikningur
  • Allt að 10 mínútna upprunaskrár
  • 5.000 stafa texti í staðinn
  • Tunable crossfade (0-250ms)
  • Yfirfærsla á raddlíkani
  • Generation sögu + endurskoða
Skráðu þig ókeypis
Pro
  • Allt að 30 mínútna upprunaskrár
  • 100.000 stafa texti í staðinn
  • Forgangsröð GPU
  • API aðgangur (/v1/audio-inpaint/)
  • Hópmálun (mörg svið)
Uppfærsla

Algengar spurningar (FAQ)

Hljóðfylling (einnig kölluð hljóðfylling eða tal yfirdubb) gerir þér kleift að skipta um hluta af núverandi hljóðupptöku með nýjum AI-samsettum ræðu sem passar við upprunalega röddina. Það er hljóðjafngildi Photoshop-efnisvitandi fyllingar - mála yfir hlutann sem þú vilt ekki, sláðu inn það sem ætti að vera þar í staðinn og AI býr til óaðfinnanlega skipti.

Merktu tímabilið sem á að skipta um, sláðu inn nýja línuna í samræðum og smelltu á Inpaint. AI okkar klónar röddina úr hljóðinu í kringum val þitt, samþættir nýja línuna í þeirri rödd og splices það aftur í upptökuna með stuttum crossfade svo að breytingin er óheyrileg.

Notaðu það þegar þú hefur eitt slæmt orð, rangt framburð, nafnslys, bölvað orð eða staðreyndarvilla í annars góðum tökum. Endurupptaka alls kaflans kynnir oft tóna mismatch með restinni af verkefninu - inpainting lagar aðeins það sem þarf að laga en heldur öllum öðrum atkvæðum óbreyttum.

Frjáls notendur geta inpaint skrár allt að 10 mínútur. Áskrifendur geta inpaint skrár allt að 30 mínútur.Skipti textinn sjálft er takmörkuð við 500 stafir fyrir frjálsa notendur, 5.000 fyrir frjáls reikninga, og 100.000 fyrir greiddar áætlanir.

AI notar allt að 12 sekúndur af hljóði í kringum breytinguna sem raddviðmiðun, sem er nóg fyrir hvaða klónunarhæfa líkan okkar (OpenVoice, CosyVoice 2) til að fanga hljóðstíl, hæð og talstíl ræðumannsins. Til að ná sem bestum árangri skaltu skilja eftir að minnsta kosti 3 sekúndur af hreinu tali strax fyrir breytingarpunktinn.

Við notum 80ms jafna krafts krossdauða á báðum splice stöðum (höfuð→skipti og skipti→hals) sjálfgefið. Þú getur stillt þetta frá 0ms (harður skera) upp í 250ms með Crossfade rennibraut. Lengri krossdauða fela breytingu betur en geta hljóðlega blanda skarast orð við landamærin.

Hljóð í mála fylgir sömu tungumálaumfjöllun og raddklónun. Við veljum sjálfkrafa OpenVoice fyrir flest tungumál og CosyVoice 2 fyrir kínversku, japönsku og kóresku. Þú getur yfirgefið líkanið í háþróaðri stillingum.

Þú ert gjaldfærður fyrir 500 stafi á sekúndu af hljóði sem skipt er út fyrir. 4 sekúndna lagfæring kostar 2000 stafi. Kostnaðurinn er óháður því hversu langur textinn er í staðinn, þar sem undirliggjandi klónun er takmörkuð af tímalengd nýja myndskeiðsins, ekki lengd textans.

Samkvæmt þjónustuskilmálum okkar getur þú aðeins mála hljóð sem þú átt eða hefur beinlínis leyfi til að breyta. Búa til falsa tilvitnanir, villandi efni eða impersonations er bannað.Við vatnsmerki myndast hljóð og skrá alla inpainting störf fyrir misnotkun endurskoðun.

Ef klippa á myndskeið er eftir áberandi bil í takti og öndun. Ef tvær upptökur eru teknar í röð er eftir tónsviðsbilun. Inpainting fyllir bilið með ræðu sem passar við umhverfisröddina svo hlustendur heyra samfellt, náttúrulegt hljóð.

Já — POST til /v1/audio-inpaint/ með hljóðskránni, start_sec, end_sec og replacement_text. Endapunkturinn skilar UUID verkefnis; poll /v1/speech/results/?uuid= til að sækja hljóðin þegar tilbúið er. Sjá API skjöl fyrir nánari upplýsingar.

ElevenLabs Speech-to-Speech endurnýjar alla raddlínuna frá grunni í markhópsrödd.Hljóðin okkar er skurðaðgerð: það breytir aðeins merktu sviðinu, heldur öllum öðrum bætum upprunalegu upptökunnar ósnortinn og passar við nýja myndbandið við umhverfis rödd frekar en sérstakt raddbókasafnið.
5.0/5 (1)

Hvað gætum við bætt? Viðbrögð þín hjálpa okkur að laga vandamál.

Festa hljóð í sekúndum

Skipta um hvaða hluta af hvaða upptöku sem er með AI-samsettri ræðu sem passar við upprunalega röddina.