Tilkynna villu / Feature Request

AI hljóð innmálun

Skipta um hluta af hljóði með AI-samsettri ræðu sem passar við umhverfis rödd.Laga slæmt taka án þess að taka upp allt.

Skráðu þig ókeypis

Senda hljóð til Inpaint

500 stafir á sekúndu af hljóði skipt út

Dragðu og slepptu skránni hér, eða fletta

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Stillingar innmála

Byrja (sekúndur)

End (sekúndur)

Skiptitexti — hvað ætti að segja í bilið 0 / 500 stafir

Tungumál

Crossfade 80 ms Hversu lengi á að blanda splice stig.80ms er sjálfgefið - passa-skurður finnst eðlilegt, engin heyranleg tvöfaldur-kveikja.

Skráðu þig ókeypis til að nota hljóð inpainting

Hvernig hljóð innmálun virkar

Við klónum röddina úr hljóðinu í kringum val þitt, myndum nýja línuna í þeirri rödd og splice það aftur með stuttum crossfade.

Bestu niðurstöður: Skildu eftir að minnsta kosti 3 sekúndur af hreinu tali strax fyrir breytingarpunktinn svo að klóninn hafi gott viðmiðunarefni.

Ábendingar fyrir bestu niðurstöður

Haltu merktu sviðinu eins þétt og mögulegt er - aðeins slæmt að taka
Skiptitextinn ætti að vera um það bil jafn langur og sá sem hann kemur í staðinn fyrir
Stilltu tungumálið til að passa við uppruna hljóð fyrir bestu rödd samsvörun
80ms crossfade er venjulega ósýnilegt; högg til 150ms ef þú heyrir smell
Fyrir langar breytingar (> 10s), íhuga að taka upp alla leiðina í staðinn

Hvernig AI Audio Inpainting virkar

Skurđlækningar, rödd-samsvarandi, án endurupptöku.

Skref 1

Senda + Merkja Svið

Hladdu upp hljóðinu og notaðu rennibrautina til að merkja upphaf/endir hlutans sem þú vilt skipta út.Sláðu inn textann sem þú vilt skipta út.

Skref 2

Voice Clone + SynthesizeName

Við dregum allt að 12 sekúndur af hreinu tilvísunarhljóði í kringum val þitt, klóna rödd hátalara og samþætta nýja línuna í þeirri rödd.

Skref 3

Crossfade splice

Samsettu klippurnar eru tengdar saman við upprunalegu upptökuna með jafna crossfade á báðum klippipunktum.

Hljóðmálun

Byrjaðu ókeypis, uppfærðu þegar þú þarft meira

Frjáls

Allt að 10 mínútna upprunaskrár
500 stafa texti í staðinn
4 sekúndur í mála á beiðni
80ms crossfade splice
OpenVoice + CosyVoice 2 bakenda

Vinsælasta

Ókeypis reikningur

Allt að 10 mínútna upprunaskrár
5.000 stafa texti í staðinn
Tunable crossfade (0-250ms)
Yfirfærsla á raddlíkani
Generation sögu + endurskoða

Skráðu þig ókeypis

Pro

Allt að 30 mínútna upprunaskrár
100.000 stafa texti í staðinn
Forgangsröð GPU
API aðgangur (/v1/audio-inpaint/)
Hópmálun (mörg svið)

Uppfærsla

Algengar spurningar (FAQ)

Hljóðfylling (einnig kölluð hljóðfylling eða tal yfirdubb) gerir þér kleift að skipta um hluta af núverandi hljóðupptöku með nýjum AI-samsettum ræðu sem passar við upprunalega röddina. Það er hljóðjafngildi Photoshop-efnisvitandi fyllingar - mála yfir hlutann sem þú vilt ekki, sláðu inn það sem ætti að vera þar í staðinn og AI býr til óaðfinnanlega skipti.

Merktu tímabilið sem á að skipta um, sláðu inn nýja línuna í samræðum og smelltu á Inpaint. AI okkar klónar röddina úr hljóðinu í kringum val þitt, samþættir nýja línuna í þeirri rödd og splices það aftur í upptökuna með stuttum crossfade svo að breytingin er óheyrileg.

Notaðu það þegar þú hefur eitt slæmt orð, rangt framburð, nafnslys, bölvað orð eða staðreyndarvilla í annars góðum tökum. Endurupptaka alls kaflans kynnir oft tóna mismatch með restinni af verkefninu - inpainting lagar aðeins það sem þarf að laga en heldur öllum öðrum atkvæðum óbreyttum.

Frjáls notendur geta inpaint skrár allt að 10 mínútur. Áskrifendur geta inpaint skrár allt að 30 mínútur.Skipti textinn sjálft er takmörkuð við 500 stafir fyrir frjálsa notendur, 5.000 fyrir frjáls reikninga, og 100.000 fyrir greiddar áætlanir.

AI notar allt að 12 sekúndur af hljóði í kringum breytinguna sem raddviðmiðun, sem er nóg fyrir hvaða klónunarhæfa líkan okkar (OpenVoice, CosyVoice 2) til að fanga hljóðstíl, hæð og talstíl ræðumannsins. Til að ná sem bestum árangri skaltu skilja eftir að minnsta kosti 3 sekúndur af hreinu tali strax fyrir breytingarpunktinn.

Við notum 80ms jafna krafts krossdauða á báðum splice stöðum (höfuð→skipti og skipti→hals) sjálfgefið. Þú getur stillt þetta frá 0ms (harður skera) upp í 250ms með Crossfade rennibraut. Lengri krossdauða fela breytingu betur en geta hljóðlega blanda skarast orð við landamærin.

Hljóð í mála fylgir sömu tungumálaumfjöllun og raddklónun. Við veljum sjálfkrafa OpenVoice fyrir flest tungumál og CosyVoice 2 fyrir kínversku, japönsku og kóresku. Þú getur yfirgefið líkanið í háþróaðri stillingum.

Þú ert gjaldfærður fyrir 500 stafi á sekúndu af hljóði sem skipt er út fyrir. 4 sekúndna lagfæring kostar 2000 stafi. Kostnaðurinn er óháður því hversu langur textinn er í staðinn, þar sem undirliggjandi klónun er takmörkuð af tímalengd nýja myndskeiðsins, ekki lengd textans.

Samkvæmt þjónustuskilmálum okkar getur þú aðeins mála hljóð sem þú átt eða hefur beinlínis leyfi til að breyta. Búa til falsa tilvitnanir, villandi efni eða impersonations er bannað.Við vatnsmerki myndast hljóð og skrá alla inpainting störf fyrir misnotkun endurskoðun.

Ef klippa á myndskeið er eftir áberandi bil í takti og öndun. Ef tvær upptökur eru teknar í röð er eftir tónsviðsbilun. Inpainting fyllir bilið með ræðu sem passar við umhverfisröddina svo hlustendur heyra samfellt, náttúrulegt hljóð.

Já — POST til /v1/audio-inpaint/ með hljóðskránni, start_sec, end_sec og replacement_text. Endapunkturinn skilar UUID verkefnis; poll /v1/speech/results/?uuid= til að sækja hljóðin þegar tilbúið er. Sjá API skjöl fyrir nánari upplýsingar.

ElevenLabs Speech-to-Speech endurnýjar alla raddlínuna frá grunni í markhópsrödd.Hljóðin okkar er skurðaðgerð: það breytir aðeins merktu sviðinu, heldur öllum öðrum bætum upprunalegu upptökunnar ósnortinn og passar við nýja myndbandið við umhverfis rödd frekar en sérstakt raddbókasafnið.

5.0/5 (1)

Festa hljóð í sekúndum

Skipta um hvaða hluta af hvaða upptöku sem er með AI-samsettri ræðu sem passar við upprunalega röddina.

Skráðu þig ókeypis Skoða verðlag

AI hljóð innmálun

Senda hljóð til Inpaint

Source hljóð - skola til að finna slæma taka

Stillingar innmála

Áður (upprunalegt)

Eftir (málað)

Hvernig hljóð innmálun virkar

Ábendingar fyrir bestu niðurstöður

Hvernig AI Audio Inpainting virkar

Senda + Merkja Svið

Voice Clone + SynthesizeName

Crossfade splice

Hljóðmálun

Algengar spurningar (FAQ)

Festa hljóð í sekúndum

AI hljóð innmálun

Senda hljóð til Inpaint

Source hljóð - skola til að finna slæma taka

Stillingar innmála

Áður (upprunalegt)

Eftir (málað)

Hvernig hljóð innmálun virkar

Ábendingar fyrir bestu niðurstöður

Hvernig AI Audio Inpainting virkar

Senda + Merkja Svið

Voice Clone + SynthesizeName

Crossfade splice

Hljóðmálun

Algengar spurningar (FAQ)

Hvað er hljóð inpainting?

Hvernig virkar það?

Hvenær ætti ég að nota hljóð í stað þess að taka upp á ný?

Hversu lengi getur upprunalega hljóðið verið?

Mun máluð ræða hljóma nákvæmlega eins og upprunalega ræðumaður?

Hvað gerist við breytingarmörk?

Hvaða tungumál eru studd?

Hvað kostar hljóðmálun?

Get ég notað þetta til að setja orð í munn einhvers sem þeir hafa aldrei sagt?

Af hverju að nota inpainting í stað þess að bara eyða slæma hlutanum?

Er hljóð inpainting API í boði?

Hvernig er þetta samanborið við ElevenLabs Speech-to-Speech?

Festa hljóð í sekúndum