Lëscht vun Audiodateien

Ersetzt e Audiodeel duerch eng KI-synthesiséiert Sprooch déi mat der Ëmgéigend Stëmm iwwereneestéisst. Korrigéiert eng schlecht Opnam ouni d'ganz Saach nees opzehuelen.

Mir maachen dat D'Stëmm vum Mënsch

Audio an Inpaint erofladen

500 Zeichen pro Sekonn vum Audio ersat

Ziehen a léisen Är Datei hei, oder Sich

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Datei.mp3

0 MB

D'Spill ass op der Websäit vun der NES-Spill-Serie

0.00s / 0.00s

Inmainten-Einstellungen

0 / 500 Zeichen
Wéi laang d'Split-Punkte mischen. Standard ass 80ms - Match-Cuts fille sech natierlech un, keng héierend Doppel-Trigger.
D'Lëscht vun de lëtzebuergesche Filmer
Audio gëtt gemalt...

Klonen vun der Stëmm an Synthese vum Ersatz...

D'Spill ass eng Kooperatioun tëscht der Universitéit vu Rostock an der Universitéit vu Freiburg.
Dauert et eng Kéier? Äert Resultat wäert an Ärem generation history wann bereet.
Lëscht vun de lëtzebuergesche Filmer

Virdrun (Ursprénglech)

No (gemalt)

D'Aufgab vum Audio-Inspektiounsdéngscht

Inpainting ass d'Audio-Äquivalent vun der inhaltsbaséierter Fëllung vu Photoshop. Mir klonen d'Stëmm aus dem Audio ronderëm Är Auswiel, synthetiséieren d'neit Linie an där Stëmm, a spleißen se mat engem kuerzen Iwwerblendung zréck.

Et ass eng vun de beschten Editiounen, déi bis elo erauskomm ass, an déi lescht Editioun war 2003.

Tipps fir déi bescht Resultater

  • Den markéierte Beräich sou kleng wéi méiglech halen - just déi schlecht Opnamen
  • Ersatztext sollt ongeféier déiselwecht Längt hunn wéi dat wat et ersetzt
  • Stellt d'Sprooch fir d'Quell-Audio fir déi bescht Sprooch-Overenstëmmung
  • 80ms Crossfade ass normalerweis onsiichtlech; op 150ms eropgoen wann Dir e Klick héiert
  • Fir laang Beaarbechtungen (>10s), iwwerluecht d'ganz Passage eriwwerzehuelen

Lëscht vun de lëtzebuergesche Filmer

D'Serie ass no engem Buch, dem No-Record-Record, benannt.

Schrëtt 1

Datei erofgelueden

Laden Dir Äert Audio erop an benotzt de Schieber fir den Ufank/Enn vum Deel ze markéieren deen Dir ersetzen wëllt. Gitt den Ersatztext an.

Schrëtt 2

Sprooch klonen + synthetiséieren

Et gëtt 12 verschidden Aarte vu Stëmmen, déi an der Sprooch benotzt ginn, an déi an der Sprooch an der Sprooch an der Sprooch an der Sprooch an der Sprooch an der Sprooch an der Sprooch an der Sprooch an der Sprooch an der Sprooch an der Sprooch an der Sprooch.

Schrëtt 3

Crossfade Splice

De synthetiséierte Clip gëtt mat engem Crossfade mat gläicher Kraaft un béide Bearbeitungspunkten an d'Original-Opnam gespaart. D'Grenze sinn net héieren.

Lëscht vun de Planéiten

Gratis ufänken, aktualiséieren wann Dir méi braucht

Free
  • Bis zu 10 Minutte laang Quelldateien
  • Ersatztext mat 500 Zeichen
  • 4-Sekonnen Inpeint pro Ufro
  • 80ms Crossfade Splice
  • OpenVoice + CosyVoice 2 Backends
Déi populärst
Free Account
  • Bis zu 10 Minutte laang Quelldateien
  • Ersatztext mat 5.000 Zeichen
  • Tunable crossfade (0-250ms)
  • Sproochemodell
  • Generéieren Historie + Re-Edit
Gratis anmelden
Pro
  • Bis zu 30 Minutte laang Quelldateien
  • Ersatztext mat 100.000 Zeichen
  • Prioritéit GPU-Warteschlange
  • API-Zugang (/v1/audio-inpaint/)
  • Batch- Malen (méi Beräicher)
Aktualiséieren

Häufig gestallte Froen

Audio Inpainting (och Audio Fill oder Sprooch Overdub genannt) erlaabt Iech e Secteur vun enger existenter Audio-Opnam mat neier KI-synthetiséierter Sprooch ze ersetzen, déi mat der originaler Stëmm iwwereneestënnt. Et ass d'Audio-Äquivalent vum Photoshop's content-aware Fill — iwwermaacht de Deel deen Dir net wëllt, tippt wat do wier, an d'KI generéiert en nahtlose Ersatz.

Markéiert den Zäitberäich deen ersat soll ginn, gitt déi nei Zeil vum Dialog an a klickt op Inmainen. Eis KI klont d'Stëmm aus dem Audio ronderëm Är Auswiel, synthetiséiert d'neier Zeil an där Stëmm, a splitzt se mat engem kuerzen Iwwerblendung zréck an Är Opnam, sou datt d'Beaarbechtung net héieren ass.

Et gëtt och nach eng aner, méi einfach Method, déi d'Resultat vun der ganzer Prozedur erfaasst, an zwar d'Resultat vun der ganzer Prozedur, déi an der Tabell uginn ass, andeems een d'Resultat vun der ganzer Prozedur op der Tabell opzielt.

Free Users can inpaint files up to 10 minutes long. Subscribers can inpaint files up to 30 minutes. The replacement text itself is capped at 500 characters for free Users, 5, 000 for free Accounts, and 100, 000 for paid plans.

Ganz no. D' KI benotzt bis zu 12 Sekonnen Audio ronderëm d' Beaarbechtung als Stëmmreferenz, wat genuch ass fir all eis klonfäeg Modeller (OpenVoice, CosyVoice 2) fir de Klang, d' Tonhöhe an de Sproochstil vum Sprecher z' erfaassen. Fir déi bescht Resultater, loossen Dir mindestens 3 Sekonnen vun der sauberer Sprooch direkt virum Bearbeitungspunkt.

Standardméisseg gëtt op béid Spleißpunkten (Head→Replace an Replace→Tail) e 80ms-Kräizfaden mat gläicher Kraaft ugewannt. Dir kënnt dëst iwwer de Schieber fir de Kräizfaden vun 0ms (hart Schneiden) bis 250ms upassen. Längere Kräizfaden verhënnert d'Beaarbechtung méi grondsätzlech, awer kann iwwerlappend Wierder un der Grenz héierenbar vermëschen.

Audio-Inmapping folgt der selwechter Sproochdeckung wéi Sproochklonen. Mir wielen automatesch OpenVoice fir déi meescht Sproochen an CosyVoice 2 fir Chinesesch, Japanesch a Koreanesch. Dir kënnt dat Modell an den erweideren Einstellungen iwwerschreiwen.

Dir kritt 500 Zeichen pro Sekonn fir ersat Audio. Eng 4-Sekonnen-Reparatur kascht 2.000 Zeichen. D'Käschte sinn onofhängeg vun der Längt vum Ersatztext, well d'Synthese vum Klon duerch d'Lafzäit vum neie Clip, net duerch d'Längt vum Text, beaflosst gëtt.

Laut eise Servicebedingungen, kënnt Dir nëmmen Audiodateien inspizéieren, déi Dir selwer hutt oder déi Dir explizit d'Erlaabnes hutt ze bearbeiten. D'Generéiere vu falschen Zitater, irreführenden Inhalter oder Imitatioun ass verbueden. Mir setzen Waasserzeechen op generéiert Audiodateien a protokolléieren all Inspizéierungsjobs fir d'Überpréiwung vun Missbrauch.

Wann een e Clip schneit, bleift eng merkbar Lück am Tempo an am Atem hannert; wann ee zwee Takes iwwerblendet, bleift eng tonal Mismatch. D'Inpainting füllt d'Lück mat Sprooch, déi mat der Ëmgéigend Stëmm iwwereneestinn, sou datt d'Héierende kontinuéierlech, natierlech klengen Audio héieren.

Ja — POST zu /v1/audio-inpaint/ mat der Audiodatei, start_sec, end_sec, an replacement_text. Den Endpunkt gëtt eng Job-UUID zréck; poll /v1/speech/results/?uuid= fir den inpaint Audio ze kréien wann et fäerdeg ass. Kuckt d'API-Dokumentatioun fir Detailer.

ElevenLabs Speech-to-Speech regeneréiert d'ganz Stëmmzeil vun Ufank un an eng Zilstëmm. Eis Audio-Inmailing ass chirurgisch: et beaarbecht nëmmen de markéierte Beräich, hält all aner Byte vun Ärer ursprénglecher Opnam onbetraff, an passt den neie Clip un d'Ëmgéigend Stëmm un, anstatt eng separat Stëmmbibliothéik.
5.0/5 (1)

Wat kéinte mir verbesseren? Äert Feedback hëlleft eis, Problemer ze léisen.

Fixéiert Ären Audio an e puer Sekonnen

Ersetzt all Deel vun enger Opnam mat enger KI-synthetiséierter Sprooch déi mat der Originalstëmm iwwereneestinn. Registréiert Iech gratis fir unzefänken.