AI-audio-inverven

Vervang een deel van audio door AI-synthesized speech die overeenkomt met de omliggende stem. Fix een slechte take zonder opnieuw opnemen van de hele zaak.

Audio uploaden naar Inpaint

500 tekens per seconde audio vervangen

Sleep uw bestand hierheen, of Bladeren

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

file.mp3

0 MB

Bron audio scrub om de slechte take te vinden

0.00s / 0.00s

Instellingen voor inverteren

0 / 500 tekens
Hoe lang om de splice punten te mengen. 80ms is de standaard.. match-cuts voelen natuurlijk, geen hoorbare dubbel-trigger.
Gratis aanmelden om audio-inverven te gebruiken
Audio wordt ingeschilderd...

De stem klonen en de vervanger synthetiseren...

Slicing → klonen omliggende stem → splicing met crossfade
Neemt u een tijdje? Uw resultaat zal verschijnen in uw generatiegeschiedenis wanneer klaar.
Ingeschilderde audio klaar

Vóór (origineel)

Na (Ingeschilderd)

Ingeschilderde audio downloaden

Hoe Audio-inverven werkt

Inverven is het audio-equivalent van Photoshop's content-aware fill. We klonen de stem van de audio rond uw selectie, synthetiseren de nieuwe lijn in die stem, en spliceren het terug met een korte crossfade.

Beste resultaten: laat ten minste 3 seconden schone spraak vlak voor het bewerkingspunt zodat de kloon goed referentiemateriaal heeft.

Tips voor de beste resultaten

  • Hou het gemarkeerde bereik zo strak mogelijk en alleen de slechte take
  • Vervangingstekst moet ongeveer even lang zijn als de vervanging ervan.
  • Stel de taal in die overeenkomt met de bron audio voor de beste stem match
  • 80ms crossfade is meestal onzichtbaar; bump naar 150ms als je een klik hoort
  • Voor lange bewerkingen (>10s), overwegen om de hele passage opnieuw op te nemen in plaats daarvan

Hoe AI Audio Inverven werkt

Chirurgische bewerkingen, voice-matched, zonder heropname sessie.

Stap 1

Upload + markeerbereik

Upload uw audio en gebruik de scrubber om het begin/einde van de sectie die u wilt vervangen te markeren. Typ de vervangende tekst.

Stap 2

Stemkloon + Synthesizer

We halen tot 12 seconden clean referentie audio rond uw selectie, klonen de stem van de spreker, en synthetiseren de nieuwe lijn in die stem.

Stap 3

Crossfade Splice

De gesynthetiseerde clip wordt in de originele opname gespliceerd met een even krachtige crossfade op beide bewerkingspunten. De grenzen zijn onhoorbaar.

Audio-inschilderingsplannen

Start gratis, upgrade wanneer je meer nodig hebt

Vrij
  • Tot 10 minuten bronbestanden
  • Vervangende tekst van 500 tekens
  • 4 seconden inverteren per aanvraag
  • 80ms crossfade splice
  • OpenVoice + CosyVoice 2 backends
Meest populair
Gratis account
  • Tot 10 minuten bronbestanden
  • Vervangende tekst van 5000 tekens
  • Tunable crossfade (0-250ms)
  • Voice-modeloverride
  • Generatiegeschiedenis + herbewerking
Gratis aanmelden
Pro
  • Tot 30 minuten bronbestanden
  • Vervangende tekst van 100.000 tekens
  • Prioritaire GPU-wachtrij
  • API-toegang (/v1/audio-invert/)
  • Batch-inverven (meerdere reeksen)
Upgrade

Veelgestelde vragen

Audio-inpainting (ook wel audio fill of spraak overdub) kunt u een deel van een bestaande audio-opname te vervangen door nieuwe AI-synthesized speech die overeenkomt met de oorspronkelijke stem. Het is het audio-equivalent van Photoshop's content-aware vullen verf over het deel dat u niet wilt, typ wat er moet zijn in plaats daarvan, en de AI genereert een naadloze vervanging.

Markeer het tijdbereik om te vervangen, typ de nieuwe dialooglijn, en klik op Inpaint. Onze AI kloont de stem van de audio rond uw selectie, synthetiseert de nieuwe lijn in die stem, en splicit het terug in uw opname met een korte crossfade, zodat de bewerking is onhoorbaar.

Gebruik het wanneer u een enkel slecht woord, mispronunciation, naam slip, vloek woord, of feit fout in een anders-goede take. Re-opname van de hele passage introduceert vaak tonale mismatch met de rest van het project te herstellen alleen wat moet worden vastgesteld, terwijl het houden van elke andere lettergreep intact.

Gratis gebruikers kunnen bestanden tot 10 minuten lang inschilderen. Abonnees kunnen bestanden tot 30 minuten inschilderen. De vervangende tekst zelf is beperkt tot 500 tekens voor gratis gebruikers, 5.000 voor gratis accounts en 100.000 voor betaalde plannen.

Zeer dichtbij. De AI gebruikt maximaal 12 seconden audio rondom de edit als een spraakreferentie, wat genoeg is voor elk van onze klonen-geschikte modellen (OpenVoice, CosyVoice 2) om de luidspreker timbre, toonhoogte, en sprekende stijl vast te leggen. Voor het beste resultaat, laat ten minste 3 seconden van clean speech vlak voor het bewerkingspunt.

We passen een 80ms gelijk-power crossfade aan op beide splice punten (head→placement en replacement→tail) standaard. U kunt dit afstellen vanaf 0ms (harde snit) tot 250ms via de Crossfade slider. Langere crossfades verbergen de bewerking meer grondig maar kunnen hoorbaar overlappende woorden op de grens mengen.

Audio-inverven volgt dezelfde taaldekking als voice klonen. We auto-pick OpenVoice voor de meeste talen en CosyVoice 2 voor Chinees, Japans en Koreaans. U kunt het model overschrijven in geavanceerde instellingen.

U krijgt 500 tekens per seconde audio vervangen. Een 4 seconden fix kost 2.000 tekens. De kosten zijn onafhankelijk van hoe lang de vervangende tekst is, aangezien de onderliggende clone synthese wordt afgesloten door de run tijd van de nieuwe clip, niet de tekst lengte.

Per onze Servicevoorwaarden kunt u alleen audio inverteren die u bezit of uitdrukkelijk toestemming hebben om te bewerken. Het genereren van valse citaten, misleidende inhoud of imitaties is verboden. We watermerk gegenereerde audio en log alle invervende taken voor misbruik review.

Het snijden van een clip laat een merkbaar gat in pacing en adem; cross-fading twee neemt laat een tonale discrepantie. Inverven vult de kloof met spraak die overeenkomt met de omliggende stem, zodat luisteraars horen continue, natuurlijk klinkende audio.

Ja POST naar /v1/audio-inpaint/ met het audiobestand, start_sec, end_sec en replacement_text. Het eindpunt geeft een taak UUID; poll /v1/speech/results/?uuid= terug om de ingeschilderde audio op te halen wanneer klaar. Zie API docs voor details.

ElevenLabs Speech-to-Speech regenereert de hele stemlijn vanaf nul in een doelstem. Onze audio-inschildering is chirurgisch: het bewerkt alleen het gemarkeerde bereik, houdt elke andere byte van uw originele opname onaangeroerd, en past de nieuwe clip aan de omliggende stem in plaats van een aparte spraakbibliotheek.
5.0/5 (1)

Wat kunnen we verbeteren? Uw feedback helpt ons problemen op te lossen.

Repareer uw audio in seconden

Vervang elk onderdeel van elke opname door AI-synthesized speech die overeenkomt met de oorspronkelijke stem. Schrijf je gratis in om te beginnen.