Rapporteer bug / feature request

AI-audio-inverven

Vervang een deel van audio door AI-synthesized speech die overeenkomt met de omliggende stem. Fix een slechte take zonder opnieuw opnemen van de hele zaak.

Gratis aanmelden

Audio uploaden naar Inpaint

500 tekens per seconde audio vervangen

Sleep uw bestand hierheen, of Bladeren

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Instellingen voor inverteren

Begin (seconden)

Einde (seconden)

Vervangingstekst: wat moet er gezegd worden in de kloof 0 / 500 tekens

Taal

Crossfade 80 ms Hoe lang om de splice punten te mengen. 80ms is de standaard.. match-cuts voelen natuurlijk, geen hoorbare dubbel-trigger.

Gratis aanmelden om audio-inverven te gebruiken

Hoe Audio-inverven werkt

Inverven is het audio-equivalent van Photoshop's content-aware fill. We klonen de stem van de audio rond uw selectie, synthetiseren de nieuwe lijn in die stem, en spliceren het terug met een korte crossfade.

Beste resultaten: laat ten minste 3 seconden schone spraak vlak voor het bewerkingspunt zodat de kloon goed referentiemateriaal heeft.

Tips voor de beste resultaten

Hou het gemarkeerde bereik zo strak mogelijk en alleen de slechte take
Vervangingstekst moet ongeveer even lang zijn als de vervanging ervan.
Stel de taal in die overeenkomt met de bron audio voor de beste stem match
80ms crossfade is meestal onzichtbaar; bump naar 150ms als je een klik hoort
Voor lange bewerkingen (>10s), overwegen om de hele passage opnieuw op te nemen in plaats daarvan

Hoe AI Audio Inverven werkt

Chirurgische bewerkingen, voice-matched, zonder heropname sessie.

Stap 1

Upload + markeerbereik

Upload uw audio en gebruik de scrubber om het begin/einde van de sectie die u wilt vervangen te markeren. Typ de vervangende tekst.

Stap 2

Stemkloon + Synthesizer

We halen tot 12 seconden clean referentie audio rond uw selectie, klonen de stem van de spreker, en synthetiseren de nieuwe lijn in die stem.

Stap 3

Crossfade Splice

De gesynthetiseerde clip wordt in de originele opname gespliceerd met een even krachtige crossfade op beide bewerkingspunten. De grenzen zijn onhoorbaar.

Audio-inschilderingsplannen

Start gratis, upgrade wanneer je meer nodig hebt

Vrij

Tot 10 minuten bronbestanden
Vervangende tekst van 500 tekens
4 seconden inverteren per aanvraag
80ms crossfade splice
OpenVoice + CosyVoice 2 backends

Meest populair

Gratis account

Tot 10 minuten bronbestanden
Vervangende tekst van 5000 tekens
Tunable crossfade (0-250ms)
Voice-modeloverride
Generatiegeschiedenis + herbewerking

Gratis aanmelden

Pro

Tot 30 minuten bronbestanden
Vervangende tekst van 100.000 tekens
Prioritaire GPU-wachtrij
API-toegang (/v1/audio-invert/)
Batch-inverven (meerdere reeksen)

Upgrade

Veelgestelde vragen

Audio-inpainting (ook wel audio fill of spraak overdub) kunt u een deel van een bestaande audio-opname te vervangen door nieuwe AI-synthesized speech die overeenkomt met de oorspronkelijke stem. Het is het audio-equivalent van Photoshop's content-aware vullen verf over het deel dat u niet wilt, typ wat er moet zijn in plaats daarvan, en de AI genereert een naadloze vervanging.

Markeer het tijdbereik om te vervangen, typ de nieuwe dialooglijn, en klik op Inpaint. Onze AI kloont de stem van de audio rond uw selectie, synthetiseert de nieuwe lijn in die stem, en splicit het terug in uw opname met een korte crossfade, zodat de bewerking is onhoorbaar.

Gebruik het wanneer u een enkel slecht woord, mispronunciation, naam slip, vloek woord, of feit fout in een anders-goede take. Re-opname van de hele passage introduceert vaak tonale mismatch met de rest van het project te herstellen alleen wat moet worden vastgesteld, terwijl het houden van elke andere lettergreep intact.

Gratis gebruikers kunnen bestanden tot 10 minuten lang inschilderen. Abonnees kunnen bestanden tot 30 minuten inschilderen. De vervangende tekst zelf is beperkt tot 500 tekens voor gratis gebruikers, 5.000 voor gratis accounts en 100.000 voor betaalde plannen.

Zeer dichtbij. De AI gebruikt maximaal 12 seconden audio rondom de edit als een spraakreferentie, wat genoeg is voor elk van onze klonen-geschikte modellen (OpenVoice, CosyVoice 2) om de luidspreker timbre, toonhoogte, en sprekende stijl vast te leggen. Voor het beste resultaat, laat ten minste 3 seconden van clean speech vlak voor het bewerkingspunt.

We passen een 80ms gelijk-power crossfade aan op beide splice punten (head→placement en replacement→tail) standaard. U kunt dit afstellen vanaf 0ms (harde snit) tot 250ms via de Crossfade slider. Langere crossfades verbergen de bewerking meer grondig maar kunnen hoorbaar overlappende woorden op de grens mengen.

Audio-inverven volgt dezelfde taaldekking als voice klonen. We auto-pick OpenVoice voor de meeste talen en CosyVoice 2 voor Chinees, Japans en Koreaans. U kunt het model overschrijven in geavanceerde instellingen.

U krijgt 500 tekens per seconde audio vervangen. Een 4 seconden fix kost 2.000 tekens. De kosten zijn onafhankelijk van hoe lang de vervangende tekst is, aangezien de onderliggende clone synthese wordt afgesloten door de run tijd van de nieuwe clip, niet de tekst lengte.

Per onze Servicevoorwaarden kunt u alleen audio inverteren die u bezit of uitdrukkelijk toestemming hebben om te bewerken. Het genereren van valse citaten, misleidende inhoud of imitaties is verboden. We watermerk gegenereerde audio en log alle invervende taken voor misbruik review.

Het snijden van een clip laat een merkbaar gat in pacing en adem; cross-fading twee neemt laat een tonale discrepantie. Inverven vult de kloof met spraak die overeenkomt met de omliggende stem, zodat luisteraars horen continue, natuurlijk klinkende audio.

Ja POST naar /v1/audio-inpaint/ met het audiobestand, start_sec, end_sec en replacement_text. Het eindpunt geeft een taak UUID; poll /v1/speech/results/?uuid= terug om de ingeschilderde audio op te halen wanneer klaar. Zie API docs voor details.

ElevenLabs Speech-to-Speech regenereert de hele stemlijn vanaf nul in een doelstem. Onze audio-inschildering is chirurgisch: het bewerkt alleen het gemarkeerde bereik, houdt elke andere byte van uw originele opname onaangeroerd, en past de nieuwe clip aan de omliggende stem in plaats van een aparte spraakbibliotheek.

5.0/5 (1)

Repareer uw audio in seconden

Vervang elk onderdeel van elke opname door AI-synthesized speech die overeenkomt met de oorspronkelijke stem. Schrijf je gratis in om te beginnen.

Gratis aanmelden Prijzen bekijken

AI-audio-inverven

Audio uploaden naar Inpaint

Bron audio scrub om de slechte take te vinden

Instellingen voor inverteren

Vóór (origineel)

Na (Ingeschilderd)

Hoe Audio-inverven werkt

Tips voor de beste resultaten

Hoe AI Audio Inverven werkt

Upload + markeerbereik

Stemkloon + Synthesizer

Crossfade Splice

Audio-inschilderingsplannen

Veelgestelde vragen

Repareer uw audio in seconden

AI-audio-inverven

Audio uploaden naar Inpaint

Bron audio scrub om de slechte take te vinden

Instellingen voor inverteren

Vóór (origineel)

Na (Ingeschilderd)

Hoe Audio-inverven werkt

Tips voor de beste resultaten

Hoe AI Audio Inverven werkt

Upload + markeerbereik

Stemkloon + Synthesizer

Crossfade Splice

Audio-inschilderingsplannen

Veelgestelde vragen

Wat is audio-inverven?

Hoe werkt het?

Wanneer moet ik audio-inverven gebruiken in plaats van opnieuw opnemen?

Hoe lang kan de bron audio duren?

Klinkt de ingekleurde speech precies als de oorspronkelijke speaker?

Wat gebeurt er bij de bewerkingsgrens?

Welke talen worden ondersteund?

Hoeveel kost audio-inverven?

Kan ik dit gebruiken om woorden in iemands mond te stoppen die ze nooit zeiden?

Waarom inschilderen gebruiken in plaats van gewoon verwijderen van de slechte sectie?

Is de audio-inverf API beschikbaar?

Hoe verhoudt dit zich tot ElevenLabs Speech-to-Speech?

Repareer uw audio in seconden