AI Audio Inpainting
Ersätt en del av ljudet med AI-synthet tal som matchar den omgivande rösten. Fixa en dålig ta utan att åter spela in hela saken.
Ladda upp ljud till Inpaint
500 tecken per sekund av ljud ersattDra och släpp filen här, eller bläddra
Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.file.mp3
0 MBKälla ljud — skrubba för att hitta den dåliga ta
Inställningar av målarfärg
Klona rösten och syntetisera ersättaren...
Skärning → kloning omgivande röst → skarvning med crossfadeFöre (Ursprunglig)
Efter (målad)
Hur Audio Inpainting fungerar
Inpainting är ljud motsvarigheten till Photoshops innehåll-medveten fyllning. Vi klonar rösten från ljudet som omger ditt val, syntetisera den nya linjen i den rösten, och skarva den tillbaka med en kort crossfade.
Bästa resultat: lämna minst 3 sekunder av rent tal omedelbart innan redigeringspunkten så klonaren har bra referensmaterial.
Tips för bästa resultat
- Håll det markerade området så tätt som möjligt – bara den dåliga ta
- Ersättningstexten bör vara ungefär lika lång som den ersätter
- Ställ in språket för att matcha källljudet för bästa röstmatchning
- 80 ms crossfade är vanligtvis osynlig; bula till 150 ms om du hör ett klick
- För långa redigeringar (>10s), överväga att åter spela in hela passagen istället
Hur AI Audio Inpainting fungerar
Kirurgiska redigeringar, röstmatchade, utan omregistreringssession.
Ladda upp + markera intervall
Ladda upp ditt ljud och använd skrubbern för att markera början/slutet av avsnittet du vill byta ut. Skriv in ersättningstexten.
Röstklon + synthesize
Vi extraherar upp till 12 sekunder av rent referensljud som omger ditt val, klonar högtalarens röst, och syntetiserar den nya linjen i den rösten.
Tvärsnittsreplice
Det syntetiserade klippet är skarvat till den ursprungliga inspelningen med en crossfade med lika stor effekt vid båda redigeringspunkterna. Gränserna är ohörbara.
Planer för ljudmålning
Starta gratis, uppgradera när du behöver mer
- Upp till 10 minuters källfiler
- Texten som ersätter 500 tecken
- 4-sekunders färg per begäran
- 80 ms crossfade splice
- OpenVoice + CosyVoice 2 gränssnitt
- Upp till 10 minuters källfiler
- 5 000 teckens ersättningstext
- Avkopplingsbar crossfade (0-250 ms)
- Överskridning av röstmodell
- Generationshistorik + återredigering
- Upp till 30 minuters källfiler
- Tilläggstext för 100 000 tecken
- Prioriterad GPU- kö
- API-åtkomst (/v1/audio-inpaint/)
- Partiinmålning (flera intervall)
Vanliga frågor
Vad kan vi förbättra? Din feedback hjälper oss att lösa problem.
Rätta ditt ljud i sekunder
Ersätt alla delar av varje inspelning med AI-synthet tal som matchar den ursprungliga rösten. Registrera dig gratis för att starta.