Prijavi grešku / Zahtjev za značajkom

AI Audio Inpainting

Zamijenite dio zvuka sa AI-sinteziranim govorom koji odgovara okolnom glasu. Ispravite lošu snimku bez ponovnog snimanja cijele stvari.

Prijavite se besplatno

Još nemamo TTS glasove na vašem jeziku. Pomozite nam da dodamo vaše! Prodaj svoj glas

_Učitaj

500 znakova u sekundi zamijenjenog zvuka

Povucispusti datoteku ovdje, ili pregledaj

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Postavke za Inpaint

Početak (sekunde)

Kraj (sekunde)

Zamjenski tekst — šta bi trebalo reći u praznini 0 / 500 znakovi

Jezik

Crossfade 80 ms Koliko dugo da se miješaju tačke spajanja. 80ms je uobičajeno - rezanje se čini prirodnim, nema zvučnog dvostrukog okidača.

Registracija je besplatna za korištenje audio inpaintinga

Kako radi slikanje zvuka

Inpainting je audio ekvivalent Photoshopove ispune koja se oslanja na sadržaj. Kloniramo glas iz zvuka oko vašeg odabira, sintetiziramo novu liniju u tom glasu, i spojimo ga nazad sa kratkim unakrsnim izblijedjenjem.

Najbolji rezultati: ostavite najmanje 3 sekunde čistog govora neposredno prije točke uređivanja tako da kloner ima dobar referentni materijal.

Savjeti za najbolje rezultate

Drži označeni raspon što je moguće uži — samo loše snimke
Zamjenski tekst bi trebao biti otprilike iste dužine kao i ono što zamjenjuje
Postavite jezik da odgovara izvornom audiozapisu za najbolje podudaranje glasa
80ms crossfade je obično nevidljivo; nagle promjene na 150ms ako čujete klik
Za duge izmjene (>10s), razmislite o ponovnom snimanju cijelog odlomka

Kako AI Audio Inpainting funkcionira

Kirurška obrada, usklađen glas, bez ponovne sesije snimanja.

Korak 1

Upload + Mark Range

Učitaj svoj audio i koristi četku da označiš početak/kraj sekcije koju želiš zamijeniti. Unesi tekst zamjene.

Korak 2

Voice Clone + Synthesize

Izvadimo do 12 sekundi čistog referentnog zvuka oko vašeg izbora, kloniramo govornikov glas, i sintetiziramo novu liniju u tom glasu.

Korak 3

Crossfade Splice

Sintezovani isječak je spojen u originalnu snimku sa jednako jakim unakrsnim izblizavanjem u obje tačke uređivanja. Granice su nečujne.

Planovi za slikanje zvuka

Počnite besplatno, nadogradite kada vam treba više

Slobodan

Izvorne datoteke do 10 minuta
Tekst zamjene od 500 znakova
4-sekunda inpaint po zahtjevu
80ms crossfade splice
OpenVoice + CosyVoice 2 backends

Najpopularnije

Slobodan račun

Izvorne datoteke do 10 minuta
Tekst zamjene od 5.000 znakova
Podesivo izbliza (0-250ms)
Preglasavanje glasovnog modela
Historija stvaranja + ponovno uređivanje

Prijavite se besplatno

Pro

Do 30 minuta izvornih datoteka
Tekst zamjene od 100.000 znakova
Prioritet GPU reda
API pristup (/v1/audio-inpaint/)
Serijsko oslikavanje (više raspona)

Nadogradi

Često postavljana pitanja

Audio ispuna (također zvana audio ispuna ili govorna nadglasavanja) vam omogućava da zamijenite dio postojećeg audio snimanja novim AI-sinteziranim govorom koji odgovara originalnom glasu. To je audio ekvivalent Photoshop-ovog sadržajno-osjetljivog ispuna — prebojte dio koji ne želite, upišite ono što bi trebalo biti tamo umjesto toga, i AI generira besprijekornu zamjenu.

Označite vremenski raspon za zamjenu, upišite novu liniju dijaloga, i kliknite Inpaint. Naša AI klonira glas iz zvuka oko vašeg odabira, sintetizira novu liniju u tom glasu, i spaja ga natrag u vašu snimku sa kratkim unakrsnim izblijedjenjem tako da je uređivanje nečujno.

Koristite ga kada imate jednu lošu riječ, pogrešan izgovor, pogrešno ime, psovku ili grešku u činjenici u inače dobrom snimanju. Ponovno snimanje cijelog odlomka često dovodi do nepodudarnosti tona s ostatkom projekta - inpainting popravlja samo ono što treba popraviti, a zadržava svaki drugi slog netaknut.

Besplatni korisnici mogu slikati datoteke do 10 minuta dužine. Pretplatnici mogu slikati datoteke do 30 minuta. Sam tekst zamjene je ograničen na 500 znakova za besplatne korisnike, 5.000 za besplatne račune, i 100.000 za plaćene planove.

Vrlo blizu. AI koristi do 12 sekundi zvuka oko uređivanja kao referencu glasa, što je dovoljno za bilo koji od naših modela koji mogu klonirati (OpenVoice, CosyVoice 2) da uhvate ton govornika, visinu glasa i stil govora. Za najbolje rezultate, ostavite najmanje 3 sekunde čistog govora neposredno prije tačke uređivanja.

Prema zadanim postavkama primjenjujemo 80ms jednako snažno izbljeđivanje na obje tačke spajanja (glava→zamjena i zamjena→repa). Možete to podesiti od 0ms (težak rez) do 250ms putem klizača za izbljeđivanje. Dulja izbljeđivanja skrivaju uređivanje temeljitije, ali mogu zvučno miješati preklapajuće riječi na granici.

Uključivanje zvuka slijedi isti jezik kao i kloniranje glasa. Automatski odabiremo OpenVoice za većinu jezika i CosyVoice 2 za kineski, japanski i korejski. Možete nadjačati model u naprednim postavkama.

Naplaćuje se 500 znakova po sekundi zamijenjenog zvuka. Popravak od 4 sekunde košta 2.000 znakova. Trošak je nezavisan od dužine zamjenskog teksta, pošto je osnovna sinteza klona ograničena vremenom izvođenja novog isječka, a ne dužinom teksta.

Prema našim Uvjetima korištenja, možete ugraditi samo audio koji posjedujete ili imate eksplicitno dopuštenje za uređivanje. Generiranje lažnih citata, obmanjujućih sadržaja ili imitacija je zabranjeno. Mi označavamo generirani audio i bilježimo sve zadatke ugradnje radi pregleda zloupotrebe.

Rezanje isječka ostavlja primjetan jaz u tempu i disanju; unakrsno izbjeljivanje dvaju snimaka ostavlja tonsku nepodudarnost. Inpainting popunjava jaz govorom koji odgovara okolnom glasu, tako da slušaoci čuju kontinuirani, prirodno zvučni zvuk.

Da — POST u /v1/audio-inpaint/ sa audio datotekom, start_sec, end_sec, i replacement_text. Krajnja tačka vraća UUID posla; upita /v1/speech/results/?uuid= da se dobije obojeni audio kad bude spreman. Pogledajte API dokumentaciju za detalje.

ElevenLabs Speech-to-Speech regenerira cijelu liniju glasa od nule u ciljani glas. Naše zvučno uokvirivanje je kirurško: uređuje samo označeni raspon, drži svaki drugi bajt vaše originalne snimke nedirnut, i podudara novi isječak sa okolnim glasom umjesto odvojene biblioteke glasova.

5.0/5 (1)

Popravite svoj audio u sekundama

Zamijenite bilo koji dio bilo koje snimke sa AI-sinteziranim govorom koji odgovara originalnom glasu. Registrirajte se besplatno da biste počeli.

Prijavite se besplatno Prikaži cijene

AI Audio Inpainting

_Učitaj

Izvorni zvuk — očisti da bi pronašao lošu snimku

Postavke za Inpaint

Prije (originalno)

Nakon (oslikano)

Kako radi slikanje zvuka

Savjeti za najbolje rezultate

Kako AI Audio Inpainting funkcionira

Upload + Mark Range

Voice Clone + Synthesize

Crossfade Splice

Planovi za slikanje zvuka

Često postavljana pitanja

Popravite svoj audio u sekundama

AI Audio Inpainting

_Učitaj

Izvorni zvuk — očisti da bi pronašao lošu snimku

Postavke za Inpaint

Prije (originalno)

Nakon (oslikano)

Kako radi slikanje zvuka

Savjeti za najbolje rezultate

Kako AI Audio Inpainting funkcionira

Upload + Mark Range

Voice Clone + Synthesize

Crossfade Splice

Planovi za slikanje zvuka

Često postavljana pitanja

Šta je audio inpainting?

Kako to funkcioniše?

Kada bih trebao koristiti audio inpainting umjesto ponovnog snimanja?

Koliko dugo može trajati izvorni zvuk?

Hoće li oslikani govor zvučati isto kao originalni govornik?

Šta se dešava na granicama uređivanja?

Koji su jezici podržani?

Koliko košta slikanje zvuka?

Mogu li ovo koristiti da stavim riječi u usta nekome ko ih nikad nije rekao?

Zašto koristiti inpainting umjesto samo brisanja lošeg dijela?

Da li je dostupno API za upisivanje zvuka?

Kako se ovo uspoređuje sa ElevenLabs govor-na-govor?

Popravite svoj audio u sekundama