AI Audio Inpainting

Zamijenite dio zvuka sa AI-sinteziranim govorom koji odgovara okolnom glasu. Ispravite lošu snimku bez ponovnog snimanja cijele stvari.

Još nemamo TTS glasove na vašem jeziku. Pomozite nam da dodamo vaše! Prodaj svoj glas

_Učitaj

500 znakova u sekundi zamijenjenog zvuka

Povuci i ispusti datoteku ovdje, ili pregledaj

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

datoteka.mp3

0 MB

Izvorni zvuk — očisti da bi pronašao lošu snimku

0.00s / 0.00s

Postavke za Inpaint

0 / 500 znakovi
Koliko dugo da se miješaju tačke spajanja. 80ms je uobičajeno - rezanje se čini prirodnim, nema zvučnog dvostrukog okidača.
Registracija je besplatna za korištenje audio inpaintinga
Uključujem zvuk...

Kloniranje glasa i sinteza zamjene...

Slice → Cloning surrounding voice → Splicing with crossfade
Rezultat će se pojaviti u vašem računu. generation history Kad budeš spreman.
Inpainted Audio Ready

Prije (originalno)

Nakon (oslikano)

Kako radi slikanje zvuka

Inpainting je audio ekvivalent Photoshopove ispune koja se oslanja na sadržaj. Kloniramo glas iz zvuka oko vašeg odabira, sintetiziramo novu liniju u tom glasu, i spojimo ga nazad sa kratkim unakrsnim izblijedjenjem.

Najbolji rezultati: ostavite najmanje 3 sekunde čistog govora neposredno prije točke uređivanja tako da kloner ima dobar referentni materijal.

Savjeti za najbolje rezultate

  • Drži označeni raspon što je moguće uži — samo loše snimke
  • Zamjenski tekst bi trebao biti otprilike iste dužine kao i ono što zamjenjuje
  • Postavite jezik da odgovara izvornom audiozapisu za najbolje podudaranje glasa
  • 80ms crossfade je obično nevidljivo; nagle promjene na 150ms ako čujete klik
  • Za duge izmjene (>10s), razmislite o ponovnom snimanju cijelog odlomka

Kako AI Audio Inpainting funkcionira

Kirurška obrada, usklađen glas, bez ponovne sesije snimanja.

Korak 1

Upload + Mark Range

Učitaj svoj audio i koristi četku da označiš početak/kraj sekcije koju želiš zamijeniti. Unesi tekst zamjene.

Korak 2

Voice Clone + Synthesize

Izvadimo do 12 sekundi čistog referentnog zvuka oko vašeg izbora, kloniramo govornikov glas, i sintetiziramo novu liniju u tom glasu.

Korak 3

Crossfade Splice

Sintezovani isječak je spojen u originalnu snimku sa jednako jakim unakrsnim izblizavanjem u obje tačke uređivanja. Granice su nečujne.

Planovi za slikanje zvuka

Počnite besplatno, nadogradite kada vam treba više

Slobodan
  • Izvorne datoteke do 10 minuta
  • Tekst zamjene od 500 znakova
  • 4-sekunda inpaint po zahtjevu
  • 80ms crossfade splice
  • OpenVoice + CosyVoice 2 backends
Najpopularnije
Slobodan račun
  • Izvorne datoteke do 10 minuta
  • Tekst zamjene od 5.000 znakova
  • Podesivo izbliza (0-250ms)
  • Preglasavanje glasovnog modela
  • Historija stvaranja + ponovno uređivanje
Prijavite se besplatno
Pro
  • Do 30 minuta izvornih datoteka
  • Tekst zamjene od 100.000 znakova
  • Prioritet GPU reda
  • API pristup (/v1/audio-inpaint/)
  • Serijsko oslikavanje (više raspona)
Nadogradi

Često postavljana pitanja

Audio ispuna (također zvana audio ispuna ili govorna nadglasavanja) vam omogućava da zamijenite dio postojećeg audio snimanja novim AI-sinteziranim govorom koji odgovara originalnom glasu. To je audio ekvivalent Photoshop-ovog sadržajno-osjetljivog ispuna — prebojte dio koji ne želite, upišite ono što bi trebalo biti tamo umjesto toga, i AI generira besprijekornu zamjenu.

Označite vremenski raspon za zamjenu, upišite novu liniju dijaloga, i kliknite Inpaint. Naša AI klonira glas iz zvuka oko vašeg odabira, sintetizira novu liniju u tom glasu, i spaja ga natrag u vašu snimku sa kratkim unakrsnim izblijedjenjem tako da je uređivanje nečujno.

Koristite ga kada imate jednu lošu riječ, pogrešan izgovor, pogrešno ime, psovku ili grešku u činjenici u inače dobrom snimanju. Ponovno snimanje cijelog odlomka često dovodi do nepodudarnosti tona s ostatkom projekta - inpainting popravlja samo ono što treba popraviti, a zadržava svaki drugi slog netaknut.

Besplatni korisnici mogu slikati datoteke do 10 minuta dužine. Pretplatnici mogu slikati datoteke do 30 minuta. Sam tekst zamjene je ograničen na 500 znakova za besplatne korisnike, 5.000 za besplatne račune, i 100.000 za plaćene planove.

Vrlo blizu. AI koristi do 12 sekundi zvuka oko uređivanja kao referencu glasa, što je dovoljno za bilo koji od naših modela koji mogu klonirati (OpenVoice, CosyVoice 2) da uhvate ton govornika, visinu glasa i stil govora. Za najbolje rezultate, ostavite najmanje 3 sekunde čistog govora neposredno prije tačke uređivanja.

Prema zadanim postavkama primjenjujemo 80ms jednako snažno izbljeđivanje na obje tačke spajanja (glava→zamjena i zamjena→repa). Možete to podesiti od 0ms (težak rez) do 250ms putem klizača za izbljeđivanje. Dulja izbljeđivanja skrivaju uređivanje temeljitije, ali mogu zvučno miješati preklapajuće riječi na granici.

Uključivanje zvuka slijedi isti jezik kao i kloniranje glasa. Automatski odabiremo OpenVoice za većinu jezika i CosyVoice 2 za kineski, japanski i korejski. Možete nadjačati model u naprednim postavkama.

Naplaćuje se 500 znakova po sekundi zamijenjenog zvuka. Popravak od 4 sekunde košta 2.000 znakova. Trošak je nezavisan od dužine zamjenskog teksta, pošto je osnovna sinteza klona ograničena vremenom izvođenja novog isječka, a ne dužinom teksta.

Prema našim Uvjetima korištenja, možete ugraditi samo audio koji posjedujete ili imate eksplicitno dopuštenje za uređivanje. Generiranje lažnih citata, obmanjujućih sadržaja ili imitacija je zabranjeno. Mi označavamo generirani audio i bilježimo sve zadatke ugradnje radi pregleda zloupotrebe.

Rezanje isječka ostavlja primjetan jaz u tempu i disanju; unakrsno izbjeljivanje dvaju snimaka ostavlja tonsku nepodudarnost. Inpainting popunjava jaz govorom koji odgovara okolnom glasu, tako da slušaoci čuju kontinuirani, prirodno zvučni zvuk.

Da — POST u /v1/audio-inpaint/ sa audio datotekom, start_sec, end_sec, i replacement_text. Krajnja tačka vraća UUID posla; upita /v1/speech/results/?uuid= da se dobije obojeni audio kad bude spreman. Pogledajte API dokumentaciju za detalje.

ElevenLabs Speech-to-Speech regenerira cijelu liniju glasa od nule u ciljani glas. Naše zvučno uokvirivanje je kirurško: uređuje samo označeni raspon, drži svaki drugi bajt vaše originalne snimke nedirnut, i podudara novi isječak sa okolnim glasom umjesto odvojene biblioteke glasova.
5.0/5 (1)

Šta možemo da poboljšamo? Vaše povratne informacije nam pomažu da riješimo probleme.

Popravite svoj audio u sekundama

Zamijenite bilo koji dio bilo koje snimke sa AI-sinteziranim govorom koji odgovara originalnom glasu. Registrirajte se besplatno da biste počeli.