tekoälyn äänimaalaukset

Korvaa ääniosuus tekoälyyn yhdistetyllä puheella, joka vastaa ympäröivää ääntä. Korjaa huono kuva tallentamatta koko juttua uudelleen.

Lähetä ääni maaliin

500 merkkiä sekunnissa vaihdettua ääntä

Vedä & pudota tiedostosi tähän, tai selaa

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

file.mp3

0 MB

Lähteen ääni – kuivaa löytääksesi huonon otoksen

0.00s / 0.00s

Maalausasetukset

0 / 500 hahmot
Kuinka kauan saumapisteitä voi sekoittaa. 80 ms on oletus – ottelun pistokkaat tuntuvat luonnollisilta, ei kuuloaistilta kaksoislaukaisimelta.
Rekisteröidy ilmaiseksi äänimaalauksen avulla
Maalataan ääntä...

Äänen kloonaus ja korvaamisen syntetisointi...

Viipalointi → ääntä ympäröivä kloonaus → risteytys crossfaden kanssa
Meneekö aika? Tuloksesi tulee näkymään sukupolven historia Kun se on valmis.
Maalattu ääni valmiina

Ennen (Alkuperäinen)

Jälkeen (maalattu)

Lataa maalattu ääni

Miten äänimaalaukset toimivat

Maalaus vastaa Photoshopin sisältöä. Kloonaamme äänen valintaasi ympäröivästä äänestä, syntetisoimme uuden viivan tuohon ääneen ja liitämme sen takaisin lyhyeen ristiin.

Parhaat tulokset: jätä vähintään 3 sekuntia puhdasta puhetta välittömästi ennen muokkauspistettä, jotta kloonilla on hyvä vertailumateriaali.

Vinkkejä parhaisiin tuloksiin

  • Pidä merkitty kantama mahdollisimman tiukkana – vain huono otto
  • Korvaustekstin tulisi olla suunnilleen yhtä pitkä kuin se, mitä se korvaa
  • Aseta kieli vastaamaan lähdeääntä parhaalle äänitaidolle
  • 80 ms crossfade on yleensä näkymätön; kuoppa 150 ms, jos kuulet naksahduksen
  • Harkitkaa pitkien muokkausten (>10-lukujen) osalta koko kappaleen nauhoittamista uudelleen.

Miten tekoälyn äänimaalaus toimii

Kirurgisia editaatioita, äänitallenteita, joissa ei ole uusintaäänityssessiota.

Vaihe 1

Lataa + merkkiväli

Lataa ääni ja käytä pesuria korvataksesi osan alun/pään. Kirjoita korvaava teksti.

Vaihe 2

Ääniklooni + Synthesize

Vedämme jopa 12 sekuntia puhdasta referenssiääntä valintasi ympärille, kloonaamme puhujan äänen ja syntetisoimme uuden repliikin tuohon ääneen.

Vaihe 3

Ristiviittaus

Syntetoitu klippi on liitetty alkuperäiseen nauhoitukseen tasavahvuisella crossfadilla molemmissa editointipisteissä. Rajat ovat kuulumattomat.

Äänivärjäyssuunnitelmat

Aloita ilmaiseksi, päivitä kun tarvitset lisää

Vapaa
  • Enintään 10 minuutin lähdetiedostot
  • 500-merkkinen korvaava teksti
  • Neljän sekunnin maali per pyyntö
  • 80 millimetrin ristikkoväli
  • OpenVoice + CosyVoice 2 backends
Suosituin
Vapaa tili
  • Enintään 10 minuutin lähdetiedostot
  • 5 000-merkkinen korvaava teksti
  • Vaihdettava crossfade (0-250 ms)
  • Äänimallin ohitus
  • Sukupolven historia + uudelleen edit
Rekisteröidy ilmaiseksi
Pro
  • Jopa 30 minuutin lähdetiedostot
  • 100 000 merkin korvaava teksti
  • Ensisijainen GPU-jono
  • API-yhteys (/v1/audio-inpainike/)
  • Erän maalaaminen (moninkertainen valikoima)
Päivitys

Usein kysyttyjä kysymyksiä

Äänimaalauksen (jota kutsutaan myös äänentäytteeksi tai puheeksi yliannokseksi) avulla voit korvata olemassa olevan äänitallenteen uudella tekoälyn kokoisella puheella, joka vastaa alkuperäistä ääntä. Se vastaa Photoshopin sisältötietoista täytettä – maalaa sen osan päälle, jota et halua, kirjoita sen sijaan, mitä siellä pitäisi olla, ja tekoäly luo saumattoman korvaamisen.

Merkitse aikaväli tilalle, kirjoita uusi dialogilinja ja napsauta Inpaint. Tekoälymme kloonaa äänen valintaasi ympäröivästä äänestä, syntetisoi uuden rivin tuohon ääneen ja liittää sen takaisin tallenteeseen lyhyellä ristiviittauksella, joten muokkaus on kuulumaton.

Käytä sitä, kun sinulla on yksikin huono sana, väärin lausuminen, nimilipaus, kirosana tai faktavirhe muussa kuin hyvässä otoksessa. Koko kappaleen uudelleen tallentaminen tuo usein esiin tonaalisen epäsuhtaisuuden projektin muihin osiin – maalaamalla korjataan vain se, mikä pitää korjata samalla, kun kaikki muut tavut pysyvät koskemattomina.

Vapaat käyttäjät voivat maalata tiedostoja jopa 10 minuuttia. Tilaajat voivat maalata tiedostoja jopa 30 minuuttia. Itse korvaava teksti on 500 merkkiä ilmaisille käyttäjille, 5 000 ilmaista tiliä ja 100 000 maksullista suunnitelmaa.

Hyvin lähellä. Tekoäly käyttää äänireferenssinä jopa 12 sekuntia editointia ympäröivää ääntä, mikä riittää kaikille kloonauskykyisille malleillemme (OpenVoice, CosyVoice 2), jotta puhujan sävy, sävel ja puhetyyli voidaan vangita. Parhaisiin tuloksiin pääsemiseksi on syytä jättää vähintään 3 sekuntia puhdasta puhetta välittömästi ennen muokkauspistettä.

Sovellamme 80 millimetrin tasavahvuista crossfadea kumpaankin risteyskohtaan (head→replacement and replacement→tail) oletuksena. Voit virittää tämän 0 millimetristä (kova leikkaus) 250 millimetriin Crossfade-liukumäen kautta. Pidemmät ristit peittävät editoinnin perusteellisemmin, mutta voivat selvästi sekoittaa päällekkäisiä sanoja rajalla.

Äänimaalauksessa noudatetaan samaa kielikattavuutta kuin äänikloonissa. Valitaan OpenVoice useimmille kielille ja CosyVoice 2 kiinalle, japanille ja korealaiselle. Mallin voi ohittaa kehittyneissä asetuksissa.

Sinulle veloitetaan 500 merkkiä sekunnissa korvatusta äänentoistosta. Neljän sekunnin korjaus maksaa 2 000 merkkiä. Kustannukset eivät riipu siitä, kuinka pitkä korvaava teksti on, koska kloonisynteesin taustalla on uuden pätkän käyttöaika, ei tekstin pituus.

Palveluehtomme mukaan voit maalata vain omistamasi äänen tai sinulla on selkeä lupa muokata sitä. Valelainausten, petollisten sisältöjen tai imitaatioiden tuottaminen on kielletty. Vesileimaamme tuottaneesi äänen ja kirjaamme kaikki maalaamistehtävät väärinkäytösten tarkastelua varten.

Leikkeleen leikkaaminen jättää näkyvän aukon vauhdissa ja hengityksessä; kaksi ristikudosta jättää tonaalisen epäsuhtaisuuden. Maalaaminen täyttää aukon puheella, joka vastaa ympäröivää ääntä, joten kuulijat kuulevat jatkuvaa, luonnolta kuulostavaa ääntä.

Kyllä – POST to /v1/audio-inpaint/ with the audio file, start_sec, end_sec ja replace_text. Loppupäätteenä on työpaikka UUID, kysely /v1/speech/results/?uid= inpainted audio when require. Katso API-dokumentit tarkemmista tiedoista.

ElevenLabs Speech-to-Speech uudistaa koko äänilinjan tyhjästä kohdeäänessä. Äänimaalauksemme on kirurgista: se muokkaa vain merkityn alueen, pitää kaikki muut alkuperäisen äänitallenteen tavut koskemattomina ja vastaa uutta klippiä ympäröivään ääneen erillisen äänikirjaston sijaan.
5.0/5 (1)

Mitä voisimme parantaa? Palautteesi auttaa meitä korjaamaan ongelmia.

Korjaa äänesi sekunneissa

Korvaa mikä tahansa nauhoituksen osa tekoälyyn yhdistetyllä puheella, joka vastaa alkuperäistä ääntä. Rekisteröidy vapaasti aloittaaksesi.