AI zabarvanje zvoka

Zamenjava sekcijo zvoka z AI-synteznim govorom, ki se ujema z okoliškim glasom. Popravite slab posnetek, ne da bi ponovno posneli celotno stvar.

Nimamo še glasov TTS v vašem jeziku. Pomagajte nam dodati svoje! Prodaj svoj glas

Naloži zvok na barvo

500 znakov na sekundo zamenjave zvoka

Povlecite in spustite datoteko sem ali brskanje

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

file.mp3

0 MB

Izvorni zvok – čiščenje, da bi našli slab pojem

0.00s / 0.00s

Nastavitve barve

0 / 500 znaki
Kako dolgo mešati slice točke. 80ms je privzeto – tekmovalne rezine čutijo naravno, noben zvočni dvojni triger.
Vpišite se brezplačno za uporabo zvočnega infarkta
Barvanje zvoka...

Kloniranje glasu in sinteziranje zamenjave...

Sečenje → kloniranje okoljskega glasu → lomljenje s križiščem
Tvoj rezultat se bo pojavil v tvojem očetu. zgodovina generacije Ko boste pripravljeni.
Zabarvan zvok pripravljen

Pred (Izvirnik)

Zatem (obarvan)

Prenesi zabarvan zvok

Kako deluje slikanje zvoka

Inbarvanje je zvočni ekvivalent izpolnjevanja vsebine Photoshopa. Kloniramo glas iz zvoka, ki obkroža tvojo izbiro, sintetiziramo novo črto v tem glasu in jo vržemo s kratkim križnim fadom.

Najboljši rezultati: pustite vsaj 3 sekunde čistega govora tik pred točko ureditve, tako da kloner ima dobro referenčno gradivo.

Nasveti za najboljše rezultate

  • Označeno območje naj bo čim bližje – samo slabo jemanje
  • Besedilo zamenjave bi moralo biti približno enako kot nadomestno besedilo
  • Nastavi jezik, ki ustreza viru zvoka za najboljšo glasovno ujemanje
  • 80ms križarjenje je običajno nevidno; preskok na 150ms, če slišite klik
  • Za dolge ureditve (>10s), razmislite o ponovnem zabeleževanju celotnega prehoda namesto

Kako deluje AI Audio infarktiranje

Kirurški urejevalniki, glasovno ujemani, brez ponovnega snemanja.

Korak 1

Naloži + Območje označevanja

Pošljite svoj zvok in uporabite odstranjevalnik, da označite začetek/konec razdelka, ki ga želite zamenjati. Vpišite nadomestno besedilo.

Korak 2

Glasovni klon + sintetizacija

Izvlečemo do 12 sekund čistega referenčnega zvoka, ki obkroža tvojo izbiro, kloniramo glas zvočnika in sintetiziramo novo črto v tem glasu.

Korak 3

Prekrižna pregrada

Sintetizirani posnetek je vgrajen v izvirni zapis z enako močjo na obeh urejevalnih točkah. Meje so neslišane.

Načrti za slikanje zvoka

Začnite brezplačno, nadgradnja, ko potrebujete več

Prosto
  • Do 10-minutnih izvornih datotek
  • Nadomestno besedilo s 500 znaki
  • 4-sekundna barva na zahtevo
  • 80ms navzkrižja
  • Odpri glas + CosyVoice 2 področji
Najbolj priljubljeno
Brezplačni račun
  • Do 10-minutnih izvornih datotek
  • Nadomestno besedilo s 5000 znaki
  • Navzkrižna tuna (0-250m)
  • Premostitev glasovnega modela
  • Zgodovina ustvarjanja + ponovni urejanje
Prosto se prijavite
Prof.
  • Do 30-minutnih virovnih datotek
  • Nadomestno besedilo za 100.000 znakov
  • Prednostna vrstica GPU
  • API dostop (/v1/audio-inpaint /)
  • Serija barvila (več razponov)
Nadgradnja

Pogosta vprašanja

Avdio inbarvanje (imenovano tudi overdub zvočnega polnjenja ali govora) vam omogoča, da zamenjate del obstoječega zvočnega posnetka z novim AI-sinteziranim govorom, ki se ujema z izvirnim glasom. To je zvočni ekvivalent polnjenja vsebine Photoshopa – barva nad delom, ki ga ne želite, vpišite, kaj bi moral biti tam namesto tega, in AI ustvarja brezhibno zamenjavo.

Označite časovni razpon za zamenjavo, vnesite novo vrstico dialoga in kliknite Inslika. Naš AI klonira glas iz zvoka, ki obkroža vašo izbiro, sintetizira novo črto v tem glasu in jo vrne nazaj v posnetek s kratkim križancem, tako da je ureditev neslišana.

Uporabite ga, ko imate eno slabo besedo, napačno izgovor, ime, prisego besedo, ali napako dejstva v drugače dobrem jemanju. Ponovno zabeležiti celoten odlomek pogosto uvaja tonalno neusklajenost z ostalim delom projekta – barva popravlja le to, kar je potrebno popraviti, medtem ko je vsak drugi slog nedotaknjen.

Brezplačni uporabniki lahko zabarvajo datoteke do 10 minut. Naročniki lahko inbarbajo datoteke do 30 minut. Nadomestno besedilo je omejeno na 500 znakov za brezplačne uporabnike, 5000 za brezplačne račune in 100.000 za plačane načrte.

Zelo blizu. AI uporablja do 12 sekund zvoka, ki obkroža ureditev kot referenco za glas, kar je dovolj za kateri koli od naših modelov kloniranja (OpenVoice, CosyVoice 2), da zajame zvočnikov timbre, meč in slog govora. Za najboljše rezultate, pustite vsaj 3 sekunde čistega govora tik pred točko urejanja.

Privzeto uporabljamo 80ms enako močni križ na obeh točkah (glava→zamenjava in zamenjava→tail). To lahko nastavite od 0ms (trdo rezanje) do 250ms preko Crossfade drsalnika. Daljše križanje skrije ureditev bolj temeljito, vendar se lahko predvidljivo zmeša prekrivajoče besede na meji.

Avdio inbarvanje sledi isti jezik pokritosti kot kloniranje glasu. Samodejno izbiramo OpenVoice za večino jezikov in CosyVoice 2 za kitajsko, japonsko in korejsko. Model lahko premostite v naprednih nastavitvah.

Natovorjeni ste 500 znakov na sekundo avdio zamenjane. 4-sekundni fiksni stroški 2.000 znakov. Strošek je neodvisen od tega, kako dolgo je nadomestno besedilo, saj je sinteza osnovnih klonov zaprta s tekom časa novega posnetka, ne pa z dolžino besedila.

V skladu z našimi Pogoji storitev lahko samo barvite zvok, ki ga imate, ali imate izrecno dovoljenje za urejanje. Izdelava lažnih citatov, varljive vsebine ali imitacije je prepovedana. Vodni žig je ustvaril zvok in log vse infarktiranje delovnih mest za pregled zlorabe.

Rezanje posnetka pušča opazno vrzel v pacing in dihanje; navzkriž dva vzame tonal neusklajenost. Barvanje zapolnjuje vrzel z govorom, ki se ujema z okoliškim glasom, tako da poslušalci slišijo neprekinjeno, naravno zvočno avdio.

Da – POST to /v1/audio-inpaint / z zvočno datoteko, start_sec, end_sec in remote_ text. Končni izid vrne nalogo UUID; anketa /v1/speech/results /?uid=, da pridobite infarbirani zvok, ko ste pripravljeni. Glejte API docs za podrobnosti.

EnajstLabs Govor do govora regenerira celotno glasno črto od tarče v tarčnem glasu. Naša zvočna barva je kirurška: ureja le označeno območje, ohranja vsak drug bajt izvirnega zapisa nedotaknjen, in ujema nov posnetek z okoliškim glasom namesto ločene glasovne knjižnice.
5.0/5 (1)

Kaj bi lahko izboljšali? Vaša povratna informacija nam pomaga rešiti vprašanja.

Popravite svoj zvok v sekundah

Zamenjava katerega koli dela posnetka z AI-synteznim govorom, ki se ujema z izvirnim glasom. Vpišite se brezplačno za začetek.