AI Audio Inpainting

Nahradenie časti zvuku syntetizovanou rečou pomocou umelej inteligencie, ktorá sa zhoduje s okolitým hlasom.Opravte zlý záber bez opätovného nahrávania celej veci.

Nahrať zvuk do Inpaint

500 znakov za sekundu nahradených zvuku

Presuňte svoj súbor sem, alebo prehliadať

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

súbor.mp3

0 MB

Zdrojový zvuk – vyhľadanie zlého záznamu

0.00s / 0.00s

Nastavenia Inpaint

0 / 500 znaky
Predvolená hodnota je 80 ms – pri synchronizácii sa strihy zdajú prirodzené, nie je počuť žiadnu dvojitú spúšť.
Zaregistrujte sa zdarma a používajte audio inpainting
Prebieha inmailing zvuku...

Klonovanie hlasu a syntetizácia náhrady...

Slicing → klonovanie okolitého hlasu → spájanie s crossfade
Váš výsledok sa objaví vo vašom účte. História generácií Keď ste pripravení.
Pripravené na zvuk

Predtým (pôvodný názov)

Po (po maľovaní)

Stiahnuť Inpainted Audio

Ako funguje funkcia Audio Inpainting

Klonujeme hlas zo zvuku, ktorý obklopuje váš výber, syntetizujeme novú líniu v tomto hlase a spojíme ho späť s krátkym prechodom.Vytvárame tak zvuk, ktorý je ľahko zapamätateľný a ktorý sa dá ľahko prehrávať.

Najlepšie výsledky: nechajte aspoň 3 sekundy čistej reči bezprostredne pred bodom úpravy, aby mal klon dobrý referenčný materiál.

Tipy pre najlepšie výsledky

  • Udržujte označený rozsah čo najužší – iba zlý záber
  • Náhradný text by mal mať približne rovnakú dĺžku ako text, ktorý nahrádza
  • Nastavenie jazyka tak, aby zodpovedal zdrojovému zvuku pre najlepšiu zhodu hlasu
  • 80ms crossfade je zvyčajne neviditeľný; náraz na 150ms, ak počujete kliknutie
  • Pri dlhých úpravách (>10s) zvážte namiesto toho opätovné nahrávanie celej pasáže

Ako funguje AI Audio Inpainting

Chirurgické úpravy, hlasové párovanie, bez opätovného nahrávania.

Krok 1

Nahrať + označiť rozsah

Nahrajte zvukový súbor a pomocou posuvníka označte začiatok a koniec sekcie, ktorú chcete nahradiť.Zadajte náhradný text.

Krok 2

Hlas klon + syntetizovať

Extrahujeme až 12 sekúnd čistého referenčného zvuku okolo vášho výberu, naklonujeme hlas rečníka a syntetizujeme novú vetu v tomto hlase.

Krok 3

Crossfade Splice

Syntetizovaný klip sa spojí s pôvodnou nahrávkou pomocou prelínania rovnakej intenzity v oboch bodoch úprav.

Plány pre zvukovú inmaľbu

Začnite zdarma, inovujte, keď budete potrebovať viac

Voľný
  • Až 10-minútové zdrojové súbory
  • 500-znakový náhradný text
  • 4-sekundové inpaint na požiadavku
  • 80ms crossfade spojka
  • OpenVoice + CosyVoice 2 backends
Striptease Najobľúbenejší
Vytvoriť bezplatný účet
  • Až 10-minútové zdrojové súbory
  • Náhradný text s 5 000 znakmi
  • Laditeľné crossfade (0-250ms)
  • Prepísanie hlasového modelu
  • História generovania + opätovná úprava
Zaregistrujte sa zdarma
Pre
  • Až 30 minút zdrojových súborov
  • Náhradný text s dĺžkou 100 000 znakov
  • Prioritná fronta GPU
  • API prístup (/v1/audio-inpaint/)
  • Dávkové maľovanie (viaceré rozsahy)
Aktualizácia

Často kladené otázky

Funkcia nahrávania zvuku (nazývaná aj výplň zvuku alebo nahrávanie reči) umožňuje nahradiť časť existujúcej zvukovej nahrávky novou reči syntetizovanou umelou inteligenciou, ktorá zodpovedá pôvodnému hlasu. Je to zvukový ekvivalent výplne podľa obsahu v aplikácii Photoshop. Premaľte časť, ktorú nechcete, napíšte, čo by tam malo byť, a umelá inteligencia vytvorí bezproblémovú náhradu.

Označte časový rozsah, ktorý chcete nahradiť, zadajte nový riadok dialógu a kliknite na tlačidlo Inmaint. Naša umelá inteligencia naklonuje hlas zo zvuku okolo vášho výberu, syntetizuje nový riadok v tomto hlase a spojí ho späť do nahrávky s krátkym prechodom, takže úprava je nepočuteľná.

Použite ho, keď máte jediné zlé slovo, nesprávnu výslovnosť, chybu v mene, nadávku alebo faktovú chybu v inak dobrej nahrávke. Prehratie celej pasáže často spôsobuje nesúlad tónov so zvyškom projektu. Inmapping opravuje len to, čo je potrebné opraviť, pričom všetky ostatné slabiky zostávajú neporušené.

Bezplatní používatelia môžu vkladať súbory s dĺžkou až 10 minút, predplatitelia môžu vkladať súbory s dĺžkou až 30 minút. Samotný náhradný text je obmedzený na 500 znakov pre bezplatných používateľov, 5 000 pre bezplatné účty a 100 000 pre platené plány.

Veľmi blízko. AI používa až 12 sekúnd zvuku okolo úpravy ako referenčnú reč, čo je dosť pre všetky naše modely schopné klonovania (OpenVoice, CosyVoice 2) na zachytenie tónu, výšky a štýlu reči rečníka.Na dosiahnutie najlepších výsledkov nechajte aspoň 3 sekundy čistej reči bezprostredne pred bodom úpravy.

V predvolenom nastavení aplikujeme 80 ms rovnako výkonné prelínanie na oboch miestach spojenia (hlava→náhrada a náhrada→koniec). Môžete ho nastaviť od 0 ms (tvrdý rez) až do 250 ms pomocou posuvníka Prelínanie.Dlhšie prelínania skryjú úpravu dôkladnejšie, ale môžu zvukovo zlúčiť prekrývajúce sa slová na hranici.

Pri klonovaní hlasu sa používa rovnaký jazykový model ako pri klonovaní zvuku. Pre väčšinu jazykov sa automaticky vyberie OpenVoice a pre čínštinu, japončinu a kórejčinu CosyVoice 2.

Za sekundu nahradeného zvuku sa účtuje 500 znakov, pričom 4-sekundová oprava stojí 2 000 znakov. Náklady sú nezávislé od dĺžky náhradného textu, pretože syntéza základného klonu je obmedzená časom spustenia nového klipu, nie dĺžkou textu.

Podľa našich podmienok služby môžete vkladať iba zvuk, ktorý vlastníte alebo máte výslovné povolenie na úpravu. Vytváranie falošných citácií, zavádzajúci obsah alebo vydávanie sa za inú osobu je zakázané.

Strihanie klipu zanecháva viditeľnú medzeru v rytme a dychu. Prelínanie dvoch záberov zanecháva nesúlad tónov. Inmapping vyplní medzeru rečou, ktorá zodpovedá okolitému hlasu, takže poslucháči počujú nepretržitý, prirodzene znejúci zvuk.

Áno — POST do /v1/audio-inpaint/ so zvukovým súborom, start_sec, end_sec a replacement_text. Koncový bod vracia UUID úlohy; poll /v1/speech/results/?uuid= pre načítanie nakresleného zvuku, keď je pripravený.

ElevenLabs Speech-to-Speech regeneruje celú hlasovú líniu od začiatku v cieľovom hlase.Naše audio inpainting je chirurgický: upravuje iba označený rozsah, ponecháva každý druhý bajt pôvodnej nahrávky nedotknutý a prispôsobuje nový klip okolitému hlasu skôr ako samostatnej hlasovej knižnici.
5.0/5 (1)

Čo by sme mohli zlepšiť? Vaše pripomienky nám pomáhajú riešiť problémy.

Opraviť zvuk v sekundách

Nahraďte akúkoľvek časť akejkoľvek nahrávky reči syntetizovanou pomocou umelej inteligencie, ktorá sa zhoduje s pôvodným hlasom.