AI Audio-festés

Cserélje ki az audio egy részét AI-szintézisű beszédre, amely megfelel a környező hangnak. Javítson meg egy rossz felvételt anélkül, hogy újra felvenné az egészet.

Hang feltöltése a festékbe

500 karakter/másodperc audio csere

Itt húzza le a fájlt, vagy böngészés

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

file.mp3

0 MB

Source audio DUPLIC súrol, hogy megtalálja a rossz felvételt

0.00s / 0.00s

Festékbeállítások@ info: whatsthis

0 / 500 karakterek
Mennyi ideig kell keverni a splice pontokat. 80ms az alapértelmezett ċ match-cuts úgy érzi, természetes, nincs hallható dupla-trigger.
Regisztráljon ingyenes audio festékek használata
Hangfestés...

A hang klónozása és a csere szintetizálása...

Slicing → klónozás környező hang → splicing keresztfade
Eltart egy darabig? Az eredmény jelenik meg a generációk történelme ha készen állsz.
Befestett audio kész

Előtte (eredeti)

Miután (festett)

Letöltés Festett Audio

Hogyan hat a hangfestés?

Festés az audio egyenértékű Photoshop tartalom-aware kitöltése. Klónozzuk a hangot a hang körül a kiválasztás, szintetizálja az új vonalat abban a hangban, és fésülje vissza egy rövid keresztvágóval.

Legjobb eredmények: hagyjon legalább 3 másodperc tiszta beszédet közvetlenül a szerkesztési pont előtt, így a klónozónak jó referenciaanyaga van.

Tippek a legjobb eredményekért

  • Tartsa a megjelölt tartományt a lehető legszorosabbra, csak a rossz felvételt.
  • A helyettesítő szövegnek nagyjából ugyanolyan hosszúnak kell lennie, mint amit helyettesít.
  • Állítsa be a nyelvet, hogy megfeleljen a forrás audio a legjobb hang egyezés
  • 80ms kereszthalom általában láthatatlan; dump 150ms ha hall egy kattintás
  • A hosszú szerkesztések (>10s), fontolja meg újra az egész átjárót helyette

Hogyan működik az AI Audio-festés?

Műtéti vágások, hangpárosítás, újrafelvétel nélkül.

lépés

Feltöltés + Mark tartomány

Töltse fel az audiót, és használja a mosógépet, hogy megjelölje a helyettesíteni kívánt szakasz kezdetét/végét. Írja be a helyettesítő szöveget.

lépés

Hang klón + szintetizálás

Kinyerünk 12 másodperc tiszta referencia audiót a kiválasztásod körül, klónozzuk a hangszóró hangját, és szintetizáljuk az új vonalat abban a hangban.

lépés

Crossfade SpliceCity name (optional, probably does not need a translation)

A szintetizált klip mindkét szerkesztési ponton egyenlő teljesítményű kereszthibával van beszúrva az eredeti felvételbe. A határok hallhatatlanok.

Hangfestési tervek

Ingyenes indítás, frissítés, ha többre van szükséged

Ingyenes
  • Akár 10 perces forrásfájlok
  • 500 karakterből álló helyettesítő szöveg
  • 4 másodperces befestés kérésenként
  • 80ms keresztsávos
  • OpenVoice + KényelmesVoice 2 backends
Legnépszerűbb
Ingyenes számla
  • Akár 10 perces forrásfájlok
  • 5000 karakterből álló helyettesítő szöveg
  • Hangolható kereszthalom (0-250 ms)
  • Hangmodell felülírása
  • Generation history + re-edit
Regisztráció Ingyenes
Pro
  • Akár 30 perces forrásfájlok
  • 100 000 karakter csereszöveg
  • Prioritású GPU sor
  • API-hozzáférés (/v1/audio-infest/)
  • Gy. sz.: festés (többszörös tartomány)
Frissítés

Gyakran ismételt kérdések

Hangfestés (más néven audio töltelék vagy beszéd overdub) lehetővé teszi, hogy cserélje le a meglévő hangfelvétel egy részét új AI-synthesized beszéd, amely megfelel az eredeti hang. Ez az audio egyenértékű Photoshop tartalom-aware töltse ki a festéket a nem kívánt rész, írja be, mi kell lennie helyette, és az AI generál egy zökkenőmentes csere.

Jelölje meg az időtartományt, hogy cserélje ki, írja be az új vonal a párbeszéd, és kattintson az Inspaint. AI klónozza a hangot a hang körül a kiválasztás, szintetizálja az új vonalat abban a hangban, és összeragasztja vissza a felvételt egy rövid keresztláng, így a szerkesztés nem hallható.

Használd, ha van egy rossz szó, hibás kiejtés, névcsúsztatás, káromkodás, vagy tény hiba egy egyébként-jó take. Újrafelvétele az egész szakasz gyakran bevezeti a tonális eltérés a többi a projekt Festés csak azt javítja, amit meg kell javítani, miközben minden más szótag sértetlen.

Ingyenes felhasználók legfeljebb 10 percig festhetik a fájlokat. Feliratkozók legfeljebb 30 percig festhetik a fájlokat. Maga a helyettesítő szöveg 500 karakteren van maximálva az ingyenes felhasználók számára, 5000 ingyen számla, és 100 000 fizetős terv.

Nagyon közel. Az AI akár 12 másodperc audio körül a szerkesztés, mint egy hang referencia, ami elég bármely klón-képes modellek (OpenVoice, CosyVoice 2), hogy megragadja a hangszóró timbre, pályán, és a beszéd stílusa. A legjobb eredmény, hagyja legalább 3 másodperc tiszta beszéd közvetlenül a szerkesztési pont előtt.

Alapértelmezetten alkalmazunk egy 80ms-es, egyenlő teljesítményű kereszteződést mindkét pálcapontnál (fej→helyezés és csere→tail). Ezt 0ms-ről (kemény vágás) 250ms-re lehet beállítani a Crossfade csúszkán keresztül. Hosszabb keresztfades elrejti a szerkesztést alaposabban, de hallhatóan összekeverheti az egymást átfedő szavakat a határon.

Hangfestés követi ugyanazt a nyelvi lefedettséget, mint a hang klónozás. Auto-pick OpenVoice a legtöbb nyelv és a CosyVoice 2 kínai, japán és koreai. Ön felülírhatja a modellt a fejlett beállítások.

Az audió másodpercenként 500 karaktert tölt fel. A 4 másodperces fix 2000 karakterbe kerül. A költség független attól, hogy mennyi ideig tart a helyettesítő szöveg, mivel az alapul szolgáló klón szintézist az új klip futási ideje szabja meg, nem pedig a szöveg hossza.

A Szolgáltatási Feltételeink szerint csak a saját vagy kifejezett felhatalmazásod van a szerkesztésre. Hamis idézetek, megtévesztő tartalmak vagy megszemélyesítések generálása tilos. Vízjelezzük a generált audiót és naplózunk minden festményt a visszaélés felülvizsgálatára.

A klip vágása észrevehető rést hagy a járkálásban és a leheletben; a kereszt-fading kettő tónusos eltérést eredményez. A festés a rést olyan beszéddel tölti be, amely megfelel a környező hangnak, így a hallgatók folyamatos, természetes hangzást hallanak.

Igen, Post to /v1/audio-inpaint/ with the audio file, start_sec, end_sec, and subprote_text. A végpont UUID-ot ad vissza; poll /v1/speech/results/?uuuid= a befestett audio letöltéséhez, ha készen áll.

TizenegyLabs Beszédtől beszédig regenerálja az egész hangvonalat a semmiből egy célhangban. Hangfestésünk sebészi: csak a megjelölt tartományt szerkeszti, érintetlenül tartja eredeti felvételének minden bájtját, és az új klipet a környező hanghoz igazítja, nem pedig külön hangkönyvtárhoz.
5.0/5 (1)

Mit lehetne javítani? A visszajelzés segít megoldani a problémákat.

Fix your audio in seconds

Bármely felvétel bármely részét az eredeti hanghoz illeszkedő AI-szintézisű beszédre cseréljük. Regisztráljon szabadon.