Retragere audio AI

Înlocuiește o secțiune de audio cu discursul de dimensiune IA care se potrivește cu vocea din jurul valorii. Reparați o luare proastă fără reînregistrarea întregului lucru.

Încărcă audio pe Inpaint

500 de caractere pe secundă ale audio înlocuite

Aruncă și aruncă fișierul aici, sau navigați

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

file.mp3

0 MB

Audio sursă – scrub pentru a găsi luarea proastă

0.00s / 0.00s

Configurări de pictură

0 / 500 caractere
Cât timp va dura pentru a amesteca punctele de splice. 80ms este implicit - meci-cut se simt natural, nu audibil dublu-trigger.
Înregistrează-te gratuit pentru a utiliza infocarea audio
Retragerea audio...

Închiderea vocii şi sintetizarea înlocuirii...

Strângerea → clonarea vocii înconjurătoare → splicing cu crossfade
Rezultatul tău va apărea în tine. istorie generație când sunt gata.
Se pregătește audio pictat

Înainte (Original)

După (ipotecat)

Descărcați audio pictat

Cum funcționează picturarea audio

Inpainting este echivalentul audio al umplerii de conținut-aware de Photoshop. Noi clonăm vocea din audio în jurul selecției dvs., sintetiză noua linie în acea voce, și sclipiți-l înapoi cu o scurtă încrucișare.

Cele mai bune rezultate: lasă cel puțin 3 secunde de discurs curat imediat înainte de punct de editare astfel încât clonatorul are un material de referință bun.

Sfaturi pentru cele mai bune rezultate

  • Păstrați intervalul marcat cât mai strâmt posibil — doar luarea proastă
  • Textul de înlocuire ar trebui să fie aproximativ aceeași lungime cu ceea ce înlocuiește
  • Setați limba pentru a se potrivește cu sursa audio pentru cel mai bun meci de voce
  • 80ms crossfade este de obicei invizibil; bump la 150ms dacă auziți un clic
  • Pentru ediții lungi (>10s), ia în considerare reînregistrarea întregului pasaj în schimb

Cum funcționează picturarea audio AI

Editări chirurgicale, se potrivesc cu vocea, fără sesiune de reînregistrare.

Pasul 1

Încarcă + Gama de marcare

Încărcați audio și utilizați scrubber pentru a marca începutul/fișul secțiunii pe care doriți să le înlocuiți. Tastați textul de înlocuire.

Pasul 2

Clon de voce + sinteză

Extragem până la 12 secunde de audio de referinţă curat în jurul selecţiei voastre, clonăm vocea speakerului şi sintetizăm noua linie în acea voce.

Pasul 3

Smochine încrucișate

Clip-ul sintetizat este spliced în înregistrarea originală cu o echivalentă de putere egală la ambele puncte de editare. Limitele sunt inauditibile.

Planuri de pictare audio

Pornește gratuit, upgrade atunci când aveți nevoie de mai mult

Gratuit
  • Fișiere sursă până la 10 minute
  • Text de înlocuire a 500 de caractere
  • 4 secunde pictura pe cerere
  • Semințe de părăsire încrucișată de 80 m
  • Backend-uri OpenVoice + CosyVoice 2
Cel mai popular
Cont liber
  • Fișiere sursă până la 10 minute
  • Text de înlocuire cu 5.000 de caractere
  • Pătrunderea încrucișată (0-250 ms)
  • Supraveghere model-voce
  • Istoric generație + re- editare
Inscrie-te gratis
Pro
  • Fișiere sursă până la 30 minute
  • Text de înlocuire cu 100.000 de caractere
  • Coada GPU prioritară
  • Acces API (/v1/audio-inpaint/)
  • Set de pictare (clasele multiple)
Actualizează

Întrebări frecvente

Retragerea audio (denumită, de asemenea, umplere audio sau vorbire overdub) vă permite să înlocuiți o secțiune a unei înregistrări audio existente cu un nou discurs cu sinteză IA care se potrivește cu vocea originală. Este echivalentul audio al umplerii de conținut de Photoshop – vopsea pe partea pe care nu doriți, tapeați ce ar trebui să fie acolo în schimb, iar AI generează un înlocuitor transparent.

Marcați intervalul de timp pentru a înlocui, tastați noua linie de dialog, și faceți clic pe Inpaint. IA noastră clonează vocea din audio înconjurând selecția ta, sintetiza noua linie în acea voce, și îl spice înapoi în înregistrarea ta cu o scurtă încrucișare astfel încât editarea este inauditabilă.

Folosiţi-l atunci când aveţi un singur cuvânt rău, pronunţare greşită, nume alunecat, jurăm cuvântul sau eroare de fapt într-o altă acţiune bună. Re-înregistrarea întregului pasaj introduce adesea necorespondenţă tonală cu restul proiectului — picturarea se aranja doar ceea ce are nevoie de fixare în timp ce menţine toate celelalte silabe intact.

Utilizatorii gratuiti pot picta fișiere până la 10 minute de lungime. Abonatorii pot picta fișiere până la 30 minute. Textul de înlocuire în sine este cuprins la 500 de caractere pentru utilizatori gratuiti, 5.000 pentru conturi gratuite, și 100.000 pentru planuri plătite.

Foarte aproape. AI folosește până la 12 secunde de audio în jurul editării ca o referință vocală, care este suficient pentru oricare dintre modelele noastre de clonare-capabil (OpenVoice, CosyVoice 2) pentru a captura timbre, pitch și stil de vorbire al speakerului. Pentru cele mai bune rezultate, lasa cel puțin 3 secunde de discurs curat imediat înainte de punct de editare.

Aplicăm o încrucișare de 80 ms de putere egală la ambele puncte de încrucișare (head→replacement și înlocuire→tail) prin defect. Puteți atins acest lucru de la 0ms (taietură dură) până la 250 ms prin slider Crossfade.

Retragerea audio urmărește aceeași acoperire limbă ca clonarea vocală. Noi auto-optim OpenVoice pentru majoritatea limbilor și CosyVoice 2 pentru chinezi, japonezi și coreeni. Puteți trece peste modelul în ambalaje avansate.

Sunteți încărcat 500 de caractere pe secundă de audio înlocuit. O fixă de 4 secunde costă 2.000 de caractere. Costul este independent de cât timp textul de înlocuire este, deoarece sinteza clonă subjacente este blocată prin timpul de rulare al noul clip, nu lungimea textului.

După Termenii de Serviciu, aveți posibilitatea de a picta doar audio deținut sau aveți permisiunea explicită de a edita. Generarea de citații false, conținutul înșelători, sau imitații este interzis. Am marca de apă generat audio și log toate locurile de muncă de picturare pentru revizuire abuz.

Taierea unui clip lasă un decalaj remarcabil în pacing și respirație; încrucișarea două ia un decalaj tonal. Inpeting umple decalajul cu vorbire care se potrivește cu vocea înconjurătoare, așa că ascultătorii aud audio continuu, sunet natural.

Da — POST la /v1/audio-inpaint/ cu fișierul audio, start_sec, end_sec, și textul_ înlocuitor. Endpointul returnează o slujbă UUID; sondaj /v1/speech/results/?uuuid= pentru a recupera audio-ul inpaintat atunci când este gata. A se vedea documentele API pentru detalii.

UnsprezeceLabs Speech-to-Speech regenera intreaga linie vocala de la zgâriet intr-o voce tinta. Pictarea audio este chirurgicala: edita doar gama marcata, mentine fiecare alt byte din inregistrarea ta originala neatins, si se potriveste noul clip la vocea din jur, mai degraba decat o biblioteca vocala separata.
5.0/5 (1)

Feedback-ul vostru ne ajută să rezolvăm problemele.

Repară audio în secunde

Înlocuiește orice parte a oricărei înregistrări cu discursul de dimensiune artificială care se potrivește cu vocea originală. Înregistrează-te gratuit pentru a începe.