Raportează cererea de eroare / caracteristică

Retragere audio AI

Înlocuiește o secțiune de audio cu discursul de dimensiune IA care se potrivește cu vocea din jurul valorii. Reparați o luare proastă fără reînregistrarea întregului lucru.

Inscrie-te gratis

Încărcă audio pe Inpaint

500 de caractere pe secundă ale audio înlocuite

Aruncă și aruncă fișierul aici, sau navigați

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Configurări de pictură

Începe (secunde)

Sfârșit (secunde)

Textul de înlocuire — ceea ce ar trebui spus în decalajul 0 / 500 caractere

Limba

Deșeuri încrucișate 80 ms Cât timp va dura pentru a amesteca punctele de splice. 80ms este implicit - meci-cut se simt natural, nu audibil dublu-trigger.

Înregistrează-te gratuit pentru a utiliza infocarea audio

Cum funcționează picturarea audio

Inpainting este echivalentul audio al umplerii de conținut-aware de Photoshop. Noi clonăm vocea din audio în jurul selecției dvs., sintetiză noua linie în acea voce, și sclipiți-l înapoi cu o scurtă încrucișare.

Cele mai bune rezultate: lasă cel puțin 3 secunde de discurs curat imediat înainte de punct de editare astfel încât clonatorul are un material de referință bun.

Sfaturi pentru cele mai bune rezultate

Păstrați intervalul marcat cât mai strâmt posibil — doar luarea proastă
Textul de înlocuire ar trebui să fie aproximativ aceeași lungime cu ceea ce înlocuiește
Setați limba pentru a se potrivește cu sursa audio pentru cel mai bun meci de voce
80ms crossfade este de obicei invizibil; bump la 150ms dacă auziți un clic
Pentru ediții lungi (>10s), ia în considerare reînregistrarea întregului pasaj în schimb

Cum funcționează picturarea audio AI

Editări chirurgicale, se potrivesc cu vocea, fără sesiune de reînregistrare.

Pasul 1

Încarcă + Gama de marcare

Încărcați audio și utilizați scrubber pentru a marca începutul/fișul secțiunii pe care doriți să le înlocuiți. Tastați textul de înlocuire.

Pasul 2

Clon de voce + sinteză

Extragem până la 12 secunde de audio de referinţă curat în jurul selecţiei voastre, clonăm vocea speakerului şi sintetizăm noua linie în acea voce.

Pasul 3

Smochine încrucișate

Clip-ul sintetizat este spliced în înregistrarea originală cu o echivalentă de putere egală la ambele puncte de editare. Limitele sunt inauditibile.

Planuri de pictare audio

Pornește gratuit, upgrade atunci când aveți nevoie de mai mult

Gratuit

Fișiere sursă până la 10 minute
Text de înlocuire a 500 de caractere
4 secunde pictura pe cerere
Semințe de părăsire încrucișată de 80 m
Backend-uri OpenVoice + CosyVoice 2

Cel mai popular

Cont liber

Fișiere sursă până la 10 minute
Text de înlocuire cu 5.000 de caractere
Pătrunderea încrucișată (0-250 ms)
Supraveghere model-voce
Istoric generație + re- editare

Inscrie-te gratis

Pro

Fișiere sursă până la 30 minute
Text de înlocuire cu 100.000 de caractere
Coada GPU prioritară
Acces API (/v1/audio-inpaint/)
Set de pictare (clasele multiple)

Actualizează

Întrebări frecvente

Retragerea audio (denumită, de asemenea, umplere audio sau vorbire overdub) vă permite să înlocuiți o secțiune a unei înregistrări audio existente cu un nou discurs cu sinteză IA care se potrivește cu vocea originală. Este echivalentul audio al umplerii de conținut de Photoshop – vopsea pe partea pe care nu doriți, tapeați ce ar trebui să fie acolo în schimb, iar AI generează un înlocuitor transparent.

Marcați intervalul de timp pentru a înlocui, tastați noua linie de dialog, și faceți clic pe Inpaint. IA noastră clonează vocea din audio înconjurând selecția ta, sintetiza noua linie în acea voce, și îl spice înapoi în înregistrarea ta cu o scurtă încrucișare astfel încât editarea este inauditabilă.

Folosiţi-l atunci când aveţi un singur cuvânt rău, pronunţare greşită, nume alunecat, jurăm cuvântul sau eroare de fapt într-o altă acţiune bună. Re-înregistrarea întregului pasaj introduce adesea necorespondenţă tonală cu restul proiectului — picturarea se aranja doar ceea ce are nevoie de fixare în timp ce menţine toate celelalte silabe intact.

Utilizatorii gratuiti pot picta fișiere până la 10 minute de lungime. Abonatorii pot picta fișiere până la 30 minute. Textul de înlocuire în sine este cuprins la 500 de caractere pentru utilizatori gratuiti, 5.000 pentru conturi gratuite, și 100.000 pentru planuri plătite.

Foarte aproape. AI folosește până la 12 secunde de audio în jurul editării ca o referință vocală, care este suficient pentru oricare dintre modelele noastre de clonare-capabil (OpenVoice, CosyVoice 2) pentru a captura timbre, pitch și stil de vorbire al speakerului. Pentru cele mai bune rezultate, lasa cel puțin 3 secunde de discurs curat imediat înainte de punct de editare.

Aplicăm o încrucișare de 80 ms de putere egală la ambele puncte de încrucișare (head→replacement și înlocuire→tail) prin defect. Puteți atins acest lucru de la 0ms (taietură dură) până la 250 ms prin slider Crossfade.

Retragerea audio urmărește aceeași acoperire limbă ca clonarea vocală. Noi auto-optim OpenVoice pentru majoritatea limbilor și CosyVoice 2 pentru chinezi, japonezi și coreeni. Puteți trece peste modelul în ambalaje avansate.

Sunteți încărcat 500 de caractere pe secundă de audio înlocuit. O fixă de 4 secunde costă 2.000 de caractere. Costul este independent de cât timp textul de înlocuire este, deoarece sinteza clonă subjacente este blocată prin timpul de rulare al noul clip, nu lungimea textului.

După Termenii de Serviciu, aveți posibilitatea de a picta doar audio deținut sau aveți permisiunea explicită de a edita. Generarea de citații false, conținutul înșelători, sau imitații este interzis. Am marca de apă generat audio și log toate locurile de muncă de picturare pentru revizuire abuz.

Taierea unui clip lasă un decalaj remarcabil în pacing și respirație; încrucișarea două ia un decalaj tonal. Inpeting umple decalajul cu vorbire care se potrivește cu vocea înconjurătoare, așa că ascultătorii aud audio continuu, sunet natural.

Yes — POST to /v1/audio-inpaint/ with the audio file, start_sec, end_sec, and replacement_text. The endpoint returns a job UUID; poll /v1/speech/results/?uuid= to retrieve the inpainted audio when ready. See API docs for details.

UnsprezeceLabs Speech-to-Speech regenera intreaga linie vocala de la zgâriet intr-o voce tinta. Pictarea audio este chirurgicala: edita doar gama marcata, mentine fiecare alt byte din inregistrarea ta originala neatins, si se potriveste noul clip la vocea din jur, mai degraba decat o biblioteca vocala separata.

5.0/5 (1)

Repară audio în secunde

Înlocuiește orice parte a oricărei înregistrări cu discursul de dimensiune artificială care se potrivește cu vocea originală. Înregistrează-te gratuit pentru a începe.

Inscrie-te gratis Vizualizare preţuri

Retragere audio AI

Încărcă audio pe Inpaint

Audio sursă – scrub pentru a găsi luarea proastă

Configurări de pictură

Înainte (Original)

După (ipotecat)

Cum funcționează picturarea audio

Sfaturi pentru cele mai bune rezultate

Cum funcționează picturarea audio AI

Încarcă + Gama de marcare

Clon de voce + sinteză

Smochine încrucișate

Planuri de pictare audio

Întrebări frecvente

Repară audio în secunde

Retragere audio AI

Încărcă audio pe Inpaint

Audio sursă – scrub pentru a găsi luarea proastă

Configurări de pictură

Înainte (Original)

După (ipotecat)

Cum funcționează picturarea audio

Sfaturi pentru cele mai bune rezultate

Cum funcționează picturarea audio AI

Încarcă + Gama de marcare

Clon de voce + sinteză

Smochine încrucișate

Planuri de pictare audio

Întrebări frecvente

Ce înseamnă picturarea audio?

Cum funcţionează?

Când ar trebui să folosesc picturarea audio în loc să reînregistrez?

Cât timp poate fi sunetul sursă?

Vor suna exact ca vorbitorul original?

Ce se întâmplă la limitele de editare?

Ce limbi sunt susţinute?

Cât costă picturarea audio?

Pot folosi asta pentru a pune cuvinte în gura cuiva pe care nu le-au spus?

De ce să foloseşti pictura în loc să ştergi secţiunea proastă?

Este disponibilă API de pictare audio?

Cum se compară acest lucru cu unsprezece labs de vorbire?

Repară audio în secunde