Inpittura tal-awdjo AI

Ibdel sezzjoni tal-awdjo b'diskors sintetizzat mill-AI li jaqbel mal-vuċi tal-madwar.Issolvi tieħu ħażina mingħajr ma terġa 'tirreġistra l-ħaġa kollha.

Għad m'għandniex vuċijiet TTS fil-lingwa tiegħek. Għinna nżidu tiegħek! Biegħ il-vuċi tiegħek

Ittella' l-awdjo biex Inpaint

500 karattru kull sekonda ta' awdjo mibdul

Iddreggja u qiegħed il-fajl tiegħek hawn, jew browse

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

fajl.mp3

0 MB

Sors awdjo — scrub biex issib il-ħażin jieħdu

0.00s / 0.00s

Żid

0 / 500 karattri
Kemm idum biex tħallat il-punti splice.80ms huwa l-default — jaqblu-qatgħat jħossu naturali, l-ebda jinstema doppju-trigger.
Irreġistra b'xejn biex tuża l-inpainting tal-awdjo
Inpainting awdjo...

Klonazzjoni tal-vuċi u sintetizzar tas-sostituzzjoni...

Qtugħ → klonazzjoni tal-vuċi tal-madwar → splicing ma crossfade
Ir-riżultat tiegħek se jidher fil-kont tiegħek. storja tal-ġenerazzjoni meta tkun lesta.
Inpainted Awdjo lest

Qabel (Oriġinali)

Wara (Iż-żebgħa)

Niżżel Inpainted awdjo

Kif Audio Inpainting xogħlijiet

Inpainting huwa l-ekwivalenti awdjo tal-Photoshop kontenut-aware mili.Aħna klonu l-vuċi mill-awdjo madwar l-għażla tiegħek, sintetizza l-linja l-ġdida f'dak vuċi, u splice lura ma crossfade qasir.

L-aħjar riżultati: ħalli mill-inqas 3 sekondi ta’ diskors nadif immedjatament qabel il-punt tal-editjar sabiex il-klonatur ikollu materjal ta’ referenza tajjeb.

Għajnuniet għall-Aqwa Riżultati

  • Żomm il-medda mmarkata kemm jista’ jkun stretta — biss il-ħsara tieħu
  • It-test ta' sostituzzjoni għandu jkun bejn wieħed u ieħor l-istess tul bħal dak li jissostitwixxi
  • Issettja l-lingwa biex jaqblu mal-awdjo sors għall-aħjar jaqblu vuċi
  • 80ms crossfade huwa normalment inviżibbli; bump għal 150ms jekk tisma klikk
  • Għal editjar twil (>10s), ikkunsidra li terġa' tirrekordja l-passaġġ kollu minflok

Kif AI awdjo Inpainting xogħlijiet

Editji kirurġiċi, vuċi-matched, bl-ebda sessjoni re-reġistrazzjoni.

Stadju 1

Upload + Mark firxa

Ittella' l-awdjo tiegħek u uża l-iskrub biex timmarka l-bidu/tmiem tas-sezzjoni li trid tissostitwixxi, u daħħal it-test li trid tissostitwixxi.

Stadju 2

Klonu tal-vuċi + Sinteżi

Aħna estratt sa 12-il sekonda tal-awdjo referenza nadif madwar l-għażla tiegħek, klonu l-vuċi tal-kelliem, u sintetizza l-linja l-ġdida f'dak vuċi.

Stadju 3

Splicing Crossfade

Il-klipp sintetizzat jiġi spliced fir-reġistrazzjoni oriġinali b'crossfade ta' qawwa ugwali fiż-żewġ punti ta' editjar.

Pjanijiet tal-Inpainting tal-Awdjo

Ibda b'xejn, aġġorna meta jkollok bżonn aktar

Ħieles
  • Sa 10 minuti fajls sors
  • Test ta' sostituzzjoni ta' 500 karattru
  • 4-sekonda inpaint għal kull talba
  • 80ms crossfade splice
  • OpenVoice + CosyVoice 2 backends
L-aktar popolari
Kont b'xejn
  • Sa 10 minuti fajls sors
  • Test ta' sostituzzjoni ta' 5,000 karattru
  • Crossfade Tunable (0-250ms)
  • Ħruġ tal-mudell tal-vuċi
  • Istorja tal-ġenerazzjoni + editjar mill-ġdid
Irreġistra b'xejn
Għal
  • Sa 30 minuta fajls sors
  • Test ta' sostituzzjoni ta' 100,000 karattru
  • Prijorità tal-kju tal-GPU
  • Aċċess għall-API (/v1/audio-inpaint/)
  • Inpittura tal-lott (firxiet multipli)
Aġġornament

Mistoqsijiet Frekwenti (FAQ)

Audio inpainting (imsejjaħ ukoll audio mili jew diskors overdub) iħallik tissostitwixxi sezzjoni ta'reġistrazzjoni awdjo eżistenti ma'diskors ġdid sintetizzati AI li jaqbel mal-vuċi oriġinali. Huwa l-ekwivalenti awdjo tal-Photoshop's kontenut konxju mili - żebgħa fuq il-parti li ma tridx, ittajpja dak li għandu jkun hemm minflok, u l-AI jiġġenera sostituzzjoni bla xkiel.

Mark il-medda taż-żmien biex tissostitwixxi, ittajpja l-linja ġdida tad-djalogu, u ikklikkja Inpaint.AI tagħna kloni l-vuċi mill-awdjo madwar l-għażla tiegħek, sintetizza l-linja l-ġdida f'dak vuċi, u splices lura fis-reġistrazzjoni tiegħek ma crossfade qasir sabiex l-editjar huwa inaudible.

Użah meta jkollok kelma ħażina waħda, pronunzja ħażina, isem li jiżżerżaq, kelma swear, jew żball fatt f'xi ħaġa oħra tajba.Re-reġistrazzjoni tal-passaġġ kollu spiss jintroduċi tonalità mhux jaqblu mal-bqija tal-proġett - inpainting jiffissa biss dak li jeħtieġ li jiffissa filwaqt li żżomm kull sillaba oħra intatta.

L-utenti b'xejn jistgħu jżidu fajls sa 10 minuti fit-tul, filwaqt li l-abbonati jistgħu jżidu fajls sa 30 minuta. It-test ta' sostituzzjoni nnifsu huwa limitat għal 500 karattru għall-utenti b'xejn, 5,000 għall-kontijiet b'xejn, u 100,000 għall-pjanijiet imħallsa.

Qrib ħafna. L-AI juża sa 12-il sekonda ta’ awdjo madwar l-editjar bħala referenza tal-vuċi, li hija biżżejjed għal kwalunkwe wieħed mill-mudelli tagħna li kapaċi jikklonaw (OpenVoice, CosyVoice 2) biex jaqbad it-timbra, il-pitch u l-istil tat-taħdit tal-kelliem.

Aħna japplikaw crossfade 80ms ugwali-qawwa fiż-żewġ punti splice (ras→sostituzzjoni u sostituzzjoni→denb) b'mod default. inti tista tune dan minn 0ms (qatgħa iebsa) sa 250ms permezz tal-Crossfade slider. crossfades itwal jaħbu l-editjar aktar bir-reqqa iżda jistgħu awdibbli taħlit kliem li jaqtgħu fil-fruntiera.

L-inpittura tal-awdjo ssegwi l-istess kopertura tal-lingwa bħall-ikklonjar tal-vuċi. Aħna nagħżlu awtomatikament OpenVoice għall-biċċa l-kbira tal-lingwi u CosyVoice 2 għaċ-Ċiniż, il-Ġappuniż u l-Korean.

Inti huma ċċarġjati 500 karattri kull sekonda tal-awdjo mibdula.A 4 sekonda fix-xhur 2,000 karattri.L-ispiża hija indipendenti minn kemm it-tul tat-test sostituzzjoni huwa, peress li s-sinteżi klonu sottostanti huwa gated mill-ħin run tal-klipp ġdid, mhux it-tul tat-test.

Per tagħna Termini tas-Servizz, inti tista biss inpaint awdjo inti stess jew ikollhom permess espliċitu biex teditja.Iġġenerazzjoni kwotazzjonijiet foloz, kontenut qarrieqi, jew impersonations huwa pprojbit.Aħna watermark awdjo ġġenerati u log-impjiegi kollha inpainting għal reviżjoni abbuż.

Meta taqta’ klipp, tħalli lakuna notevoli fil-pass u fin-nifs; meta taqta’ żewġ klipps, tħalli nuqqas ta’ qbil tonali.L-inpainting jimla l-lakuna bid-diskors li jaqbel mal-vuċi ta’ madwar.

Iva — POST għal /v1/audio-inpaint/ bil-fajl awdjo, start_sec, end_sec, u replacement_text. L-endpoint jirritorna UUID tax-xogħol; poll /v1/speech/results/?uuid= biex jirkupra l-awdjo inpaint meta jkun lest. Ara d-dokumenti tal-API għad-dettalji.

ElevenLabs Speech-to-Speech tirriġenera l-linja tal-vuċi kollu minn xejn fil-vuċi fil-mira. tagħna awdjo inpainting huwa kirurġiċi: huwa editjar biss il-medda mmarkati, iżomm kull byte oħra tar-reġistrazzjoni oriġinali tiegħek mhux immiss, u jaqbel il-klipp ġdid għall-vuċi tal-madwar aktar milli librerija vuċi separata.
5.0/5 (1)

X'nistgħu ntejbu? Il-feedback tiegħek jgħinna nsolvu l-problemi.

Tiffissa tiegħek awdjo f'sekondi

Ibdel kwalunkwe parti ta' kwalunkwe reġistrazzjoni b'diskors sintetizzat bl-AI li jaqbel mal-vuċi oriġinali.