Ynpeintio Sain AI

Amnewid rhan o sain gydag iaith wedi'i syntheseiddio gan AI sy'n cydweddu â'r llais o'i chwmpas. Cywiro cymryd gwael heb ail-greu'r cyfan.

Lanlwytho Sain i Inpaint

500 o nodau fesul eiliad o sain wedi'u hamnewid

Llusgwch a gollyngwch eich ffeil yma, neu Pori

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

ffeil.mp3

0 MB

Sain ffynhonnell — sgrolio i ganfod y tynnu drwg

0.00s / 0.00s

Gosodiadau' r Lliwiau

0 / 500 Nodau
Faint o amser i gymysgu'r pwynt splice. 80ms yw'r rhagosodiad - mae'r gosodiadau cydweddu'n teimlo'n naturiol, dim larymau dwbl clywadwy.
Cofrestru am ddim i ddefnyddio inpainting sain
Yn arlunio sain...

Clonio'r llais a syntheseiddio'r amnewid...

Sliced → clonio'r llais cyfagos → splicing gyda thros-leinio
Yn cymryd ychydig o amser? Bydd eich canlyniad yn ymddangos yn eich generation history pan yn barod.
Sain wedi' i farcio' n barod

Cyn (Gwriadol)

Ar ôl (Peintiedig)

Lawrlwytho Sain

Sut mae'r ddelwedd sain yn gweithio

Mae mewn-wynebu yn cyfateb i lenwi sy'n ymwybodol o gynnwys Photoshop. Ni kloniwn y llais o'r sain o amgylch eich dewis, yn cyfansoddi'r llinell newydd yn y llais hwnnw, ac yn ei gyfuno yn ôl gyda thros-ddiflannu byr.

Canlyniadau gorau: gadael o leiaf 3 eiliad o siarad clir cyn y pwynt golygu fel bod gan y clonydd ddeunydd cyfeirio da.

Awgrymiadau ar gyfer y Canlyniadau Gorau

  • Cadw'r amrediad wedi'i farcio mor gyfyng â phosibl - dim ond y lluniau drwg
  • Dylai'r testun amnewid fod yn yr un hyd â'r hyn mae'n ei amnewid
  • Gosod yr iaith i gydweddu â'r sain ffynhonnell er mwyn cael y cydweddiad llais gorau
  • Mae croes-gyflymu 80ms yn anweledig fel arfer; torri i 150ms os ydych yn clywed clic
  • Am olygus hir (>10s), ystyried ail-greu'r rhan gyfan yn lle hynny

Sut mae'r Peintio Sain AI yn Gweithio

Golygu llawfeddygol, cyfateb llais, heb sesiwn ail-greu.

Cam 1

Lanlwytho + Amrediad Marcio

Llwythwch eich sain a defnyddiwch y sgrolio i nodi dechrau/diwedd yr adran yr ydych am ei hamnewid. Teipiwch y testun amgen.

Cam 2

Clon Llyw + SynthesizerName

Rydym yn echdynnu hyd at 12 eiliad o sain cyfeirio glan o amgylch eich dewis, yn cloni llais y siaradwr, ac yn cyfansoddi'r llinell newydd yn y llais hwnnw.

Cam 3

Splice Crossfade

Mae'r clip synthetig yn cael ei gyfuno i'r recordiad gwreiddiol gyda thros-gyflymu pŵer cyfartal ar y ddau bwynt golygu. Nid yw'r ffiniau'n weladwy.

Planau Ymlyniad Sain

Dechrau am ddim, uwchraddio pan fo angen mwy

Rhydd
  • Ffeiliau tarddiad hyd at 10 munud
  • Testun amnewid 500-nod
  • 4 eiliad o ddelweddu ar bob cais
  • Splice crossfade 80ms
  • OpenVoice + CosyVoice 2
Poblogaf
Cyfrif Rhydd
  • Ffeiliau tarddiad hyd at 10 munud
  • Testun amnewid 5,000-nod
  • Tros-gyflymu addasadwy (0-250ms)
  • Anwybyddu model llais
  • Creu hanes + ail-olygu
Cofrestru
Proffesiynol
  • Ffeiliau tarddiad hyd at 30 munud
  • Testun amnewid 100,000-nod
  • Ciw blaenoriaeth GPU
  • API mynediad (/v1/audio-inpaint/)
  • Peintio'r batch (amrediad lluosol)
Uwchraddio

Cwestiynau a Ofynnir yn Aml

Mae mewn-wynebu sain (a elwir hefyd yn lenwi sain neu dros-ddapio llais) yn gadael i chi amnewid rhan o recordiad sain sydd eisoes yn bodoli gyda llais newydd wedi'i gyfansoddi gan AI sy'n cydweddu â'r llais gwreiddiol. Mae'n gyfwerth â lenwi sylw-i-gynnwys Photoshop - peintio dros y rhan nad ydych ei eisiau, teipio beth ddylai fod yno yn lle, a chreu'r AI amnewid heb gyswllt.

Nodi'r amrediad amser i'w amnewid, teipio'r llinell newydd o'r ymgom, a chliciwch Mewn-argraffu. Mae ein AI yn clonio'r llais o'r sain o amgylch eich dewis, yn cyfansoddi'r llinell newydd yn y llais hwn, ac yn ei gysylltu yn ôl i'ch recordiad gyda thros-ddiflaniad byr fel nad yw'r golygu'n weladwy.

Defnyddiwch hwn pan fydd gennych air drwg, cam-ddiffiniad, gwall enw, gair gwaedlyd, neu wall gwirionedd mewn cymryd arall-da. Mae ail-greu'r rhan gyfan yn aml yn cyflwyno anghydnawsedd ton gyda'r gweddill o'r cywaith - mae'r graffio yn cywiro dim ond yr hyn sydd angen ei gywiro tra'n cadw pob sillaf arall yn ddi-dor.

Gall defnyddwyr am ddim osod ffeiliau hyd at 10 munud o hyd. Gall tanysgrifwyr osod ffeiliau hyd at 30 munud. Mae'r testun amnewid ei hun wedi ei gyfyngu i 500 o nodau ar gyfer defnyddwyr am ddim, 5,000 ar gyfer cyfrifon am ddim, a 100,000 ar gyfer cynlluniau talu.

Yn agos iawn. Mae'r AI yn defnyddio hyd at 12 eiliad o sain o amgylch y golygu fel cyfeiriad llais, sy'n ddigon i unrhyw un o'n modelau sy'n gallu clonio (OpenVoice, CosyVoice 2) i adnabod lliw, uchder, ac arddull siarad y siaradwr. Am y canlyniadau gorau, gadewch o leiaf 3 eiliad o siarad clir yn syth cyn y pwynt golygu.

Rydym yn defnyddio croes-gyflymu 80ms o'r un pŵer ar y ddau bwynt cysylltu (pen→amnewid ac amnewid→eistedd) yn rhagosodedig. Gallwch addasu hyn o 0ms (torri caled) hyd at 250ms drwy'r llithrydd Croes-gyflymu. Mae croes-gyflymu hirach yn cuddio'r golygu'n fwy manwl ond gall gymysgu geiriau gorgyffwrdd yn glywadwy wrth y ffin.

Mae mewn-wynebu sain yn dilyn yr un cwmpasu iaith â chlonio llais. Rydym yn dewis OpenVoice yn awtomatig ar gyfer y rhan fwyaf o ieithoedd a CosyVoice 2 ar gyfer Tsieinëeg, Japaneg a Corea. Gallwch drosysgrifo'r model yn y gosodiadau uwch.

Cewch eich codi am 500 nod yr eiliad o sain wedi'i amnewid. Mae datrysiad 4 eiliad yn costio 2,000 nod. Mae'r gost yn annibynnol ar ba mor hir yw'r testun amnewid, gan fod y cyfansoddiad clôn sylfaenol yn cael ei gyfyngu gan amser rhedeg y clip newydd, nid hyd y testun.

Yn ôl ein Telerau Gwasanaeth, gallwch chi ond arlunio sain sydd gennych chi neu sydd â chaniatâd eglur i'w golygu. Mae creu dyfyniadau ffug, cynnwys twyllodrus, neu amrywiadau yn cael ei wahardd. Rydym yn marcio sain a gynhyrchir a'n cofnodi pob swydd arlunio er mwyn adolygu amhriodoldeb.

Mae torri clip yn gadael bwlch amlwg yn y cyflymder ac yn yr anadl; mae croesi-fadu dau gymryd yn gadael anghydnawsedd ton. Mae mewn-argraffu yn llenwi'r bwlch gydag iaith sy'n cydweddu â'r llais cyfagos, felly clyw pobl sain sy'n swnio'n naturiol yn gyson.

Ie — POST i /v1/audio-inpaint/ gyda'r ffeil sain, start_sec, end_sec, a replacement_text. Mae'r diweddbwyntiau yn dychwelyd UUID swydd; pleidleisio /v1/speech/results/?uuid= i nôl y sain wedi'i arlunio pan fydd yn barod. Gweler dogfennaeth API am fanylion.

Mae Speech-to-Speech ElevenLabs yn ail-greu'r llinell lais gyfan o'r dechrau mewn llais targed. Mae ein llenwi sain yn feddyginiaethol: mae'n golygu'r amrediad wedi'i farcio yn unig, yn cadw pob beit arall o'ch recordiad gwreiddiol heb ei gysylltu, ac yn cydweddu'r clip newydd â'r llais cyfagos yn hytrach na llyfrgell lais ar wahân.
5.0/5 (1)

Beth allwn ni ei wella? Mae eich adborth yn ein helpu i ddatrys problemau.

Cywiro'ch sain mewn eiliadau

Amnewid unrhyw ran o unrhyw recordiad gydag iaith wedi'i syntheseiddio gan AI sy'n cydweddu â'r llais gwreiddiol. Cofrestru am ddim i ddechrau.