Tuairiscigh Fabht / Iarratas Gné

Gineadóir Físe Sync Liopa AI

Uaslódáil grianghraf d'aghaidh agus gearrthóg fuaime — faigh físeán cainte le sioncrónú liopa réalaíoch, íomhá ceann, agus blinks. Powered by SadTalker (MIT).

Táimid Díol do ghuth

Uasluchtaigh Aghaidh + Fuaim

1, 000 carachtar sa soicind

Tarraing agus scaoil do chomhad anseo, nó brabhsáil

JPG, PNG, or short MP4/WebM. Max 10MB. One clear, well-lit face works best.

comhad.mp3

0 MB

Tarraing agus scaoil do chomhad anseo, nó brabhsáil

MP3, WAV, M4A, or FLAC. Max 10MB. Free: up to 30 sec. Pro: up to 5 min.

comhad.mp3

0 MB

Á Phróiseáil...

Do fhíseán á rindreáil. Tógann sé seo 30 soicind go 2 nóiméad de ghnáth.

Do Fhíseán Talking- Head

Íosluchtaigh

Maidir le SadTalker

Is SadTalker (CVPR 2023, Tencent ARC) samhail foinse oscailte ag caint-ceann a beochan íomhá aghaidh amháin a labhairt aon fuaime.Murab ionann agus Wav2Lip leaganacha, SadTalker beochan freisin éirí ceann, blinks, agus abairt le haghaidh toradh níos nádúrtha.

Tá cód agus meáchain MIT-cheadúnaithe ó thús go deireadh — gan aon Llama, Gemma, nó cnámh droma neamhthráchtála — mar sin tá na físeáin a ghineann tú sábháilte le haghaidh úsáide tráchtála.

Leideanna do na Torthaí is Fearr

  • Portráid ardchaighdeáin, dea-soilsithe a úsáid – súile le feiceáil, béal dúnta
  • Oibríonn aghaidh lárnaithe, cearnach nó cóimheas gné 4: 5 is fearr
  • Tugann fuaim cainte glan (gan ceol) sioncrónú liopa níos déine
  • Cumasaigh GFPGAN le haghaidh shots laoch - dúbailte rindreáil ama ach sharpens mionsonraí
  • Úsáid an réamhshocrú Still nuair is mian leat avatar seasta a fháil

Lip Sync Video Plans

Tosaigh saor in aisce, uasghrádú nuair is gá duit níos mó

Saor
  • Teorainn fuaime 30 soicind
  • 256 pso aschur
  • Réamhshocrú "Still" amháin
  • Gan feabhsaitheoir aghaidhe
An ceann is coitianta
Cuntas Saor in Aisce
  • Teorainn fuaime 30 soicind
  • Réamhshocruithe "iomlán" agus "stáit" araon
  • 256 / 512 pso aschur
  • GFPGAN face enhancerName
Cláraigh saor in aisce
Pro
  • Teorainn fuaime 5 nóiméad
  • Ciú Tosaíochta GPU
  • Rochtain API (uaslódáil ilpháirtí)
  • Aisghlaonna comhlánaithe Webhook
  • Úsáid tráchtála (ceadúnas MIT)
Uasghrádú

Ceisteanna a chuirtear go minic

Uaslódáil grianghraf aghaidh agus gearrthóg fuaime, agus gineann an AI físeán den duine sin ag labhairt an fuaime le gluaiseachtaí liopa réalaíocha, ceann a chur, agus blinks.Tógtha ar SadTalker (CVPR 2023), samhail ceann cainte ceadúnaithe MIT a bheochan abairt chomh maith le cruth béal.

Is féidir leis an ionchur aghaidh a bheith ina íomhá JPG nó PNG (suas le 10 MB) nó físeán tiomána MP4 / WebM gearr (bainimid úsáid as an gcéad fhráma). Is féidir leis an bhfuaim tiomána a bheith MP3, WAV, M4A, nó FLAC suas le 10 MB.

Cuntais saor in aisce: suas le 30 soicind in aghaidh an ghearrthóg. úsáideoirí a íocann: suas le 5 nóiméad in aghaidh an iarratais. Ciallaíonn níos faide fuaime níos faide rindreáil am agus costas carachtar níos airde.

Úsáideann físeán sioncrónaithe liopaí 1,000 carachtar in aghaidh an tsoicind d'fhíseán a ghintear. Gearrthóg 30 soicind = 30,000 carachtar. Déantar an costas a bhilleáil roimh ré ó d'iarmhéid carachtar agus aisíoctar go huathoibríoch é má theipeann ar ghiniúint.

Tá — Tá cód agus meáchain SadTalker ceadúnaithe ag MIT ó thús go deireadh (gan Llama, Gemma, nó cnámh droma neamhthráchtála). Is leatsa na físeáin a ghineann tú le húsáid go tráchtála. Tá tú freagrach as na cearta a bheith agat ar an íomhá aghaidhe foinse agus ar an bhfuaim a uaslódálann tú.

Maidir le 30 soicind le haghaidh gearrthóg 5-soicind ar ár bhfreastalaí A100, ag scálú go líneach le fad fuaime.Cuireann an feabhsaitheoir aghaidh GFPGAN thart ar dhá uair an chloig ar fáil ach táirgeann sé aschur níos géire, ar chaighdeán níos airde.

Réamhshocrú iomlán (réamhshocrú) beochan ceann pose, blinks, agus abairt chomh maith leis na liopaí, ag táirgeadh físeán níos nádúrtha ag caint-ceann. Still réamhshocraithe glas an ceann i bhfeidhm agus beochan ach an béal - úsáideach nuair is mian leat a shot avatar seasta.

Is samhail athchóirithe aghaidhe é GFPGAN a ghéaraíonn sonraí aghaidhe tar éis rindreáil sioncrónaithe liopa. Glanann sé artifacts agus déanann sé go bhfuil an t- aschur 256- picteilín níos gaire do 512. Déanann sé an t- am rindreála a dhúbailt ach is fiú é le haghaidh shots laochra.

Rindreálann SadTalker ag 256 picteilín de réir réamhshocraithe. Athraigh go dtí 512 picteilín chun aschur níos géire a fháil (níos moille, VRAM níos airde) nó cumasaigh an feabhsaitheoir GFPGAN chun sonraí aghaidhe a uasscála. Chun na torthaí is fearr a fháil, uasluchtaigh grianghraf portráide ardcháilíochta, dea- shoilsithe.

Is féidir. Uaslódáil MP4 nó WebM mar ionchur aghaidhe agus úsáidfimid an chéad fhráma mar an fhéiniúlacht tiomána. Chun ath-dhubáil iomlán físe a fháil (athsholáthar béil in aghaidh an fhráma), féach an píblíne físe atá le teacht ó Dubbing Studio.

Tá. POST iarratas ilpháirteach chuig /api/v1/lipsync/ le réimsí aghaidh agus fuaime, ansin poll /api/v1/lipsync/result/?uuid= go dtí go bhfuil stádas "críochnaithe". Tá URL leis an MP4 rindreáilte sa fhreagra. Tá plean íoctha ag teastáil le haghaidh rochtain API.

Úsáideann SadTalker ailíniú aghaidhe chun an t-aghaidh is suntasaí a bhrath agus a bharr. Chun na torthaí is fearr a fháil, uaslódáil portráid le duine amháin lárnaithe, súile le feiceáil, agus occlusion íosta.
5.0/5 (1)

Cad is féidir linn a fheabhsú? Cabhraíonn d’aiseolas linn fadhbanna a réiteach.

Réidh le tosú?

Cláraigh saor in aisce agus a fháil 50 creidmheasanna. Níl aon chárta creidmheasa ag teastáil.