Llafar- i- LafarComment

Trawsnewid sain a lefarwyd — newid llais, teimlad, iaith, ac arddull tra'n cadw'r cynnwys gwreiddiol.

Tarddiad Sain

Llusgwch a gollyngwch eich ffeil yma, neu Pori

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

file.mp3

0 MB
— neu recordio eich llais —
00:00

Gosodiadau Trawsffurfio

Llusgwch a gollyngwch eich ffeil yma, neu Pori

Upload a reference of the target voice. 10-30 sec recommended.

file.mp3

0 MB

Canlyniad

Lawrlwythwch sain siarad, dewiswch eich trawsnewid, a chliciwch Trawsnewid i ddechrau

Trawsnewid siarad... Gall hyn gymryd ychydig o amser.

Gwreiddiol

0:00 0:00

Trawsnewid

0:00 0:00

Sut mae'n Gweithio

1. Lanlwytho Lleferydd

Recordio neu lawrlwytho'r sain yr ydych am ei drawsnewid

2. Dewis Trawsffurfio

Dewis newid llais, trosglwyddo arddull, neu drosi iaith

3. AI Transforms

Mae AI yn prosesu sain o ddiwedd i ddiwedd gan gadw cynnwys siarad

Lawrlwytho

gwrando ar y canlyniad a lawrlwytho'r sain wedi'i drawsnewid

Casgliadau

Llafar-i-Lafar ar gyfer cynnwys, hygyrchedd, a phrosiectau creadigol

Dyblygu Fideo

Dyblygu fideos i ieithoedd eraill tra'n cadw'r siaradwr gwreiddiol

Addasiad Emosiynau

Newid y ton emosiynol o recordiadau - gwneud i'r iaith sych fod yn gyffrous, neu i'r iaith naturiol fod yn gynnes a chroesawgar.

Cynhyrchiad Llywio

Trosglwyddo recordiadau llais amhriodol i gyfieithiadau llais sgleiniog gyda lleisiau ac arddull gwahanol.

Di-enw

Cuddio siaradwr

Modelau Llafar- i- LafarName

OpenVoice

Trosi llais yn gyflym gyda rheoli arddull grawn. Newid dynodiad llais, cyflymder, ac emosiynau mewn eiliadau.

  • Prosesu cyflym
  • Trosglwyddo Arddull
  • Traws- ieithyddol

Chatterbox

Cloniad llais zero-shot gyda rheoli teimladau grawn-fin o Resemble AI.

  • Rheoli emosiynau
  • Clonio zero-shot
  • Dilysrwydd Uchel

CosyVoice 2

Clonio llais traws-ieithog dros 8 iaith gyda chynhaliaeth prosod naturiol a llif.

  • 8 iaith
  • Clonio llais
  • Llif

Cwestiynau a Ofynnir yn Aml

Mae Speech to Speech (STS) AI yn trawsnewid un recordiad sain wedi'i siarad i allbwn siarad gwahanol - yn newid y llais, yr arddull, y teimlad, neu'r iaith tra'n cadw'r geiriau gwreiddiol a'r amseriad. Mae'n cyfuno adnabyddiaeth siarad, prosesu, a chyfuniad i mewn i un pibellau.

Mae Testun-i-Lafaru yn trosi testun ysgrifenedig i sain. Mae Testun-i-Lafaru yn cymryd sain sy'n bodoli eisoes fel mewnbwn ac yn ei drawsnewid yn uniongyrchol i sain newydd - gan gadw'r rhythm naturiol, seibiau, pwyslais, ac emosiynau'r recordiad gwreiddiol yn hytrach na chreu siarad o destun plaen.

Mae defnyddiau cyffredin yn cynnwys dyblygu fideos i ieithoedd eraill, newid llais y siaradwr mewn recordiad, addasu teimlad neu liw sain sy'n bodoli eisoes, creu cyfieithiadau llais o recordiadau cymhleth, a gwneud recordiadau llais yn ddienw tra'n cadw'r cynnwys.

Mae modelau trawsnewid llais fel OpenVoice a RVC yn trin trawsnewid llais-i-llais. Ar gyfer cyfathrebu rhwng ieithoedd, gall CosyVoice 2 a GPT-SoVITS cloni ac ail-synthesu mewn iaith wahanol. Mae Chatterbox yn cynnal cyfansoddiad yn seiliedig ar sain cyfeirio hefyd.

Ie. Drwy ddefnyddio modelau clôn llais, gallwch drawsnewid eich siarad i iaith wahanol tra'n cadw eich nodweddion llais eich hun. Mae'r AI yn echdynnu eich dynodiad llais ac yn ail-synthesu'r sain yn yr iaith neu'r arddull cyrchfan.

Mae'r pibellau yn trosysgrifo eich siarad yn gyntaf, yn cyfieithu'r testun i'r iaith cyrchfan, ac yna'n defnyddio clôn llais i gyfansoddi'r testun wedi'i gyfieithu yn eich llais gwreiddiol. Mae modelau fel CosyVoice 2 yn cynnal 8 iaith ar gyfer cyfansoddi rhwng ieithoedd.

I gael y canlyniadau gorau, lanlwythwch sain glir gyda lleiafswm o sŵn cefndir. WAV neu FLAC ar 16kHz neu uwch yw'r gorau. Ceir MP3, OGG, M4A, a WEBM hefyd. Mae siarad clir yn cynhyrchu'r trawsnewidiadau mwyaf cywir.

Mae prosesu bron yn real-amser ar gael drwy ein API gan ddefnyddio modelau cyflym fel Kokoro ar gyfer cyfansoddi a Faster Whisper ar gyfer adnabyddiaeth. Mae'r diffyg amser yn dibynnu ar y model a hyd y sain, ond gellir cyflawni troeon llai na 3 eiliad ar gyfer ymadroddion byr.

Ie. Mae modelau fel Chatterbox, Spark TTS, ac IndexTTS-2 yn cynnal rheolaeth ar emosiynau ac arddull. Gallwch drawsnewid siarad caled yn angerddol, trist yn hapus, neu gadarn yn ddramatig tra'n cadw'r un geiriau a'r un dynodiad siaradwr.

Mae Speech-to-speech yn cyfuno credydau adnabyddiaeth a chyfansoddi. Defnyddia trawsnewid arferol 1 munud 3-8 credyd yn dibynnu ar y modelau a ddewisir. Gellir defnyddio modelau haen rydd fel Kokoro ar gyfer y cam cyfansoddi ar gost sero.

Gall defnyddwyr am ddim brosesu sain hyd at 1 munud. Cynhelir ffeiliau hyd at 10 munud gan gynlluniau talu. Ar gyfer recordiadau hirach, rhannwch y sain i rannau neu defnyddiwch ein API ar gyfer prosesu batch heb gyfyngiadau hyd.

Ie, mae pob sain a lwythir i fyny yn cael ei brosesu ar ein gweinyddion GPU diogel ac yn cael ei ddileu'n awtomatig o fewn 24 awr. Ni ddefnyddiwn eich sain erioed i hyfforddi modelau. Defnyddir cysylltiadau cêl- ysgrifedig ar gyfer pob trosglwyddiad ac mae cyfathrebu rhwng gweinyddion yn cael ei ddilysu.
5.0/5 (1)

Trawsnewid unrhyw Leferydd gyda AIName

Newid llais, teimlad, iaith, ac arddull. Cofrestru am ddim a chael 50 credyd i ddechrau.