VITS

Baker (Chinese)

Rhydd Tsieinëeg Neutral VITS

Mae Baker (Chinese) yn lais neutral AI a bwerir gan y model testun-i-leferydd VITS. Mae'r free-tier lais hwn yn siarad Tsieinëeg ac yn darparu cyfansoddiad lleferydd da-quality. Gyda chyflymder creu yn agos-yn-un-amser a gradd ansawdd o 3/5, mae Baker (Chinese) yn addas iawn ar gyfer general-purpose text-to-speech with natural prosody. Mae'r peiriant VITS wedi ei ddatblygu gan Jaehyeon Kim et al. under the MIT license, gan ei wneud yn ddiogel ar gyfer defnydd masnachol. Mae'r galluoedd allweddol yn cynnwys: end-to-end synthesis, natural prosody, fast inference, multiple speakers.

Dim graddau eto

VITSGwybodaeth Model

Model VITS
Datblygwr Jaehyeon Kim et al.
Ansawdd
Cyflymder Cyflym
Trwydded MIT
Clonio Dim ar gael
o Fawrth Am ddim (dim credydau)
Paramedrau 25M
Pensaernïaeth VAE + Normalizing Flows + GAN
Data Hyfforddi 585 awr
Blwyddyn 2021

Casgliadau Defnyddiol Baker (Chinese)

Cymhwysiadau a argymhellir yn seiliedig ar y llais yma

Llyfrau Sain a ChyflwyniadName

Defnyddiwch Baker (Chinese) i ddweud cynnwys ffurf hir gydag ysgrifennu naturiol a mynegiant.

Llywio Fideo

Ychwanegu naws broffesiynol i fideos YouTube, hysbysebion, a chynnwys cyfryngau cymdeithasol.

Cymhwysiadau a Hygyrchedd

Mae'r creu cyflym yn gwneud y llais hwn yn berffaith ar gyfer rhaglenni amser real, darllenwyr sgrin, ac offer hygyrchedd.

E-ddysgu a hyfforddiant

Creu deunyddiau hyfforddi, cyrsiau a chynnwys addysgol sy'n ddeniadol gydag ysgrifennu AI clir.

Mwy VITS Llais

Llygaid eraill o'r un model TTS

Default

Saesneg Neutral

Cwestiynau a Ofynnir yn Aml

VITS (Dealltwriaeth Amrywiol gyda dysgu gwrthwynebol ar gyfer Testun-i-Lafaro diwedd-i-ddiwedd) yw dull TTS diwedd-i-ddiwedd paralel sy'n creu sain sy'n swnio'n fwy naturiol na'r modelau cyfredol o ddau gam. Mae'n mabwysiadu dealltwriaeth amrywiol wedi'i wella gyda llifoedd normaleiddio a phrosesu hyfforddi gwrthwynebol, gan gyflawni gwelliannau sylweddol mewn naturioldeb.

Datblygwyd VITS gan Jaehyeon Kim et al. ac mae'n cael ei ryddhau o dan drwydded MIT, sy'n caniatáu defnydd masnachol o sain a gynhyrchir.

Mae VITS yn cynnal 4 iaith: Saesneg, Tsieinëeg, Siapaneaidd, Corea.

Mae VITS yn y lefel Am Ddim - am ddim - nid oes angen credydau. Gallwch rhagolwg unrhyw lais VITS am ddim cyn creu sain lawn.

Mae gan VITS gyflymder creu cyflym iawn. Mae'n rhedeg mewn amser go iawn, gan ei wneud yn addas ar gyfer rhaglenni llifogydd a rhyngweithiol.

Mae VITS wedi ei raddio 3/5 am ansawdd sain ar TTS.ai. Mae'n darparu swn o ansawdd da sy'n addas ar gyfer y rhan fwyaf o gymwysiadau.

Na, defnyddia VITS set gadarn o lais mewnol. I gloni llais, ceisiwch modelau fel CosyVoice 2, GPT-SoVITS, neu Chatterbox.

Ie, mae VITS yn cael ei argymell yn benodol ar gyfer testun-i-ganu pwrpas cyffredinol gyda phrosodi naturiol. Mae ei gyfansoddiad diwedd-i-ddiwedd, profosodi naturiol, a galluoedd dehongli cyflym yn ei wneud yn ddewis rhagorol ar gyfer y achos defnydd hwn.

Ydy, mae VITS wedi'i drwyddedu o dan drwydded MIT, sy'n caniatáu defnydd masnachol. Gellir defnyddio sain a gynhyrchir gyda lleisiau VITS mewn fideos, podiau, cymwysiadau, gemau, a phob prosiect masnachol arall.

Ydy, mae pob llais ar TTS.ai yn defnyddio modelau ffynhonnell agored gyda thrwydded fasnachol (MIT, Apache 2.0). Eich llais chi yw'r sain a gynhyrchir i'w ddefnyddio mewn fideos, podiau, rhaglenni, gemau, a phob rhaglen fasnachol arall.

Anfonwch gais POST i /api/v1/tts/ gyda'r enw model a'r ID llais. Gweler ein tudalen Dogfennaeth API am enghreifftiau o godau mewn Python, JavaScript, Go, a cURL.

Ie, cliciwch y botwm chwarae ar y dudalen hon i glywed enghraifft. Gallwch hefyd deipio testun addasiedig ar y dudalen Testun- i- Leferydd a chreu rhagolwg am ddim gydag unrhyw lais.

Ceisio Baker (Chinese) Nawr

Teipiwch unrhyw destun a'i glywed yn cael ei ddweud gan Baker (Chinese). Am ddim i'w ddefnyddio gyda dim credydau angenrheidiol.