VITS

Baker (Chinese)

Хязгааргүй Хятад Neutral VITS

Baker (Chinese) нь VITS текст- рүү- ярих загвараар ажилладаг neutral хиймэл оюун ухааны дуу. Энэ Хязгааргүй дуу Хятад хэлээр ярьдаг ба сайн- чанартай яриа синтезийг өгдөг. ойролцоо үүсгэх хурд болон 3/5 чанарын үнэлгээтэй Baker (Chinese) нь general-purpose text-to-speech with natural prosody-д тохиромжтой. VITS хөдөлгүүрийг Jaehyeon Kim et al. under the MIT license боловсруулсан бөгөөд энэ нь худалдааны зориулалтаар ашиглахад аюулгүй. Түүний гол бүтээлүүд нь: "Хүний эрх" (1995).

Үнэлгээ байхгүй

VITSМодель мэдээ

Модель VITS
Хөгжүүлэгч Jaehyeon Kim et al.
Чадвар
Хурд Хурдан
Лиценз MIT
Хослох Үгүй
Гуравдугаар Хязгааргүй (хүртэлх тэмдэгтүүд байхгүй)
Параметрүүд 25M
Архитектур VAE + Normalizing Flows + GAN
Сургалтын мэдээ 585 цаг
Жил 2021

Хамгийн сайн хэрэглээний тохиолдол Baker (Chinese)

Энэ дууны шинж чанарт үндэслэн зөвлөсөн програмууд

Сонсголын номууд ба яриа

Baker (Chinese) -ийг урт хэлбэрийн агуулгад байгалийн хэмнэл, илэрхийлэлээр ярихад ашиглана.

Видео дуут дохио

YouTube видео, зар сурталчилгаа, нийгмийн сүлжээний контентоос мэргэжлийн яриаг нэмнэ.

Хэрэгслүүд ба хүрэх боломжууд

Энэ дууг хурдан үүсгэх нь бодит цагны програмууд, дэлгэц унших, хүрэх боломжийн хэрэгслүүд дээр тохиромжтой.

Сургалт, сургалт

Сургалтын материал, сургалт, сургалтын агуулгад анхаарал татахуйц, ойлгомжтой AI яриа бий болго.

Илүү VITS Дуунууд

Ижил TTS загвараас бусад дуунууд

Default

Англи хэл Neutral

Заримдаа асуудаг асуултууд

VITS (Variation Inference with adversarial learning for end- to- end Text- to- Speech) нь одоогийн хоёр шаттай загваруудаас илүү нарийн сонсогдох дууг гаргаж авах параллель төгсгөлөөс төгсгөл хүртэлх TTS арга юм. Энэ нь хэвийн урсгал болон өрсөлдөгч сургалтын үйл явцаар сайжруулсан variation inference- ийг ашиглан, нарийн сонсогдох байдлыг ихээхэн сайжруулдаг.

VITS нь Jaehyeon Kim et al.-ийн бүтээсэн бөгөөд MIT лицензийн дор гарч ирсэн бөгөөд энэ нь үүсгэсэн аудиог худалдааны зорилгоор ашиглахыг зөвшөөрдөг.

VITS4хөлсийг дэмждэг: Англи, Хятад, Япон, Солонгос.

VITS нь үнэгүй түвшинд байна - үнэгүй - ямар ч кредит шаардахгүй. Та VITS дууг бүрэн аудио үүсгэхээс өмнө үнэгүй үзэж болно.

VITS нь маш хурдан бүтээх хурдтай. Энэ нь бодит цаг хугацаанд ажилладаг, энэ нь дамжуулалт болон интерактив програмуудад тохиромжтой.

VITS нь TTS.ai дээрх дууны чанарын хувьд 3/5-р үнэлгээ авсан. Энэ нь ихэнх програмуудад тохирох сайн чанарын яриаг өгдөг.

Үгүй, VITS нь суурь дуугаралтын тогтмол багцыг ашигладаг. Хөгшрөлтгүй дуугаралтын хувьд CosyVoice 2, GPT- SoVITS, эсвэл Chatterbox-ийг туршаад үзээрэй.

Тийм ээ, VITS нь ерөнхий зориулалттай, байгалийн хэмнэлтэй текст- яриа програмд зориулагдсан. Энэ нь төгсгөлөөс төгсгөл хүртэлх синтез, байгалийн хэмнэл, хурдан дүгнэлт хийх чадвараараа энэ хэрэгцээнд тохиромжтой.

Тийм ээ, VITS нь MIT-ийн лицензтэй, энэ нь бизнесийн зорилгоор ашиглахыг зөвшөөрдөг. VITS дуугаралтууд нь видео, подкаст, програм, тоглоом, эсвэл бусад бизнесийн зорилгоор ашиглагдаж болно.

Тийм ээ, TTS.ai-ийн бүх дуунууд нь худалдааны лицензтэй нээлттэй эхийн загвар (MIT, Apache 2. 0) ашигладаг. Үйлчилгээний дууг та видео, подкаст, програм, тоглоом, бусад худалдааны програмд ашиглаж болно.

/api/v1/tts/ руу загварын нэр болон дууны ID-тэй POST хүсэлт илгээнэ үү. Python, JavaScript, Go, cURL-ийн кодын жишээг API-ийн баримт бичгийн хуудаснаас олж болно.

Тийм ээ, энэ хуудсан дээрх тоглох товчийг дарж жишээг сонсоорой. Та мөн "Мэдээлэлийг ярианд" хуудсанд өөрийн бичлэгийг оруулж, ямар ч дуугаар үнэгүй туршиж үзэх боломжтой.

Хийх Baker (Chinese) Одоо

Ямар ч текстийг бичээд сонс Baker (Chinese). Үнэгүй тэмдэгт шаардагддаггүй.