VITS

Baker (Chinese)

Libre Intsik Neutral VITS

Ang "Ikaw" ay isang awiting Filipino na inawit ni Ai Ai delas Alas at inilabas sa kanyang album na Ikaw. Sa isang karaniwang sistemang panukat ng presyon ng dugo, ang presyon ng dugo ay ang presyon ng dugo sa isang yunit ng oras. Ang mga ito ay maaaring maging mga motor na pang-industriya, o mga motor na pang-komersyo. Ang mga pangunahing kakayahan ay kinabibilangan ng: end-to-end synthesis, natural prosody, fast inference, multiple speakers.

Walang mga rating pa

VITSImpormasyon ng Modelo

Modelo VITS
Developer Jaehyeon Kim et al.
Kalidad
Bilis Mabilis
Lisensya MIT
Clone Hindi magagamit
Mga hayop > Libre (walang mga character na ginagamit)
Parameter 25M
Arkitektura VAE + Normalizing Flows + GAN
Data ng pagsasanay 585 oras
Taon 2021

> Pinakamahusay na gamitin ang mga kaso para sa Baker (Chinese)

> Inirerekomendang mga application batay sa mga katangian ng boses na ito

> Audiobooks & Paglalarawan

Ang mga ito ay maaaring magpakita ng mga katangian ng natural na seleksiyon at natural na seleksiyon.

Mga Video Voiceover

Magdagdag ng propesyonal na pagsasalaysay sa mga video, ad, at nilalaman sa social media ng YouTube.

> Apps at Aksesibilidad

Ang mabilis na paglikha ay ginagawang perpekto ang boses na ito para sa mga real-time na apps, mga screen reader, at mga tool sa accessibility.

E-learning at pagsasanay

> Lumikha ng mga nakakaakit na materyales sa pagsasanay, mga kurso, at mga nilalaman sa edukasyon na may malinaw na AI na paglalarawan.

Higit pa VITS Mga Tinig

> Iba pang mga boses mula sa parehong modelo TTS

Default

Ingles Neutral

Mga Madalas Itanong

Ang VITS (Variation Inference with adversarial learning for end-to-end Text-to-Speech) ay isang parallel end-to-end na paraan ng TTS na bumubuo ng mas natural na tunog na audio kaysa sa kasalukuyang dalawang-stage na modelo. Ito ay gumagamit ng variation inference na pinahusay ng normalisasyon ng daloy at isang adversarial na proseso ng pagsasanay, na nakamit ang isang makabuluhang pagpapabuti sa naturalness.

Ang VITS ay binuo ni Jaehyeon Kim et al. at inilabas sa ilalim ng MIT license, na nagpapahintulot sa komersyal na paggamit ng audio na ginawa.

Ang VITS ay sumusuporta sa4na wika: Ingles, Intsik, Hapon, Koreano.

> VITS ay sa Libreng antas — libre — walang mga credits na kinakailangan. Maaari mong i-preview ang anumang VITS boses para sa libreng bago bumuo ng buong audio.

VITS ay may napakabilis na henerasyon bilis. Ito ay tumatakbo sa malapit na real-time, na ginagawang angkop para sa streaming at interactive na mga application.

> VITS ay may markang 3/5 para sa kalidad ng audio sa TTS.ai. Ito ay nagbibigay ng magandang kalidad ng pagsasalita na angkop para sa karamihan ng mga application.

Hindi, ang VITS ay gumagamit ng isang nakapirming hanay ng built-in na boses. Para sa pag-clone ng boses, subukan ang mga modelo tulad ng CosyVoice2, GPT-SoVITS, o Chatterbox.

Oo, VITS ay partikular na inirerekomenda para sa pangkalahatang-layunin na teksto-sa-pagsasalita na may natural prosody. Ang end-to-end synthesis, natural prosody, mabilis na mga kakayahan sa pagbubuod gawin itong isang mahusay na pagpipilian para sa paggamit na ito kaso.

Oo, ang VITS ay lisensyado sa ilalim ng MIT, na nagpapahintulot sa komersyal na paggamit. Ang audio na nabuo sa pamamagitan ng mga boses ng VITS ay maaaring magamit sa mga video, podcast, apps, laro, at anumang iba pang komersyal na proyekto.

Oo, lahat ng boses sa TTS.ai ay gumagamit ng mga modelong open-source na may lisensya ng komersyal (MIT, Apache 2.0). Ang audio na nabuo ay iyong gamitin sa mga video, podcast, apps, laro, at anumang iba pang mga komersyal na application.

Ipadala ang isang POST na kahilingan sa /api/v1/tts/ na may pangalan ng modelo at boses ID. Tingnan ang aming API Documentation page para sa mga halimbawa ng code sa Python, JavaScript, Go, at cURL.

> Oo, i-click ang play button sa pahinang ito upang marinig ang isang sample. Maaari mo ring i-type ang custom na teksto sa Text to Speech page at makabuo ng isang libreng preview sa anumang boses.

Subukan Baker (Chinese) Ngayon

> I-type ang anumang teksto at marinig ito sinabi sa pamamagitan ng Baker (Chinese). Libreng gamitin tl> na walang mga character na kinakailangan.