VITS

Baker (Chinese)

Àìfẹ́ Chinese Neutral VITS

Baker (Chinese) ní ìrànwọ́ AI neutral tí a fi ìpapọ̀ láti inú ìṣàmúlò-ètò àkọlé-si-ìbàlẹ̀ VITS. Àwòrán yìí tí a fi free-tier kọ́ ní Chinese àti tí o fi ìṣàmúlò-ètò ìṣàfihàn tí a ní ìṣàfihàn dara-quality pamọ́. Ààyè tí a fi ṣẹ́dá ààyè yìí nípa ìṣàfarawé àwọn ààyè tí a fi ṣẹ́dá fún Ìgbá tí o tí ìjáde atí ìṣàmúlò-ètò ìṣàfarawé tí a fi ṣẹ́dá fún 3/5, Baker (Chinese) jẹ́ ìṣàmúlò-ètò tí o dara fún general-purpose text-to-speech with natural prosody. Ìjánu-ìṣàfilọ́lẹ̀ {móòdù} ní a tí kọ́ nípa {àwọn ìṣàfilọ́lẹ̀} under the MIT license, tí o fi jẹ́ àìdára fun ìlò àìṣe. Àwọn ìṣẹ̀dá ìwọ̀n ni: end-to-end synthesis, natural prosody, fast inference, multiple speakers.

Àwọn ìṣàmúlò-ètò

VITSÀwọn Àlàyé Àwọn Àwọn Àwọn Àwọn

Àwọn ìṣàmúlò-ètò VITS
Àwọn Àkọlé Jaehyeon Kim et al.
Àwọn ìkúndùǹ
Ìjánu-ìṣàmúlò-ètò Àwọn àwọn ààyè-iṣẹ́
Àwọn Ààyè-iṣẹ́ MIT
Àwọn Àwọn Àkọlé Kò wa
Àwọn àwọn ààyè-iṣẹ́ Àwọn àyọkà àìfilọ́lẹ̀
Àwọn Àtòjọ-ẹ̀yàn 25M
Àwọn Ìṣàmúlò-ètò VAE + Normalizing Flows + GAN
Àtòjọ-ẹ̀yàn Ìṣàmúlò-ètò 585 àwọn àgójọpọ̀
_Táàbù 2021

Àwọn Ìṣàmúlò-ètò Tí O darà fún Baker (Chinese)

Àwọn ìṣàmúlò-ètò tí a fi pamọ́ fún àwọn àbùdá ìrànwọ́ àwòrán yìí

Àwọn àkọlé àwọn àkọlé

Lo Baker (Chinese) láti sọ àwọn ìròyìn ìṣàfarawé àwọn ìṣàmúlò-ètò ìpẹ̀lú àwọn ìṣàfihàn àti àwọn ìṣàfihàn àwọn ìṣàfihàn.

Àwọn Àmì-ìwé Àwòrán

Fi àwọn àkọlé àwọn àkọlé àwọn àwòrán YouTube, àwọn àwọn ààyè-iṣẹ́, àti àwọn àwọn ààyè-iṣẹ́ media ìmọ̀yàn.

Àwọn Ìṣàmúlò-ètò & Ìrànwọ́

Ìṣàfilọ́lẹ̀ ìṣàfarawé kọ̀ǹpútà yìí jẹ́ ìṣàfilọ́lẹ̀ ìṣàmúlò-ètò ìgbárapọ̀, àwọn ìṣàfilọ́lẹ̀ ojú-ìwé, àti àwọn ìrànwọ́ àwọn ìrànwọ́.

Àwọn Ìṣàmúlò-ètò

Ṣẹ̀dà àwọn ààyè-iṣẹ́ ìṣàfilọ́lẹ̀, àwọn kọ́kọ́, àti àwọn ààyè-iṣẹ́ ìṣàfilọ́lẹ̀ nípa ìṣàfilọ́lẹ̀ AI tí a mọ̀.

Díẹ̀ VITS Àwọn Àmì-ìwé

Àwọn ìrànwọ́ mìíràn láti inú àwọn ìṣàmúlò-ètò TTS

Default

English Neutral

Àwọn Àtòjọ-ẹ̀yàn

VITS (Ìṣàfilọ́lẹ̀ Ìyatọ̀ láti inú ìmọ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ fún àkọlé-si-ìbàlẹ̀-si-ìbàlẹ̀) ní àwọn ìṣàfilọ́lẹ̀ TTS ìsàlẹ̀ fún ìsàlẹ̀ tí wọ́n mú àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn

VITS ti wa ni idagbasoke nipasẹ Jaehyeon Kim et al. ati ti a ti tu silẹ labẹ iwe-aṣẹ MIT, eyiti o gba laaye lilo iṣowo ti awọn ohun orin ti a ṣẹda.

VITS ǹfàyè gbàgbà 4: English, Chinese, Japanese, Korean.

VITS nínú ìpele Àìfẹ́ - ọ̀fẹ̀ - kò ní àwọn ẹ̀yàn tí a fẹ́. O lè wòye àwọn àwòrán VITS fún ọ̀fẹ̀ láti ààyè-iṣẹ́ ìṣàfihàn láti sé ìṣàfihàn àwòrán ìtàn.

VITS ní ìṣàfihàn ìṣàfihàn tí o lagbara. Ò ń lọ nínú àkókò àìgbà tí o tí wa, tí ò fi dí ìṣàfihàn ìṣàfihàn àti àwọn ìṣàmúlò-ètò ìṣàfihàn.

VITS tí a fi àwọn ìṣàmúlò-ètò 3/5 pamọ́ fún ìdáràn àwòrán lórí TTS.ai. Ò fi ìdáràn àwòrán tí o dara fún ìṣàmúlò-ètò ìwọ̀n.

No, VITS uses a fixed set of built-in voices. For voice cloning, try models like CosyVoice 2, GPT-SoVITS, or Chatterbox.

Ya, VITS ní a ṣè fọwọ́sì fún àkọlé-si-ìbàlẹ̀-ìgbàyèlú nípa àwọn ìṣàfarawe-ìrọ̀ tí a tí ìṣàfilọ́lẹ̀. Àwọn ìṣàfilọ́lẹ̀ tí a tí ìṣàfilọ́lẹ̀, àwọn ìṣàfilọ́lẹ̀ tí a tí ìṣàfilọ́lẹ̀, àwọn ìṣàfilọ́lẹ̀ tí a tí ìṣàfilọ́lẹ̀ jẹ́ àwọn àwọn ìṣàfilọ́lẹ̀ tí a lè lò fún àwọn àwọn ààyè yìí.

Ya, VITS ní ìṣẹ̀dà láti ìsàlẹ̀ sípò MIT, tí o gbá ìlòòrò. Àwọn àwòrán tí a ṣẹ̀dà láti inú àwọn ìrànwọ́ VITS lè lò nínú àwọn àwòrán, àwọn pódíẹ̀tì, àwọn ìṣàmúlò-ètò, àwọn ere, àti àwọn ìṣàmúlò-ètò fún iṣẹ́ ọ̀fẹ́.

Ya, gbogbo àwọn ìrànwọ́ ní pàtó TTS.ai ló ń ló àwọn àwọn àwòrán-ìṣàfilọ́lẹ̀ àìfilọ́lẹ̀-ìṣàfilọ́lẹ̀ (MIT, Apache 2.0). Àwòrán tí a ṣẹ̀dà nípa rẹ̀ láti lò nínú àwọn àwòrán, àwọn ìṣàfilọ́lẹ̀, àwọn ere, àwọn ìṣàfilọ́lẹ̀ àwọn iṣẹ́ iṣẹ́.

Send a POST request to /api/v1/tts/ with the model name and voice ID. See our API Documentation page for code examples in Python, JavaScript, Go, and cURL.

Yà, tẹ bọ́tìnì ìṣàmúlò-ètò náà nínú ojú-ìwé yìí láti gbọ́ àwọn ààyè-iṣẹ́. O lè kọ́ àwọn àkọlé àwọn ìṣàmúlò-ètò rẹ̀ nínú ojú-ìwé Àkọlé-si-Ìṣàfihàn àti láti ṣẹ̀dá àwọn ìṣàfihàn àìfẹ́ nínú àwọn ìròyìn wòye.

Àwọn ìṣàfarawé Baker (Chinese) Àwọn ààyè-iṣẹ́

Ṣàfihàn àwọn àyọkà àti ìgbọ̀n àwòrán láti inú Baker (Chinese). Free to use Tí kò bá jẹ́ pé.