VibeVoice

Speaker 2

Àwọn ìpéwọ̀n English Neutral VibeVoice

Speaker 2 ní ìrànwọ́ AI neutral tí a fi ìpapọ̀ láti inú ìṣàmúlò-ètò àkọlé-si-ìbàlẹ̀ VibeVoice. Àwòrán yìí tí a fi standard-level kọ́ ní English àti tí o fi ìṣàmúlò-ètò ìṣàfihàn tí a ní ìṣàfihàn Ìkọ́kọ́-quality pamọ́. Ààyè tí a fi ṣẹ́dá ààyè yìí nípa ìṣàfarawé àwọn ààyè tí a fi ṣẹ́dá fún Ìgbá tí o tí ìjáde atí ìṣàmúlò-ètò ìṣàfarawé tí a fi ṣẹ́dá fún 5/5, Speaker 2 jẹ́ ìṣàmúlò-ètò tí o dara fún podcasts, dialogues, long-form narration, multi-speaker content. Ìjánu-ìṣàfilọ́lẹ̀ {móòdù} ní a tí kọ́ nípa {àwọn ìṣàfilọ́lẹ̀} under the MIT license, tí o fi jẹ́ àìdára fun ìlò àìṣe. Àwọn ìṣẹ̀dá ìwọ̀n ni: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

Àwọn ìṣàmúlò-ètò

VibeVoiceÀwọn Àlàyé Àwọn Àwọn Àwọn Àwọn

Àwọn ìṣàmúlò-ètò VibeVoice
Àwọn Àkọlé Microsoft
Àwọn ìkúndùǹ
Ìjánu-ìṣàmúlò-ètò Àwọn àwọn ààyè-iṣẹ́
Àwọn Ààyè-iṣẹ́ MIT
Àwọn Àwọn Àkọlé Kò wa
Àwọn àwọn ààyè-iṣẹ́ Àwọn àyọkà ìpéwọ̀n (2 àwọn ìṣàmúlò-ètò/1K àwọn àyọkà)
Àwọn Àtòjọ-ẹ̀yàn 1.5B
Àwọn Ìṣàmúlò-ètò LLM + DAC
Àtòjọ-ẹ̀yàn Ìṣàmúlò-ètò 100000 àwọn àgójọpọ̀
_Táàbù 2025

Àwọn Ìṣàmúlò-ètò Tí O darà fún Speaker 2

Àwọn ìṣàmúlò-ètò tí a fi pamọ́ fún àwọn àbùdá ìrànwọ́ àwòrán yìí

Àwọn àkọlé àwọn àkọlé

Lo Speaker 2 láti sọ àwọn ìròyìn ìṣàfarawé àwọn ìṣàmúlò-ètò ìpẹ̀lú àwọn ìṣàfihàn àti àwọn ìṣàfihàn àwọn ìṣàfihàn.

Àwọn Àmì-ìwé Àwòrán

Fi àwọn àkọlé àwọn àkọlé àwọn àwòrán YouTube, àwọn àwọn ààyè-iṣẹ́, àti àwọn àwọn ààyè-iṣẹ́ media ìmọ̀yàn.

Àwọn Ìṣàmúlò-ètò & Ìrànwọ́

Ìṣàfilọ́lẹ̀ ìṣàfarawé kọ̀ǹpútà yìí jẹ́ ìṣàfilọ́lẹ̀ ìṣàmúlò-ètò ìgbárapọ̀, àwọn ìṣàfilọ́lẹ̀ ojú-ìwé, àti àwọn ìrànwọ́ àwọn ìrànwọ́.

Àwọn Pódíẹ̀tì & Àwọn Àkọ́kọ́

Àwọn ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀

Díẹ̀ VibeVoice Àwọn Àmì-ìwé

Àwọn ìrànwọ́ mìíràn láti inú àwọn ìṣàmúlò-ètò TTS

Speaker 1

English Neutral

Speaker 1 (Chinese)

Chinese Neutral

Speaker 2 (Chinese)

Chinese Neutral

Speaker 3

English Neutral

Speaker 4

English Neutral

Àwọn Àtòjọ-ẹ̀yàn

VibeVoice ti Microsoft ti wa ni àwọn ìṣàfarawé àwọn ìṣàmúlò-ètò meji: àwọn módè́lì 1.5B fún àwọn àkọlé àwọn ìṣàmúlò-ètò ìgbà (si 90 àwọn àkókò, 4 àwọn ìgbàgbọ́) àti àwọn módè́lì 0.5B Fún Ìgbá Ìṣàmúlò-ètò Ìṣàfilọ́lẹ̀ pẹlú àwọn àwọn àkọlé àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn

VibeVoice ti dagbasoke nipasẹ Microsoft ati pe o ti tu silẹ labẹ iwe-aṣẹ MIT (ifẹ-iwadi-o-kan), eyiti o gba laaye lilo iṣowo ti awọn ohun orin ti a ṣẹda.

VibeVoice ǹfà ìraǹrọ̀ 1: Àwọn Àkọsílẹ̀

VibeVoice nínú ìpelé Premium — 4 àwọn ẹ̀yàn fún àwọn àyọkà 1,000. O lè wòye àwọn àwòrán VibeVoice fún ọ̀fẹ̀ láti ààyè-iṣẹ́ láti sé ìṣàfarawe àwòrán.

VibeVoice ní ìṣàfarawé ìṣàfarawé. Àwọn ìṣàfarawé nígbà kan gba àwọn ìsẹ̀ẹ̀tì láti dájú ìgbà ìṣàfarawé.

VibeVoice tí a fi àwọn ìṣàmúlò-ètò 5/5 pamọ́ fún ìdáràn àwòrán lórí TTS.ai. Ò ǹfi àwọn ìṣàmúlò-ètò ìpele-ìstudiò, àwọn ìṣàmúlò-ètò ìrànwọ́-ẹnì pamọ́.

No, VibeVoice uses a fixed set of built-in voices. For voice cloning, try models like CosyVoice 2, GPT-SoVITS, or Chatterbox.

Yes, VibeVoice is specifically recommended for podcasts, dialogues, long-form narration, multi-speaker content. Its multi-speaker, long-form (90 min), podcast generation capabilities make it an excellent choice for this use case.

Ya, VibeVoice ní ìṣẹ̀dà láti inú MIT (ìfẹ́ ìwadii-ìmọ̀), tí o gbá ìlòòrò. Àwòrán tí a ṣẹ̀dà láti inú àwọn ìrànwọ́ VibeVoice lè lò nínú àwọn àwòrán, àwọn pódíẹ̀tì, àwọn ìṣàmúlò-ètò, àwọn ere, àti àwọn ìṣàmúlò-ètò fún iṣowo.

Ya, gbogbo àwọn ìrànwọ́ ní pàtó TTS.ai ló ń ló àwọn àwọn àwòrán-ìṣàfilọ́lẹ̀ àìfilọ́lẹ̀-ìṣàfilọ́lẹ̀ (MIT, Apache 2.0). Àwòrán tí a ṣẹ̀dà nípa rẹ̀ láti lò nínú àwọn àwòrán, àwọn ìṣàfilọ́lẹ̀, àwọn ere, àwọn ìṣàfilọ́lẹ̀ àwọn iṣẹ́ iṣẹ́.

Send a POST request to /api/v1/tts/ with the model name and voice ID. See our API Documentation page for code examples in Python, JavaScript, Go, and cURL.

Yà, tẹ bọ́tìnì ìṣàmúlò-ètò náà nínú ojú-ìwé yìí láti gbọ́ àwọn ààyè-iṣẹ́. O lè kọ́ àwọn àkọlé àwọn ìṣàmúlò-ètò rẹ̀ nínú ojú-ìwé Àkọlé-si-Ìṣàfihàn àti láti ṣẹ̀dá àwọn ìṣàfihàn àìfẹ́ nínú àwọn ìròyìn wòye.

Àwọn ìṣàfarawé Speaker 2 Àwọn ààyè-iṣẹ́

Ṣàfihàn àwọn àyọkà àti ìgbọ̀n àwòrán láti inú Speaker 2. Free to use.