Speaker 2

Àwọn ìpéwọ̀n English Neutral

VibeVoice

Speaker 2 ní ìrànwọ́ AI neutral tí a fi ìpapọ̀ láti inú ìṣàmúlò-ètò àkọlé-si-ìbàlẹ̀ VibeVoice. Àwòrán yìí tí a fi standard-level kọ́ ní English àti tí o fi ìṣàmúlò-ètò ìṣàfihàn tí a ní ìṣàfihàn Ìkọ́kọ́-quality pamọ́. Ààyè tí a fi ṣẹ́dá ààyè yìí nípa ìṣàfarawé àwọn ààyè tí a fi ṣẹ́dá fún Ìgbá tí o tí ìjáde atí ìṣàmúlò-ètò ìṣàfarawé tí a fi ṣẹ́dá fún 5/5, Speaker 2 jẹ́ ìṣàmúlò-ètò tí o dara fún podcasts, dialogues, long-form narration, multi-speaker content. Ìjánu-ìṣàfilọ́lẹ̀ {móòdù} ní a tí kọ́ nípa {àwọn ìṣàfilọ́lẹ̀} under the MIT license, tí o fi jẹ́ àìdára fun ìlò àìṣe. Àwọn ìṣẹ̀dá ìwọ̀n ni: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

Àwọn ìṣàmúlò-ètò

Wá Àwòrán Yìí Gbogbo wọn VibeVoice Àwọn Àmì-ìwé

Àwọn Àlàyé Àwọn Àwọn Àwọn Àwọn

Àwọn ìṣàmúlò-ètò	VibeVoice
Àwọn Àkọlé	Microsoft
Àwọn ìkúndùǹ
Ìjánu-ìṣàmúlò-ètò	Àwọn àwọn ààyè-iṣẹ́
Àwọn Ààyè-iṣẹ́	MIT
Àwọn Àwọn Àkọlé	Kò wa
Àwọn àwọn ààyè-iṣẹ́	Àwọn àyọkà ìpéwọ̀n (2 àwọn ìṣàmúlò-ètò/1K àwọn àyọkà)
Àwọn Àtòjọ-ẹ̀yàn	1.5B
Àwọn Ìṣàmúlò-ètò	LLM + DAC
Àtòjọ-ẹ̀yàn Ìṣàmúlò-ètò	100000 àwọn àgójọpọ̀
Year	2025

Àwọn Ìṣàmúlò-ètò Tí O darà fún Speaker 2

Àwọn ìṣàmúlò-ètò tí a fi pamọ́ fún àwọn àbùdá ìrànwọ́ àwòrán yìí

Àwọn àkọlé àwọn àkọlé

Lo Speaker 2 láti sọ àwọn ìròyìn ìṣàfarawé àwọn ìṣàmúlò-ètò ìpẹ̀lú àwọn ìṣàfihàn àti àwọn ìṣàfihàn àwọn ìṣàfihàn.

Àwọn Àmì-ìwé Àwòrán

Fi àwọn àkọlé àwọn àkọlé àwọn àwòrán YouTube, àwọn àwọn ààyè-iṣẹ́, àti àwọn àwọn ààyè-iṣẹ́ media ìmọ̀yàn.

Àwọn Ìṣàmúlò-ètò & Ìrànwọ́

Ìṣàfilọ́lẹ̀ ìṣàfarawé kọ̀ǹpútà yìí jẹ́ ìṣàfilọ́lẹ̀ ìṣàmúlò-ètò ìgbárapọ̀, àwọn ìṣàfilọ́lẹ̀ ojú-ìwé, àti àwọn ìrànwọ́ àwọn ìrànwọ́.

Àwọn Pódíẹ̀tì & Àwọn Àkọ́kọ́

Àwọn ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀

Díẹ̀ VibeVoice Àwọn Àmì-ìwé

Àwọn ìrànwọ́ mìíràn láti inú àwọn ìṣàmúlò-ètò TTS

Speaker 1

English Neutral

Speaker 1 (Chinese)

Chinese Neutral

Speaker 2 (Chinese)

Chinese Neutral

Speaker 3

English Neutral

Speaker 4

English Neutral

Wo gbogbo wọn VibeVoice Àwọn Àmì-ìwé

Àwọn Àtòjọ-ẹ̀yàn

VibeVoice ti Microsoft ti wa ni àwọn ìṣàfarawé àwọn ìṣàmúlò-ètò meji: àwọn módè́lì 1.5B fún àwọn àkọlé àwọn ìṣàmúlò-ètò ìgbà (si 90 àwọn àkókò, 4 àwọn ìgbàgbọ́) àti àwọn módè́lì 0.5B Fún Ìgbá Ìṣàmúlò-ètò Ìṣàfilọ́lẹ̀ pẹlú àwọn àwọn àkọlé àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn

VibeVoice ti dagbasoke nipasẹ Microsoft ati pe o ti tu silẹ labẹ iwe-aṣẹ MIT (ifẹ-iwadi-o-kan), eyiti o gba laaye lilo iṣowo ti awọn ohun orin ti a ṣẹda.

VibeVoice ǹfà ìraǹrọ̀ 1: Àwọn Àkọsílẹ̀

VibeVoice nínú ìpelé Premium — 4 àwọn ẹ̀yàn fún àwọn àyọkà 1,000. O lè wòye àwọn àwòrán VibeVoice fún ọ̀fẹ̀ láti ààyè-iṣẹ́ láti sé ìṣàfarawe àwòrán.

VibeVoice ní ìṣàfarawé ìṣàfarawé. Àwọn ìṣàfarawé nígbà kan gba àwọn ìsẹ̀ẹ̀tì láti dájú ìgbà ìṣàfarawé.

VibeVoice tí a fi àwọn ìṣàmúlò-ètò 5/5 pamọ́ fún ìdáràn àwòrán lórí TTS.ai. Ò ǹfi àwọn ìṣàmúlò-ètò ìpele-ìstudiò, àwọn ìṣàmúlò-ètò ìrànwọ́-ẹnì pamọ́.

No, VibeVoice uses a fixed set of built-in voices. For voice cloning, try models like CosyVoice 2, GPT-SoVITS, or Chatterbox.

Ya, VibeVoice ní a ṣè fọwọ́sì fún àwọn pod́ẹ́kì, àwọn ìṣàlàyé, àwọn àkọ́kọ́ ìṣàmúlò-ètò ìgbà, àwọn àkọ́kọ́ àwọn ìṣàfihàn. Àwọn ìṣàfihàn, àwọn ìṣàfihàn (90 min), àwọn ìṣàfihàn pod́ẹ́kì jẹ́ àwọn àwọn ìṣàfihàn tí a fẹ́ fún àwọn ààyè-iṣẹ́ yìí.

Ya, VibeVoice ní ìṣẹ̀dà láti inú MIT (ìfẹ́ ìwadii-ìmọ̀), tí o gbá ìlòòrò. Àwòrán tí a ṣẹ̀dà láti inú àwọn ìrànwọ́ VibeVoice lè lò nínú àwọn àwòrán, àwọn pódíẹ̀tì, àwọn ìṣàmúlò-ètò, àwọn ere, àti àwọn ìṣàmúlò-ètò fún iṣowo.

Ya, gbogbo àwọn ìrànwọ́ ní pàtó TTS.ai ló ń ló àwọn àwọn àwòrán-ìṣàfilọ́lẹ̀ àìfilọ́lẹ̀-ìṣàfilọ́lẹ̀ (MIT, Apache 2.0). Àwòrán tí a ṣẹ̀dà nípa rẹ̀ láti lò nínú àwọn àwòrán, àwọn ìṣàfilọ́lẹ̀, àwọn ere, àwọn ìṣàfilọ́lẹ̀ àwọn iṣẹ́ iṣẹ́.

Send a POST request to /api/v1/tts/ with the model name and voice ID. See our API Documentation page for code examples in Python, JavaScript, Go, and cURL.

Yà, tẹ bọ́tìnì ìṣàmúlò-ètò náà nínú ojú-ìwé yìí láti gbọ́ àwọn ààyè-iṣẹ́. O lè kọ́ àwọn àkọlé àwọn ìṣàmúlò-ètò rẹ̀ nínú ojú-ìwé Àkọlé-si-Ìṣàfihàn àti láti ṣẹ̀dá àwọn ìṣàfihàn àìfẹ́ nínú àwọn ìròyìn wòye.

Àwọn ìṣàfarawé Speaker 2 Àwọn ààyè-iṣẹ́

Ṣàfihàn àwọn àyọkà àti ìgbọ̀n àwòrán láti inú Speaker 2. Free to use.

Ṣẹ̀dà Àwọn Àkọlé Ṣàfihàn

Speaker 2

Àwọn Àlàyé Àwọn Àwọn Àwọn Àwọn

Àwọn Ìṣàmúlò-ètò Tí O darà fún Speaker 2

Àwọn àkọlé àwọn àkọlé

Àwọn Àmì-ìwé Àwòrán

Àwọn Ìṣàmúlò-ètò & Ìrànwọ́

Àwọn Pódíẹ̀tì & Àwọn Àkọ́kọ́

Díẹ̀ VibeVoice Àwọn Àmì-ìwé

Speaker 1

Speaker 1 (Chinese)

Speaker 2 (Chinese)

Speaker 3

Speaker 4

Àwọn Àtòjọ-ẹ̀yàn

Àwòrán VibeVoice TTS

Tí ẹnì tí kọ́ VibeVoice?

Àwọn ìtàn wo ní VibeVoice ń gbọ́?

Ìgbà wo nínú òṣùwọn ìlòòdù VibeVoice?

Ìgbà wo ní VibeVoice tí n ṣẹ̀dà àwọn àkọlé?

Kini ìdáràn àwòrán VibeVoice?

Ń lè kọ́ àwòrán láti inú VibeVoice?

VibeVoice jẹ́ ìṣàfarawé fún àwọn pod́ìkì?

Ń lè lò àwọn ìrànwọ́ VibeVoice nípa ìṣowo?

Ń lè lò ìrànwọ́ yìí fún àwọn ìṣàmúlò-ètò ọ̀fẹ́?

Bawo ni mo ṣe le lo àwòrán yìí láti inú API?

Ń lè wòye àwòrán àwòrán láti inú àwòrán?

Àwọn ìṣàfarawé Speaker 2 Àwọn ààyè-iṣẹ́