Speaker 1
Speaker 1 ní ìrànwọ́ AI neutral tí a fi ìpapọ̀ láti inú ìṣàmúlò-ètò àkọlé-si-ìbàlẹ̀ VibeVoice. Àwòrán yìí tí a fi standard-level kọ́ ní English àti tí o fi ìṣàmúlò-ètò ìṣàfihàn tí a ní ìṣàfihàn Ìkọ́kọ́-quality pamọ́. Ààyè tí a fi ṣẹ́dá ààyè yìí nípa ìṣàfarawé àwọn ààyè tí a fi ṣẹ́dá fún Ìgbá tí o tí ìjáde atí ìṣàmúlò-ètò ìṣàfarawé tí a fi ṣẹ́dá fún 5/5, Speaker 1 jẹ́ ìṣàmúlò-ètò tí o dara fún podcasts, dialogues, long-form narration, multi-speaker content. Ìjánu-ìṣàfilọ́lẹ̀ {móòdù} ní a tí kọ́ nípa {àwọn ìṣàfilọ́lẹ̀} under the MIT license, tí o fi jẹ́ àìdára fun ìlò àìṣe. Àwọn ìṣẹ̀dá ìwọ̀n ni: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.
Àwọn Àlàyé Àwọn Àwọn Àwọn Àwọn
| Àwọn ìṣàmúlò-ètò | VibeVoice |
| Àwọn Àkọlé | Microsoft |
| Àwọn ìkúndùǹ | |
| Ìjánu-ìṣàmúlò-ètò | Àwọn àwọn ààyè-iṣẹ́ |
| Àwọn Ààyè-iṣẹ́ | MIT |
| Àwọn Àwọn Àkọlé | Kò wa |
| Àwọn àwọn ààyè-iṣẹ́ | Àwọn àyọkà ìpéwọ̀n (2 àwọn ìṣàmúlò-ètò/1K àwọn àyọkà) |
| Àwọn Àtòjọ-ẹ̀yàn | 1.5B |
| Àwọn Ìṣàmúlò-ètò | LLM + DAC |
| Àtòjọ-ẹ̀yàn Ìṣàmúlò-ètò | 100000 àwọn àgójọpọ̀ |
| _Táàbù | 2025 |
Àwọn Ìṣàmúlò-ètò Tí O darà fún Speaker 1
Àwọn ìṣàmúlò-ètò tí a fi pamọ́ fún àwọn àbùdá ìrànwọ́ àwòrán yìí
Àwọn àkọlé àwọn àkọlé
Lo Speaker 1 láti sọ àwọn ìròyìn ìṣàfarawé àwọn ìṣàmúlò-ètò ìpẹ̀lú àwọn ìṣàfihàn àti àwọn ìṣàfihàn àwọn ìṣàfihàn.
Àwọn Àmì-ìwé Àwòrán
Fi àwọn àkọlé àwọn àkọlé àwọn àwòrán YouTube, àwọn àwọn ààyè-iṣẹ́, àti àwọn àwọn ààyè-iṣẹ́ media ìmọ̀yàn.
Àwọn Ìṣàmúlò-ètò & Ìrànwọ́
Ìṣàfilọ́lẹ̀ ìṣàfarawé kọ̀ǹpútà yìí jẹ́ ìṣàfilọ́lẹ̀ ìṣàmúlò-ètò ìgbárapọ̀, àwọn ìṣàfilọ́lẹ̀ ojú-ìwé, àti àwọn ìrànwọ́ àwọn ìrànwọ́.
Àwọn Pódíẹ̀tì & Àwọn Àkọ́kọ́
Àwọn ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀ ìṣàfilọ́lẹ̀
Díẹ̀ VibeVoice Àwọn Àmì-ìwé
Àwọn ìrànwọ́ mìíràn láti inú àwọn ìṣàmúlò-ètò TTS
Àwọn Àtòjọ-ẹ̀yàn
Àwọn ìṣàfarawé Speaker 1 Àwọn ààyè-iṣẹ́
Ṣàfihàn àwọn àyọkà àti ìgbọ̀n àwòrán láti inú Speaker 1. Free to use.