VibeVoice

Speaker 1 (Chinese)

Standartinis Kinų Neutral VibeVoice

Speaker 1 (Chinese) is a neutral AI voice powered by the VibeVoice text-to-speech model. This standartinė pakopa voice speaks Kinų and delivers studija-quality speech synthesis. With beveik nepastovus generation speed and a quality rating of 5/5, Speaker 1 (Chinese) is well-suited for podcasts, dialogues, long-form narration, multi-speaker content. The VibeVoice engine is developed by Microsoft under the MIT license, making it safe for commercial use. Key capabilities include: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

Reitingų dar nėra

VibeVoicePavyzdinė informacija

Pavyzdys VibeVoice
Programuotojas Microsoft
Kokybė
Greitis Greitas
Licencija MIT
Klonavimas Nėra
Pakopa Standartiniai (2 kreditai/1K užrašai)
Parametrai 1.5B
Architektūra LLM + DAC
Mokymo duomenys 100000 valandos
Metai 2025

Geriausi naudojimo atvejai Speaker 1 (Chinese)

Rekomenduojamos programos pagal šio balso savybes

Garso knygos ir naracija

Use Speaker 1 (Chinese) to narrate long-form content with natural prosody and expression.

Vaizdo balso perjungimai

Pridėti profesionalų pasakojimą į "YouTube" vaizdo įrašus, skelbimus ir socialinės žiniasklaidos turinį.

Programos ir prieinamumas

Greita karta šis balsas idealiai tinka realiojo laiko programoms, ekrano skaitytuvams ir prieinamumo įrankiams.

Tinklalaidės ir transliavimas

Studijos kokybės produkcija tinka podcast, radijo, ir profesionalaus transliavimo.

Daugiau VibeVoice Balsai

Kiti balsai iš to paties TTS modelio

Speaker 1

Anglų Neutral

Speaker 2

Anglų Neutral

Speaker 2 (Chinese)

Kinų Neutral

Speaker 3

Anglų Neutral

Speaker 4

Anglų Neutral

Dažnai užduodami klausimai

VibeVoice by Microsoft yra dviejų variantų: 1.5B modelis ilgaformis turinys (iki 90 minučių, 4 garsiakalbiai) ir Realtime 0.5B modelis srautui su ~200ms pirmasis garso latency. 1.5B variantas pranoksta podcasts ir garso knygų su garsiakalbio konsistencija per ilgas ištraukas. Pastaba: Microsoft pašalintas TTS kodas iš saugyklos ir generuojami garso apima garsinės AI disclaiders.

VibeVoice buvo sukurta "Microsoft" ir yra išleistas pagal MIT (tik mokslinių tyrimų tikslas) licenciją, kuri leidžia komerciniais tikslais naudoti sukurtą garsą.

VibeVoice palaiko 1 kalbą: anglų.

VibeVoice yra Premium pakopos — 4 kreditai 1000 simbolių. Jūs galite peržiūrėti bet VibeVoice balso nemokamai prieš generuojant visą garsą.

VibeVoice turi vidutinį kartos greitį. Paprastai generavimas trunka kelias sekundes, priklausomai nuo teksto ilgio.

VibeVoice yra įvertinta 5/5 dėl garso kokybės TTS.ai metu. Jis suteikia studijinę, žmogišką kalbą.

Ne, VibeVoice naudoja fiksuotą rinkinį įmontuotų balsų. Dėl balso klonavimo, išbandyti modelius kaip CosyVoice 2, GPT-SoVITS, arba Chatterbox.

Taip, VibeVoice yra specialiai rekomenduojama podcast, garso knygų, ilgaformis daugiakalbio garsiakalbio turinio. Jo daugiakalbis garsiakalbis, iki 90 min, Podcast generavimo galimybės padaryti tai puikus pasirinkimas šiam naudojimo atvejui.

Taip, VibeVoice yra licencijuotas pagal MIT (tik mokslinių tyrimų tikslas), kuris leidžia komerciniais tikslais. Audio generuojamas su VibeVoice balsus gali būti naudojamas vaizdo įrašuose, podcast, programėlės, žaidimai, ir bet kuris kitas komercinis projektas.

Taip, visi balsai TTS.ai naudoti komerciniais leidimais atvirojo kodo modelius (MIT, Apache 2.0). Sukurtas garso yra jūsų naudoti vaizdo įrašus, podcast, programėlės, žaidimai, ir bet kuri kita komercinė programa.

Siųsti užklausą į /api/v1/tts/ su modelio pavadinimu ir balso ID. Peržiūrėkite mūsų API dokumentacijos puslapį kodų pavyzdžiams Python, JavaScript, Go ir cURL.

Taip, paspauskite paleidimo mygtuką šiame puslapyje išgirsti pavyzdį. Taip pat galite įrašyti pasirinktinį tekstą tekste į kalbą puslapyje ir generuoti nemokamą peržiūrą su bet kuriuo balsu.

Bandyti Speaker 1 (Chinese) Dabar

Įveskite bet kokį tekstą ir išgirskite jį kalba Speaker 1 (Chinese). Laisvas naudoti.