VibeVoice

Speaker 3

Standartinis Anglų Neutral VibeVoice

{Pavadinimas} yra {žydas} AI balsas, valdomas {modelis} teksto į garsą modeliu. Šis {pakopa} balsas kalba {kalba} ir suteikia {kokybės}-kokybės kalbos sintezę. Su {greitis} generavimo greitis ir kokybės reitingas {ratingas}/5, {vardas} yra gerai tinka {geriausias_for}. {modelis} variklis yra sukurtas {kurti} under the MIT license, todėl jį galima naudoti komerciniais tikslais. Pagrindinės galimybės: {priemonės}.

Reitingų dar nėra

VibeVoicePavyzdinė informacija

Pavyzdys VibeVoice
Programuotojas Microsoft
Kokybė
Greitis Greitas
Licencija MIT
Klonavimas Nėra
Pakopa Standartiniai (2 kreditai/1K užrašai)
Parametrai 1.5B
Architektūra LLM + DAC
Mokymo duomenys 100000 valandos
Metai 2025

Geriausi naudojimo atvejai Speaker 3

Rekomenduojamos programos pagal šio balso savybes

Garso knygos ir naracija

Naudoti {pavadinimas} ilgalaikiam turiniui su natūralia prozodija ir išraiška perteikti.

Vaizdo balso perjungimai

Pridėti profesionalų pasakojimą į "YouTube" vaizdo įrašus, skelbimus ir socialinės žiniasklaidos turinį.

Programos ir prieinamumas

Greita karta šis balsas idealiai tinka realiojo laiko programoms, ekrano skaitytuvams ir prieinamumo įrankiams.

Tinklalaidės ir transliavimas

Studijos kokybės produkcija tinka podcast, radijo, ir profesionalaus transliavimo.

Daugiau VibeVoice Balsai

Kiti balsai iš to paties TTS modelio

Speaker 1

Anglų Neutral

Speaker 1 (Chinese)

Kinų Neutral

Speaker 2

Anglų Neutral

Speaker 2 (Chinese)

Kinų Neutral

Speaker 4

Anglų Neutral

Dažnai užduodami klausimai

VibeVoice by Microsoft yra dviejų variantų: 1.5B modelis ilgaformis turinys (iki 90 minučių, 4 garsiakalbiai) ir Realtime 0.5B modelis srautui su ~200ms pirmasis garso latency. 1.5B variantas pranoksta podcasts ir garso knygų su garsiakalbio konsistencija per ilgas ištraukas. Pastaba: Microsoft pašalintas TTS kodas iš saugyklos ir generuojami garso apima garsinės AI disclaiders.

VibeVoice buvo sukurta "Microsoft" ir yra išleistas pagal MIT (tik mokslinių tyrimų tikslas) licenciją, kuri leidžia komerciniais tikslais naudoti sukurtą garsą.

VibeVoice palaiko 1 kalbą: anglų.

VibeVoice yra Premium pakopos — 4 kreditai 1000 simbolių. Jūs galite peržiūrėti bet VibeVoice balso nemokamai prieš generuojant visą garsą.

VibeVoice turi vidutinį kartos greitį. Paprastai generavimas trunka kelias sekundes, priklausomai nuo teksto ilgio.

VibeVoice yra įvertinta 5/5 dėl garso kokybės TTS.ai metu. Jis suteikia studijinę, žmogišką kalbą.

Ne, VibeVoice naudoja fiksuotą rinkinį įmontuotų balsų. Dėl balso klonavimo, išbandyti modelius kaip CosyVoice 2, GPT-SoVITS, arba Chatterbox.

Taip, VibeVoice yra specialiai rekomenduojama podcast, garso knygų, ilgaformis daugiakalbio garsiakalbio turinio. Jo daugiakalbis garsiakalbis, iki 90 min, Podcast generavimo galimybės padaryti tai puikus pasirinkimas šiam naudojimo atvejui.

Taip, VibeVoice yra licencijuotas pagal MIT (tik mokslinių tyrimų tikslas), kuris leidžia komerciniais tikslais. Audio generuojamas su VibeVoice balsus gali būti naudojamas vaizdo įrašuose, podcast, programėlės, žaidimai, ir bet kuris kitas komercinis projektas.

Taip, visi balsai TTS.ai naudoti komerciniais leidimais atvirojo kodo modelius (MIT, Apache 2.0). Sukurtas garso yra jūsų naudoti vaizdo įrašus, podcast, programėlės, žaidimai, ir bet kuri kita komercinė programa.

Siųsti užklausą į /api/v1/tts/ su modelio pavadinimu ir balso ID. Peržiūrėkite mūsų API dokumentacijos puslapį kodų pavyzdžiams Python, JavaScript, Go ir cURL.

Taip, paspauskite paleidimo mygtuką šiame puslapyje išgirsti pavyzdį. Taip pat galite įrašyti pasirinktinį tekstą tekste į kalbą puslapyje ir generuoti nemokamą peržiūrą su bet kuriuo balsu.

Bandyti Speaker 3 Dabar

Įveskite bet kokį tekstą ir išgirskite jį kalba Speaker 3. Laisvas naudoti.