VibeVoice

Speaker 2

Szabvány English Neutral VibeVoice

Ez a hang beszél {nyelv} és minőségi beszédszintézist biztosít. A {sebesség} generációs sebesség és a 5/5 minőségi értékelése alapján a {név} podcasts, dialogues, long-form narration, multi-speaker content megfelelő. A {modell} motort fejleszti a {fejlesztő} under the MIT license, ami biztonságossá teszi a kereskedelmi használatra. A legfontosabb képességek közé tartozik: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

Még nincs értékelés.

VibeVoiceInformációminta

Minta VibeVoice
Fejlesztő Microsoft
Minőség
Sebesség Gyorsan!
Jogosítvány MIT
Klónozás Nem áll rendelkezésre
Tier Standard (2 kredit/1K karakter)
Paraméterek 1.5B
Építészet LLM + DAC
Képzési adatok 100000 óra
Év 2025

Legjobb felhasználási esetek Speaker 2

Ajánlott alkalmazások a hang jellemzői alapján

Hangkönyvek és narráció

A Speaker 2 segítségével a hosszú formájú tartalmat természetes proszódiával és kifejezéssel lehet elbeszélni.

Video Voiceovers

Professzionális narráció hozzáadása a YouTube videók, hirdetések és közösségi média tartalmaihoz.

Alkalmazások és akadálymentesítés

A gyors generáció ideálissá teszi ezt a hangot valós idejű alkalmazásokhoz, képernyőolvasókhoz és akadálymentesítő eszközökhöz.

Podcasts & Broadcast

Stúdió minőségű kimenet alkalmas podcastok, rádió, és professzionális sugárzás.

Még VibeVoice Hangok

Más hangok ugyanabból a TTS modellből

Speaker 1

English Neutral

Speaker 1 (Chinese)

Kínai Neutral

Speaker 2 (Chinese)

Kínai Neutral

Speaker 3

English Neutral

Speaker 4

English Neutral

Gyakran ismételt kérdések

A VibeVoice by Microsoft két változatban kapható: egy 1,5B-s modell hosszú (legfeljebb 90 perc, 4 hangszóró) tartalomhoz és egy Realtime 0.5B-s modell streaminghez ~200ms első audio latencyvel. Az 1,5B-s változat kiemelkedik a podcastokon és az audiobookokon a hangszóró konzisztenciájával a hosszú szakaszokon keresztül. Megjegyzés: A Microsoft eltávolította a TTS kódot a tárolóból és a generált audió tartalmazza a hallható AI disclaimereket.

A VibeVoice-t a Microsoft fejlesztette ki, és az MIT (csak kutatási célú) licenc alapján kerül kiadásra, amely lehetővé teszi a generált audió kereskedelmi használatát.

VibeVoice támogatja 1 nyelv: angol.

A VibeVoice a Premium Tier 4 kredit 1000 karakterenként. A VibeVoice hangot ingyen megtekintheti, mielőtt teljes audiót generál.

VibeVoice mérsékelt generációs sebesség. A generáció jellemzően néhány másodpercet vesz igénybe a szöveg hosszától függően.

VibeVoice 5/5 besorolású hangminőség TTS.ai. Ez biztosítja a stúdió minőségű, emberi-szerű beszéd.

Nem, a VibeVoice beépített hangokat használ hang klónozáshoz, kipróbálni olyan modelleket, mint a CosyVoice 2, GPT-Sovits vagy a Chatterbox.

Igen, a VibeVoice kifejezetten ajánlott podcastok, audiobookok, hosszú formájú több hangszórós tartalom. A több hangszóró, akár 90 perc, podcast generációs képességek, hogy ez egy kiváló választás erre az esetre.

Igen, a VibeVoice az MIT (kutatási szándék), amely lehetővé teszi a kereskedelmi használatot. VibeVoice hangok generálható videók, podcastok, alkalmazások, játékok, és bármely más kereskedelmi projekt.

Igen, minden hang TTS.ai használ kereskedelmi engedéllyel rendelkező nyílt forráskódú modelleket (MIT, Apache 2.0). A generált audió a tiéd, hogy használja videók, podcastok, alkalmazások, játékok, és bármely más kereskedelmi alkalmazás.

Küldjön POST kérelmet a /api/v1/tts/ modellnévvel és hangazonosítóval. Lásd az API Dokumentációs oldalunkat a Python, JavaScript, Go és cURL kód példáihoz.

Igen, kattintson a lejátszás gombra ezen az oldalon, hogy meghallgasson egy mintát. Akkor is begépelheti az egyéni szöveget a Szöveg a Beszéd oldalra, és létrehoz egy ingyenes előnézetet bármilyen hanggal.

Próbáld meg. Speaker 2 Most.

Írj be bármilyen szöveget, és hallgasd meg Speaker 2. Ingyenes használat.