VibeVoice

Speaker 2 (Chinese)

Standard Kineze Neutral VibeVoice

Speaker 2 (Chinese) është një zë i AI i neutral i mbështetur nga modeli VibeVoice tekst-në-folje. Ky zë standard-level flet Kineze dhe jep sintezë të foljes me cilësi studio. Me shpejtësinë e gjenerimit pothuajse-i menjëhershëm dhe një vlerësim cilësie 5/5, Speaker 2 (Chinese) është i përshtatshëm për podcasts, dialogues, long-form narration, multi-speaker content. Motorri VibeVoice është zhvilluar nga Microsoft under the MIT license, duke e bërë të sigurt për përdorim komercial. Key capabilities include: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

Ende nuk ka vlerësime

VibeVoiceInformacione mbi modelin

Modeli VibeVoice
Programues Microsoft
Cilësia
Shpejtësia Me shpejtësi
Liçenca MIT
Duke klonuar Jo në dispozicion
Animal Standard (2 kreditë/1K karakterë)
Parametrat 1.5B
Arkitektura LLM + DAC
Të dhëna trainimi 100000 orë
Vit 2025

Përdorimi më i mirë Speaker 2 (Chinese)

Programe të rekomanduara bazuar në karakteristikat e këtij zëri

Audiobooks & Narrative

Përdor {emri} për të treguar përmbajtjen e formës së gjatë me prozodi dhe shprehje natyrore.

Video Voiceover

Shto tregim profesional në videot e YouTube, reklamat dhe përmbajtjen e mediave sociale.

Aplikativë dhe açesibilitet

Gjenerata e shpejtë e bën këtë zë ideal për aplikimet në kohë reale, lexuesit e ekranit dhe instrumentet e açesibilitetit.

Podcasts & Transmetime

Rezultati me cilësi studioje i përshtatshëm për podcast, radio dhe transmetim profesional.

Më shumë VibeVoice Zërat

Zëra të tjerë nga i njëjti model TTS

Speaker 1

Anglisht Neutral

Speaker 1 (Chinese)

Kineze Neutral

Speaker 2

Anglisht Neutral

Speaker 3

Anglisht Neutral

Speaker 4

Anglisht Neutral

Pyetje të shpeshta

VibeVoice nga Microsoft vjen në dy variante: një model 1.5B për përmbajtje të gjatë (deri në 90 minuta, 4 folës) dhe një model Realtime 0.5B për transmetim me ~200ms kohëzgjatje të parë të audios. Varianti 1.5B është i mirë në podcast dhe audio libra me një vazhdimësi të folësit gjatë pasazheve të gjata. Shënim: Microsoft ka hequr kodin TTS nga depozita dhe audiot e gjeneruara përfshijnë përjashtime të dëgjueshme të AI.

VibeVoice është zhvilluar nga Microsoft dhe është lëshuar nën licencën MIT (vetëm për kërkim), e cila lejon përdorimin komercial të audios së gjeneruar.

VibeVoice mbështet 1 gjuhë: anglisht.

VibeVoice është në nivelin Premium — 4 kreditë për 1,000 karakterë. Mund të parashikoni çdo zë VibeVoice pa pagesë para se të gjeneroni audion e plotë.

VibeVoice ka një shpejtësi të moderuar të krijimit. Krijimi zakonisht merr disa sekonda në varësi të gjatësisë së tekstit.

VibeVoice është vlerësuar 5/5 për cilësinë e zërit në TTS.ai.

Jo, VibeVoice përdor një set të fiksuar zërash të ndërtuar. Për klonimin e zërave, provo modele si CosyVoice 2, GPT-SoVITS, ose Chatterbox.

Po, VibeVoice është veçanërisht i rekomanduar për podcast, audiobooks, përmbajtje të gjatë me shumë folës. Mundësitë e saj me shumë folës, deri në 90 min, e bëjnë atë një zgjedhje të shkëlqyer për këtë rast përdorimi.

Po, VibeVoice është licencuar nën MIT (vetëm për kërkim), që lejon përdorim komercial. Zëri i gjeneruar me zërat e VibeVoice mund të përdoret në video, podcast, aplikativë, lojëra dhe çdo projekt tjetër komercial.

Po, të gjitha zërat në TTS.ai përdorin modele të licencuara komercialisht të burimit të hapur (MIT, Apache 2.0). Zëri i gjeneruar është i juaji për t'u përdorur në video, podcast, apps, lojëra dhe çdo aplikim tjetër komercial.

Dërgo një kërkesë POST tek /api/v1/tts/ me emrin e modelit dhe ID-në e zërit. Shiko faqen tonë të Dokumentimit të API-së për shembuj të kodit në Python, JavaScript, Go dhe cURL.

Po, kliko butonin e riprodhimit në këtë faqe për të dëgjuar një shembull. Mund të shkruash gjithashtu tekst të personalizuar në faqen e Tekstit në Fjalë dhe të gjenerosh një parashikim të lirë me çdo zë.

Provo. Speaker 2 (Chinese) Tani

Shkruaj çdo tekst dhe dëgjo atë të folur nga Speaker 2 (Chinese). E lirë për tu përdorur.