VibeVoice

Speaker 2 (Chinese)

Defaŭlta Ĉina Neutral VibeVoice

Speaker 2 (Chinese) estas neutral AI- voĉo funkciigita de la VibeVoice teksto- al- parola modelo. Tiu standard-tier voĉo parolas Ĉina kaj liveras studio - kvalitan parolsintezon. Kun preskaŭ- tuja generada rapideco kaj kvalita rangigo de 5/5, Speaker 2 (Chinese) estas bone taŭga por podcasts, dialogues, long-form narration, multi-speaker content. La motoro VibeVoice estas evoluigita de Microsoft under the MIT license, kio faras ĝin sekura por komerca uzo. La ĉefaj funkcioj estas: Ŝanĝi la fonton.

Neniu takso

VibeVoiceModeloinformoj

& Modelo: VibeVoice
Programisto Microsoft
Kvalito
Rapideco Fiksa
Licenco MIT
Klonado Ne havebla
Tamuz Normala (2 kreditoj/ 1K signoj)
Parametroj 1.5B
Arkitekturo LLM + DAC
Trejnaddatumoj 100000 % 1 horoj
Jaro 2025

Plej bonaj uzkazoj por Speaker 2 (Chinese)

Rekomendataj aplikaĵoj bazitaj sur tiu voĉo

Sonlibroj kaj rakontadoName

Uzu Speaker 2 (Chinese) por rakonti longan formon de enhavo kun natura prozodio kaj esprimo.

Video- voĉo

Aldonu profesian rakonton al YouTube-videoj, reklamoj kaj sociaj amaskomunikilaj enhavoj.

Aplikaĵoj kaj alirebleco

La rapida generado faras tiun voĉon ideala por realtempaj aplikaĵoj, ekranlegiloj, kaj alireblecaj iloj.

Podkastoj kaj elsendoj

La radiostacio estas dediĉita al la disvastigo de radio, televido kaj radiofonio.

Pli VibeVoice Voĉoj

Aliaj voĉoj de la sama TTS- modelo

Speaker 1

Angla Neutral

Speaker 1 (Chinese)

Ĉina Neutral

Speaker 2

Angla Neutral

Speaker 3

Angla Neutral

Speaker 4

Angla Neutral

Oftaj demandoj

VibeVoice de Microsoft estas havebla en du variantoj: 1. 5B- modelo por longa enhavo (ĝis 90 minutoj, 4 parolantoj) kaj Realtime 0. 5B- modelo por fluado kun ~200 ms unua aŭda prokrasto. La 1. 5B- varianto elstaras ĉe podkastoj kaj aŭdlibroj kun parolantoj konsekvencaj dum longaj paŝoj. Noto: Microsoft forigis TTS- kodon el la deponejo kaj generita sono inkluzivas aŭdeblajn AI- ekskludojn.

VibeVoice estis evoluigita de Microsoft kaj estas liberigita sub la MIT-licenco (nur por esploro), kiu permesas komercan uzon de generita aŭdo.

VibeVoice subtenas 1 lingvon: la anglan.

VibeVoice estas en la Premium-nivelo — 4 kreditoj por 1000 signoj. Vi povas antaŭrigardi iun ajn VibeVoice-voĉon senpage antaŭ ol generi plenan sonon.

VibeVoice havas moderan generan rapidon. La generado kutime daŭras kelkajn sekundojn depende de la tekstolongo.

VibeVoice estas taksita 5/5 por aŭdkvalito sur TTS.ai. Ĝi liveras studio-nivelan, homan-similan paroladon.

Ne, VibeVoice uzas fiksitan aron de enkonstruitaj voĉoj. Por voĉ-klonado, provu modelojn kiel CosyVoice 2, GPT-SoVITS, aŭ Chatterbox.

@ info: shell

Jes, VibeVoice estas licencita sub MIT (nur por esploro), kio permesas komercan uzon. La sono generita per VibeVoice-voĉoj povas esti uzata en videoj, podkastoj, aplikaĵoj, ludoj kaj en iu ajn alia komerca projekto.

Jes, ĉiuj voĉoj sur TTS.ai uzas komerce licencitajn malfermkodajn modelojn (MIT, Apache 2. 0). La generita sono estas via por uzi en videoj, podkastoj, aplikaĵoj, ludoj, kaj iu ajn alia komerca aplikaĵo.

Sendu POST-peton al /api/v1/tts/ kun la modelonomo kaj voĉ-identigilo. Vidu nian API-dokumentan paĝon por kodoekzemploj en Pitono, Ĝavoskripto, Go, kaj cURL.

Jes, klaku la ludi butonon sur tiu paĝo por aŭdi ekzemplon. Vi povas ankaŭ tajpi propran tekston sur la Teksto- al- Parolo paĝo kaj generi liberan antaŭrigardon kun iu ajn voĉo.

Provu Speaker 2 (Chinese) Nun

Entajpu iun ajn tekston kaj aŭdu ĝin parolata de Speaker 2 (Chinese). Libere uzebla.