VoxCPM

Default Chinese

Standard Kineze Neutral VoxCPM

Default Chinese është një zë i AI i neutral i mbështetur nga modeli VoxCPM tekst-në-folje. Ky zë standard-level flet Kineze dhe jep sintezë të foljes me cilësi studio. Me shpejtësinë e gjenerimit pothuajse-i menjëhershëm dhe një vlerësim cilësie 5/5, Default Chinese është i përshtatshëm për high-fidelity audio, audiobooks, long-form content with voice consistency. Motorri VoxCPM është zhvilluar nga OpenBMB under the Apache 2.0 license, duke e bërë të sigurt për përdorim komercial. Key capabilities include: 44.1khz audio, tokenizer-free, cross-lingual cloning, context-aware, lora fine-tuning. Modeli VoxCPM gjithashtu suporton klonimin e zërit — ngarko një shembull të shkurtër audio për të krijuar një zë të personalizuar që mban të njëjtat karakteristika cilësore.

Ende nuk ka vlerësime

VoxCPMInformacione mbi modelin

Modeli VoxCPM
Programues OpenBMB
Cilësia
Shpejtësia Me shpejtësi
Liçenca Apache 2.0
Duke klonuar Suportuar
Animal Standard (2 kreditë/1K karakterë)
Parametrat 500M
Arkitektura Continuous Space + Flow Matching
Të dhëna trainimi 1800000 orë
Vit 2025

Përdorimi më i mirë Default Chinese

Programe të rekomanduara bazuar në karakteristikat e këtij zëri

Audiobooks & Narrative

Përdor {emri} për të treguar përmbajtjen e formës së gjatë me prozodi dhe shprehje natyrore.

Video Voiceover

Shto tregim profesional në videot e YouTube, reklamat dhe përmbajtjen e mediave sociale.

Aplikativë dhe açesibilitet

Gjenerata e shpejtë e bën këtë zë ideal për aplikimet në kohë reale, lexuesit e ekranit dhe instrumentet e açesibilitetit.

Podcasts & Transmetime

Rezultati me cilësi studioje i përshtatshëm për podcast, radio dhe transmetim profesional.

Më shumë VoxCPM Zërat

Zëra të tjerë nga i njëjti model TTS

Default

Anglisht Neutral

Pyetje të shpeshta

VoxCPM 1.5 nga OpenBMB është një model i ri TTS pa tokenizer që operon në hapësirë të vazhdueshme në vend të tokenëve të veçantë. Prodhon audio me besueshmëri të lartë 44.1kHz, mbështet klonimin e zërit zero-shot nga 3-10 sekonda, dhe mban konsistencën nëpër paragrafë. Klonimi ndërgjuhësor të lejon të aplikosh një zë anglisht në fjalimin kinez dhe anasjelltas.

VoxCPM u zhvillua nga OpenBMB dhe është lëshuar nën licencën Apache 2.0, e cila lejon përdorimin komercial të audios së gjeneruar.

VoxCPM mbështet 2 gjuhë: anglisht, kinezisht.

VoxCPM është në nivelin Standard — 2 kreditë për 1,000 karakterë. Mund të parashikoni çdo zë VoxCPM pa pagesë para se të gjeneroni audion e plotë.

VoxCPM ka shpejtësi shumë të shpejtë të krijimit. Ekzekutohet në kohën e vërtetë, duke e bërë të përshtatshëm për aplikime të rrjedhjes dhe interaktive.

VoxCPM është vlerësuar 5/5 për cilësinë e zërit në TTS.ai.

Po, VoxCPM suporton klonimin e zërit zero-shot. Ngarko 5-30 sekonda audio për të krijuar një zë të personalizuar.

Po, VoxCPM është veçanërisht i rekomanduar për audio me besueshmëri të lartë, audiolibër, përmbajtje të gjatë me konsistencë zëri. Audio 44.1khz, pa tokenizer, aftësitë e klonimit ndërgjuhësor e bëjnë atë një zgjedhje të shkëlqyer për këtë rast përdorimi.

Po, VoxCPM është licencuar nën Apache 2.0, që lejon përdorimin komercial. Zëri i gjeneruar me zërat e VoxCPM mund të përdoret në video, podcast, aplikativë, lojëra dhe çdo projekt tjetër komercial.

Po, të gjitha zërat në TTS.ai përdorin modele të licencuara komercialisht të burimit të hapur (MIT, Apache 2.0). Zëri i gjeneruar është i juaji për t'u përdorur në video, podcast, apps, lojëra dhe çdo aplikim tjetër komercial.

Dërgo një kërkesë POST tek /api/v1/tts/ me emrin e modelit dhe ID-në e zërit. Shiko faqen tonë të Dokumentimit të API-së për shembuj të kodit në Python, JavaScript, Go dhe cURL.

Po, kliko butonin e riprodhimit në këtë faqe për të dëgjuar një shembull. Mund të shkruash gjithashtu tekst të personalizuar në faqen e Tekstit në Fjalë dhe të gjenerosh një parashikim të lirë me çdo zë.

Provo. Default Chinese Tani

Shkruaj çdo tekst dhe dëgjo atë të folur nga Default Chinese. E lirë për tu përdorur.