VoxCPM

Default Chinese

Standartinis Kinų Neutral VoxCPM

Default Chinese is a neutral AI voice powered by the VoxCPM text-to-speech model. This standartinė pakopa voice speaks Kinų and delivers studija-quality speech synthesis. Su beveik nepastovus kartos greitis ir kokybės įvertinimas 5/5, Default Chinese yra gerai tinka high-fidelity audio, audiobooks, long-form content with voice consistency. VoxCPM variklis yra sukurtas OpenBMB under the Apache 2.0 license, todėl saugus komerciniam naudojimui. Pagrindiniai gebėjimai: 44.1khz audio, tokenizer-free, cross-lingual cloning, context-aware, lora fine-tuning. VoxCPM modelis taip pat palaiko balso klonavimą – įkelkite trumpą garso mėginį, kad būtų sukurtas individualus balsas, kuris išlaikytų tas pačias kokybės savybes.

Reitingų dar nėra

VoxCPMPavyzdinė informacija

Pavyzdys VoxCPM
Programuotojas OpenBMB
Kokybė
Greitis Greitas
Licencija Apache 2.0
Klonavimas Palaikoma
Pakopa Standartiniai (2 kreditai/1K užrašai)
Parametrai 500M
Architektūra Continuous Space + Flow Matching
Mokymo duomenys 1800000 valandos
Metai 2025

Geriausi naudojimo atvejai Default Chinese

Rekomenduojamos programos pagal šio balso savybes

Garso knygos ir naracija

Naudokite Default Chinese naratizuoti ilgai formos turinį su natūralia prozodija ir ekspresija.

Vaizdo balso perjungimai

Pridėti profesionalų pasakojimą į "YouTube" vaizdo įrašus, skelbimus ir socialinės žiniasklaidos turinį.

Programos ir prieinamumas

Greita karta šis balsas idealiai tinka realiojo laiko programoms, ekrano skaitytuvams ir prieinamumo įrankiams.

Tinklalaidės ir transliavimas

Studijos kokybės produkcija tinka podcast, radijo, ir profesionalaus transliavimo.

Daugiau VoxCPM Balsai

Kiti balsai iš to paties TTS modelio

Default

Anglų Neutral

Dažnai užduodami klausimai

OpenBMB VoxCPM 1.5 yra naujas be tokenizatoriaus TTS modelis, kuris veikia ištisinėje erdvėje, o ne diskrečiuosiuose žetonuose. Jis gamina aukštos kokybės 44.1kHz garsą, palaiko nulinės fotografijos balso klonavimą nuo 3-10 sekundžių ir palaiko nuoseklumą visuose punktuose. Kryžminės kalbos klonavimas leidžia taikyti anglų kalbą kinų kalbai ir atvirkščiai.

VoxCPM sukūrė OpenBMB ir yra išleistas pagal Apache 2.0 licenciją, kuri leidžia komerciniais tikslais generuojamo garso.

VoxCPM palaiko 2 kalbas: anglų, kinų.

VoxCPM yra standartinė pakopa — 2 kreditai 1 000 simbolių. Prieš generuodami pilną garsą galite peržiūrėti bet kokį VoxCPM balsą nemokamai.

VoxCPM turi labai greitą kartos greitį. Jis veikia beveik realiu laiku, todėl tinka srautams ir interaktyvioms programoms.

VoxCPM yra įvertinta 5/5 dėl garso kokybės TTS.ai metu. Ji siūlo studijinę, žmogišką kalbą.

Taip, VoxCPM palaiko nulinį balso klonavimą. Įkelkite 5-30 sekundžių orientacinį garsą, kad sukurtumėte pasirinktinį balsą.

Taip, VoxCPM yra specialiai rekomenduojama aukštos patikimumo garso, garso knygų, ilgaformis turinys su balso konsistencijos. Jo 44,1khz garso, be tokenaizerio, kryžminio klonavimo galimybės padaryti tai puikus pasirinkimas šiam naudojimo atvejui.

Taip, VoxCPM yra licencijuotas pagal Apache 2.0, kuris leidžia naudoti komerciniais tikslais. Garso generuojami su VoxCPM balsais gali būti naudojami vaizdo įrašuose, podcast, programėlės, žaidimai, ir bet kuris kitas komercinis projektas.

Taip, visi balsai TTS.ai naudoti komerciniais leidimais atvirojo kodo modelius (MIT, Apache 2.0). Sukurtas garso yra jūsų naudoti vaizdo įrašus, podcast, programėlės, žaidimai, ir bet kuri kita komercinė programa.

Siųsti užklausą į /api/v1/tts/ su modelio pavadinimu ir balso ID. Peržiūrėkite mūsų API dokumentacijos puslapį kodų pavyzdžiams Python, JavaScript, Go ir cURL.

Taip, paspauskite paleidimo mygtuką šiame puslapyje išgirsti pavyzdį. Taip pat galite įrašyti pasirinktinį tekstą tekste į kalbą puslapyje ir generuoti nemokamą peržiūrą su bet kuriuo balsu.

Bandyti Default Chinese Dabar

Įveskite bet kokį tekstą ir išgirskite jį kalba Default Chinese. Laisvas naudoti.