VoxCPM

Default

Standartinis Anglų Neutral VoxCPM

Default is a neutral AI voice powered by the VoxCPM text-to-speech model. This standartinė pakopa voice speaks Anglų and delivers studija-quality speech synthesis. With beveik nepastovus generation speed and a quality rating of 5/5, Default is well-suited for high-fidelity audio, audiobooks, long-form content with voice consistency. The VoxCPM engine is developed by OpenBMB under the Apache 2.0 license, making it safe for commercial use. Key capabilities include: 44.1khz audio, tokenizer-free, cross-lingual cloning, context-aware, lora fine-tuning. The VoxCPM model also supports voice cloning — upload a short audio sample to create a custom voice that retains the same quality characteristics.

Reitingų dar nėra

VoxCPMPavyzdinė informacija

Pavyzdys VoxCPM
Programuotojas OpenBMB
Kokybė
Greitis Greitas
Licencija Apache 2.0
Klonavimas Palaikoma
Pakopa Standartiniai (2 kreditai/1K užrašai)
Parametrai 500M
Architektūra Continuous Space + Flow Matching
Mokymo duomenys 1800000 valandos
Metai 2025

Geriausi naudojimo atvejai Default

Rekomenduojamos programos pagal šio balso savybes

Garso knygos ir naracija

Use Default to narrate long-form content with natural prosody and expression.

Vaizdo balso perjungimai

Pridėti profesionalų pasakojimą į "YouTube" vaizdo įrašus, skelbimus ir socialinės žiniasklaidos turinį.

Programos ir prieinamumas

Greita karta šis balsas idealiai tinka realiojo laiko programoms, ekrano skaitytuvams ir prieinamumo įrankiams.

Tinklalaidės ir transliavimas

Studijos kokybės produkcija tinka podcast, radijo, ir profesionalaus transliavimo.

Daugiau VoxCPM Balsai

Kiti balsai iš to paties TTS modelio

Default Chinese

Kinų Neutral

Dažnai užduodami klausimai

OpenBMB VoxCPM 1.5 yra naujas be tokenizatoriaus TTS modelis, kuris veikia ištisinėje erdvėje, o ne diskrečiuosiuose žetonuose. Jis gamina aukštos kokybės 44.1kHz garsą, palaiko nulinės fotografijos balso klonavimą nuo 3-10 sekundžių ir palaiko nuoseklumą visuose punktuose. Kryžminės kalbos klonavimas leidžia taikyti anglų kalbą kinų kalbai ir atvirkščiai.

VoxCPM sukūrė OpenBMB ir yra išleistas pagal Apache 2.0 licenciją, kuri leidžia komerciniais tikslais generuojamo garso.

VoxCPM palaiko 2 kalbas: anglų, kinų.

VoxCPM yra standartinė pakopa — 2 kreditai 1 000 simbolių. Prieš generuodami pilną garsą galite peržiūrėti bet kokį VoxCPM balsą nemokamai.

VoxCPM turi labai greitą kartos greitį. Jis veikia beveik realiu laiku, todėl tinka srautams ir interaktyvioms programoms.

VoxCPM yra įvertinta 5/5 dėl garso kokybės TTS.ai metu. Ji siūlo studijinę, žmogišką kalbą.

Taip, VoxCPM palaiko nulinį balso klonavimą. Įkelkite 5-30 sekundžių orientacinį garsą, kad sukurtumėte pasirinktinį balsą.

Taip, VoxCPM yra specialiai rekomenduojama aukštos patikimumo garso, garso knygų, ilgaformis turinys su balso konsistencijos. Jo 44,1khz garso, be tokenaizerio, kryžminio klonavimo galimybės padaryti tai puikus pasirinkimas šiam naudojimo atvejui.

Taip, VoxCPM yra licencijuotas pagal Apache 2.0, kuris leidžia naudoti komerciniais tikslais. Garso generuojami su VoxCPM balsais gali būti naudojami vaizdo įrašuose, podcast, programėlės, žaidimai, ir bet kuris kitas komercinis projektas.

Taip, visi balsai TTS.ai naudoti komerciniais leidimais atvirojo kodo modelius (MIT, Apache 2.0). Sukurtas garso yra jūsų naudoti vaizdo įrašus, podcast, programėlės, žaidimai, ir bet kuri kita komercinė programa.

Siųsti užklausą į /api/v1/tts/ su modelio pavadinimu ir balso ID. Peržiūrėkite mūsų API dokumentacijos puslapį kodų pavyzdžiams Python, JavaScript, Go ir cURL.

Taip, paspauskite paleidimo mygtuką šiame puslapyje išgirsti pavyzdį. Taip pat galite įrašyti pasirinktinį tekstą tekste į kalbą puslapyje ir generuoti nemokamą peržiūrą su bet kuriuo balsu.

Bandyti Default Dabar

Įveskite bet kokį tekstą ir išgirskite jį kalba Default. Laisvas naudoti.