VoxCPM

Default

Pangkalahatang Ingles Neutral VoxCPM

Ang "Ikaw" ay isang awiting Filipino na inawit ni Ai Ai delas Alas at inilabas sa kanyang album na Ikaw. Sa isang karaniwang sistemang panukat ng presyon ng dugo, ang presyon ng dugo ay ang presyon ng dugo sa isang yunit ng oras. Ang mga ito ay maaaring maging mga motor na pang-industriya, o mga motor na pang-komersyo. Ang mga pangunahing kakayahan ay kinabibilangan ng: 44.1khz audio, tokenizer-free, cross-lingual cloning, context-aware, lora fine-tuning. Ang modelong VoxCPM ay sumusuporta rin sa cloning ng boses — mag-upload ng isang maikling sample ng audio upang lumikha ng isang pasadyang boses na nananatili sa parehong mga katangian ng kalidad.

Walang mga rating pa

VoxCPMImpormasyon ng Modelo

Modelo VoxCPM
Developer OpenBMB
Kalidad
Bilis Mabilis
Lisensya Apache 2.0
Clone Suportado
Mga hayop > Standard (2x character)
Parameter 500M
Arkitektura Continuous Space + Flow Matching
Data ng pagsasanay 1800000 oras
Taon 2025

> Pinakamahusay na gamitin ang mga kaso para sa Default

> Inirerekomendang mga application batay sa mga katangian ng boses na ito

> Audiobooks & Paglalarawan

Ang mga ito ay maaaring magpakita ng mga katangian ng natural na seleksiyon at natural na seleksiyon.

Mga Video Voiceover

Magdagdag ng propesyonal na pagsasalaysay sa mga video, ad, at nilalaman sa social media ng YouTube.

> Apps at Aksesibilidad

Ang mabilis na paglikha ay ginagawang perpekto ang boses na ito para sa mga real-time na apps, mga screen reader, at mga tool sa accessibility.

Podcasts & Paghahatid

Ang mga ito ay kinabibilangan ng mga podcast, mga programa sa radyo, at mga video.

Higit pa VoxCPM Mga Tinig

> Iba pang mga boses mula sa parehong modelo TTS

Default Chinese

Intsik Neutral

Mga Madalas Itanong

Ang VoxCPM 1.5 ay isang bagong tokenizer-free TTS model na gumagana sa patuloy na espasyo sa halip na mga hiwalay na token. Ito ay gumagawa ng mataas na katapatan 44.1kHz audio, sumusuporta sa zero-shot na cloning ng boses mula sa 3-10 segundo, at pinapanatili ang pagkakapareho sa mga talata.

Ang VoxCPM ay binuo ng OpenBMB at inilabas sa ilalim ng Apache 2.0 license, na nagpapahintulot sa komersyal na paggamit ng audio na ginawa.

> VoxCPM sumusuporta sa2wika: Ingles, Intsik.

> VoxCPM ay sa Standard tier —2credits bawat 1,000 mga character. Maaari mong i-preview ang anumang VoxCPM boses para sa libreng bago bumuo ng buong audio.

VoxCPM ay may napakabilis na henerasyon bilis. Ito ay tumatakbo sa malapit na real-time, na ginagawang angkop para sa streaming at interactive na mga application.

> VoxCPM ay may markang 5/5 para sa kalidad ng audio sa TTS.ai. Ito ay nagbibigay ng studio-grade, tao-tulad ng pagsasalita.

> Oo, VoxCPM sumusuporta sa zero-shot cloning boses. I-upload ang 5-30 segundo ng reference audio upang lumikha ng isang pasadyang boses.

Oo, VoxCPM ay partikular na inirerekomenda para sa mataas na katapatan audio, audiobooks, mahabang-form na nilalaman na may pagkakapareho ng boses. Ang 44.1khz audio, tokenizer-free, cross-lingguwistika cloning kakayahan gawin itong isang mahusay na pagpipilian para sa paggamit na ito kaso.

Oo, ang VoxCPM ay lisensyado sa ilalim ng Apache 2.0, na nagpapahintulot sa komersyal na paggamit. Ang audio na nabuo sa pamamagitan ng mga boses ng VoxCPM ay maaaring magamit sa mga video, podcast, apps, laro, at anumang iba pang komersyal na proyekto.

Oo, lahat ng boses sa TTS.ai ay gumagamit ng mga modelong open-source na may lisensya ng komersyal (MIT, Apache 2.0). Ang audio na nabuo ay iyong gamitin sa mga video, podcast, apps, laro, at anumang iba pang mga komersyal na application.

Ipadala ang isang POST na kahilingan sa /api/v1/tts/ na may pangalan ng modelo at boses ID. Tingnan ang aming API Documentation page para sa mga halimbawa ng code sa Python, JavaScript, Go, at cURL.

> Oo, i-click ang play button sa pahinang ito upang marinig ang isang sample. Maaari mo ring i-type ang custom na teksto sa Text to Speech page at makabuo ng isang libreng preview sa anumang boses.

Subukan Default Ngayon

> I-type ang anumang teksto at marinig ito sinabi sa pamamagitan ng Default. Libreng gamitin.