VoxCPM

Default

Estándar página 2 Neutral VoxCPM

{nombre} es una voz de IA {género} alimentada por el modelo {modelo} de texto a voz. Esta voz nivel estándar habla {lenguaje} y ofrece una síntesis de voz de calidad {calidad}. Con una velocidad de generación {velocidad} y una calificación de calidad de 5/5, {nombre} es adecuado para high-fidelity audio, audiobooks, long-form content with voice consistency. El motor {modelo} es desarrollado por {desarrollador}licencia}, por lo que es seguro para uso comercial. Las capacidades clave incluyen: {características}. El modelo {modelo} también es compatible con la clonación de voz — subir una muestra de audio corta para crear una voz personalizada que conserva las mismas características de calidad.

Todavía no hay calificaciones.

VoxCPMInformación del modelo

Modelo VoxCPM
Desarrollador OpenBMB
Calidad
Velocidad Rápido.
Licencia Apache 2.0
Clonación Apoyados
Nivel Estándar (2 caracteres x)
Parámetros 500M
Arquitectura Continuous Space + Flow Matching
Datos de capacitación 1800000 horas
Año 2025

Casos de mejor uso para Default

Aplicaciones recomendadas basadas en las características de esta voz

Audiolibros y narración

Utilice {nombre} para narrar contenido de forma larga con prosodia natural y expresión.

Video Voiceovers

Añada narración profesional a vídeos, anuncios y contenido de redes sociales de YouTube.

Aplicaciones y accesibilidad

La generación rápida hace que esta voz sea ideal para aplicaciones en tiempo real, lectores de pantalla y herramientas de accesibilidad.

Podcasts & Broadcasting

Salida de calidad de estudio adecuada para podcasts, radio y radiodifusión profesional.

Más VoxCPM Voces

Otras voces del mismo modelo TTS

Default Chinese

Chinos Neutral

Preguntas frecuentes

VoxCPM 1.5 de OpenBMB es un nuevo modelo TTS sin tokenizador que opera en espacio continuo en lugar de tokens discretos. Produce audio de alta fidelidad de 44.1 kHz, soporta la clonación de voz de imagen cero de 3 a 10 segundos y mantiene la coherencia entre párrafos. La clonación en lenguaje cruzado le permite aplicar una voz en inglés al habla china y viceversa.

VoxCPM fue desarrollado por OpenBMB y es lanzado bajo la licencia Apache 2.0, que permite el uso comercial de audio generado.

VoxCPM es compatible con 2 idiomas: inglés, chino.

VoxCPM está en el nivel estándar — 2 créditos por 1.000 caracteres. Puede previsualizar cualquier voz VoxCPM de forma gratuita antes de generar audio completo.

VoxCPM tiene una velocidad de generación muy rápida. Funciona casi en tiempo real, por lo que es adecuado para streaming y aplicaciones interactivas.

VoxCPM tiene una calificación de 5/5 para la calidad de audio en TTS.ai. Ofrece voz tipo estudio, humana.

Sí, VoxCPM es compatible con la clonación de voz de tiro cero. Subir 5-30 segundos de audio de referencia para crear una voz personalizada.

Sí, VoxCPM se recomienda específicamente para audio de alta fidelidad, audiolibros, contenido de forma larga con consistencia de voz. Sus capacidades de clonación de audio 44.1khz, libre de tokenizer, hacen que sea una excelente opción para este caso de uso.

Sí, VoxCPM está licenciado bajo Apache 2.0, que permite el uso comercial. El audio generado con VoxCPM voces se puede utilizar en videos, podcasts, aplicaciones, juegos y cualquier otro proyecto comercial.

Sí, todas las voces de TTS.ai utilizan modelos de código abierto con licencia comercial (MIT, Apache 2.0). El audio generado es tuyo para usar en videos, podcasts, aplicaciones, juegos y cualquier otra aplicación comercial.

Enviar una solicitud POST a /api/v1/tts/ con el nombre del modelo y el ID de voz. Vea nuestra página de documentación de API para ejemplos de código en Python, JavaScript, Go, y cURL.

Sí, haga clic en el botón de reproducción en esta página para escuchar una muestra. También puede escribir texto personalizado en la página Texto a Discurso y generar una vista previa gratuita con cualquier voz.

Intente Default Ahora

Escriba cualquier texto y escucharlo hablado por Default. Libre de usar.