Spark TTS

Chinese Default

Estándar Chinés Neutral Spark TTS

Chinese Default é unha voz de IA de neutral alimentada polo modelo de síntese de voz Spark TTS. Esta voz nivel estándar fala Chinés e ofrece unha síntese de voz de calidade alta. Coa velocidade de xeración moderado e unha cualificación de calidade de 4/ 5, Chinese Default é axeitado para {best_ for}. O motor Spark TTS está desenvolvido por SparkAudio under the CC BY-NC-SA 4.0 license, polo que é seguro para uso comercial. As súas características principais son: voice cloning, emotion control, style control, prompt-based, 5-second cloning. O modelo Spark TTS tamén admite a clonación de voz: envíe unha mostra de son curta para crear unha voz personalizada que conserve as mesmas características de calidade.

Aínda non hai cualificacións

Spark TTSInformación do modelo

Modelo Spark TTS
Desenvolvente SparkAudio
Calidade
Velocidade Medio
Licenza CC BY-NC-SA 4.0
Clonando Soportado
Tier Estándar (2 créditos/ 1K caracteres)
Parámetros 500M
Arquitectura BiCodec + LLM + Flow Matching
Ano 2025

Os mellores casos de uso para Chinese Default

Programas recomendados baseados nesta voz

Audiolibros e narración

Empregue Chinese Default para narrar contidos de forma longa con prosodi e expresión naturais.

Locucións de vídeo

Engada narración profesional a vídeos de YouTube, anuncios e contido de redes sociais.

Voz personalizada da marca

Clonar este estilo de voz co seu propio son para crear unha voz TTS única.

Aprendizaxe e adestramento electrónicosName

Cree materiais de adestramento, cursos e contidos educativos atractivos con narración clara de IA.

Máis Spark TTS Vozes

Outras voces do mesmo modelo TTS

Default

Inglés Neutral

Preguntas frecuentes

Spark TTS de SparkAudio é un modelo de texto a voz que combina a clonación de voz con emocións controlábeis e estilo de fala. Usando só 5 segundos de son de referencia, pode clonar unha voz e xerar fala con diferentes emocións, velocidades e estilos mantendo a identidade da voz clonada. Spark TTS emprega un sistema de control baseado en mensaxes.

Spark TTS foi desenvolvido por SparkAudio e está dispoñible baixo a licenza CC BY-NC-SA 4.0, que permite o uso comercial do son xerado.

Spark TTS soporta 2 idiomas: inglés, chinés.

Spark TTS está no nivel Estándar - 2 créditos por 1. 000 caracteres. Pode previsualizar calquera voz de Spark TTS de balde antes de xerar o son completo.

Spark TTS ten unha velocidade de xeración moderada. A xeración normalmente leva uns segundos dependendo da lonxitude do texto.

Spark TTS ten unha cualificación de 4/ 5 pola calidade do son no TTS.ai. Produce unha voz de alta calidade e de son natural.

Si, Spark TTS admite a clonación de voz sen disparos. Envíe 5- 30 segundos de son de referencia para crear unha voz personalizada.

Si, Spark TTS recoméndase especialmente para a creación de contidos con voces clonadas e control emocional. As súas capacidades de clonación de voz, control emocional e control de estilo fanno unha excelente escolla para este caso de uso.

Si, Spark TTS está licenciado baixo CC BY-NC-SA 4. 0, o que permite o uso comercial. O son xerado coas voces de Spark TTS pode usarse en vídeos, podcasts, aplicacións, xogos e calquera outro proxecto comercial.

Si, todas as voces do TTS.ai usan modelos de código aberto con licenza comercial (MIT, Apache 2. 0). O son xerado é seu para usar en vídeos, podcasts, aplicacións, xogos e calquera outra aplicación comercial.

Envie unha petición POST a / api/ v1/ tts / co nome do modelo e a identificación da voz. Consulte a páxina de documentación da API para obter exemplos de código en Python, JavaScript, Go e cURL.

Si, prema no botón de reprodución desta páxina para escoitar unha mostra. Tamén pode escribir texto personalizado na páxina Texto a voz e xerar unha vista previa libre con calquera voz.

Probar Chinese Default Agora

Escriba calquera texto e escoite a súa pronunciación Chinese Default. Libre de usar.