Report Bug / Feature Request
VITS

Common Voice (Portuguese)

Grátis Portuguesa Neutral VITS

{nome} é uma voz de IA alimentada pelo modelo {modelo} de texto a voz. Esta voz Free-tier fala {linguagem} e fornece a síntese de fala {qualidade}-qualidade. Com velocidade de geração {velocidade} e uma classificação de qualidade de 3/5, {nome} é bem adequado para {bet_for}. O motor {modelo} é desenvolvido por Jaehyeon Kim et al. under the MIT license, tornando-o seguro para uso comercial. As capacidades principais incluem: {características}.

Ainda não há avaliações

VITSInformações do modelo

Modelo VITS
Desenvolvedor Jaehyeon Kim et al.
Qualidade
Velocidade Rápido
Licença MIT
Clonagem Não disponível
Tier Livres (não utilizados)
Parâmetros 25M
Arquitetura VAE + Normalizing Flows + GAN
Dados de formação 585 horas
Ano 2021

Melhores casos de utilização para Common Voice (Portuguese)

Aplicações recomendadas com base nas características desta voz

Audiobooks & Narração

Use {nome} para narrar conteúdo de forma longa com prosodia natural e expressão.

Vídeo Voiceovers

Adicione narração profissional para vídeos, anúncios e conteúdos de mídia social do YouTube.

Aplicações & Acessibilidade

Geração rápida torna esta voz ideal para aplicativos em tempo real, leitores de tela e ferramentas de acessibilidade.

E-Learning & Treinamento

Crie material de treinamento envolvente, cursos e conteúdo educacional com narração clara de IA.

Mais VITS Vozes

Outras vozes do mesmo modelo TTS

CSS10 (Dutch)

Neerlandês Neutral

CSS10 (Finnish)

Finlandês Neutral

CSS10 (French)

Francês Neutral

CSS10 (German)

Alemão Neutral

CSS10 (Hungarian)

Húngaro Neutral

CSS10 (Spanish)

Espanhol Neutral

Perguntas Frequentes

O VITS (Inferência Variacional com Aprendizagem adversarial para Texto-a-Função) é um método paralelo do TTS-Fundação que gera áudio sonoro mais natural do que os modelos atuais de dois estágios. Adota inferência variacional aumentada com fluxos de normalização e um processo de treinamento adversario, alcançando uma melhora significativa da naturalidade.

O VITS foi desenvolvido por Jaehyeon Kim et al. e é lançado sob a licença MIT, que permite o uso comercial de áudio gerado.

VITS suporta 4 idiomas: inglês, chinês, japonês, coreano.

O VITS está no nível livre — livre — sem créditos necessários. Você pode visualizar qualquer voz do VITS gratuitamente antes de gerar áudio completo.

O VITS tem velocidade de geração muito rápida. Ele funciona em quase tempo real, tornando-o adequado para aplicativos de streaming e interativo.

O VITS é classificado 3/5 para qualidade de áudio em TTS.ai. Oferece boa qualidade de fala adequada para a maioria das aplicações.

Não, VITS usa um conjunto fixo de vozes incorporadas. Para clonagem de voz, tente modelos como CosyVoice 2, GPT-SoVITS, ou Chatterbox.

Sim, VITS é especificamente recomendado para uso geral de texto a voz com prosodia natural. Sua síntese final a final, prosodia natural, capacidade de inferência rápida tornam-se uma excelente escolha para este caso de uso.

Sim, o VITS está licenciado sob MIT, que permite uso comercial. O áudio gerado com vozes VITS pode ser usado em vídeos, podcasts, aplicativos, jogos e qualquer outro projeto comercial.

Sim, todas as vozes em TTS.ai usam modelos de código aberto licenciados comercialmente (MIT, Apache 2.0). O áudio gerado é seu para usar em vídeos, podcasts, aplicativos, jogos e qualquer outra aplicação comercial.

Envie um pedido POST para /api/v1/tts/ com o nome do modelo e ID de voz. Consulte nossa página de documentação API para exemplos de código em Python, JavaScript, Go e cURL.

Sim, clique no botão Play nesta página para ouvir uma amostra. Você também pode digitar texto personalizado na página Texto para Voz e gerar uma visualização gratuita com qualquer voz.

Tentar Common Voice (Portuguese) Agora

Digite qualquer texto e ouça-o falado por Common Voice (Portuguese). Livre de utilizar sem caracteres necessários.