Estúdio de Design de Voz

Crie vozes de IA personalizadas ajustando os deslizantes. Sem necessidade de gravação — desenhe sua voz perfeita desde o zero.

Características da Voz

ProfundidadeAlta
DevagarRápido
Frio / ProfissionalQuente / Amigável
LimparRespirante
JovensIdosos
A young adult female voice with medium pitch and normal speed. Balanced warmth, clear delivery.

Texto para Falar

0/2000
2 caracteres Inscrever-se para acompanhar o uso

Antevisão

Ajuste os deslizantes e clique em Gerar para ouvir a sua voz projetada

A gerar voz...

Predefinições de Voz Salvadas

Ainda não foram guardados presets. Conceba uma voz e guardá-la para uso posterior.

Planos de Design de Voz

Comece livre, atualização quando você precisa mais

Mais Popular
Conta Livre
  • 15.000 caracteres livres na inscrição
  • Sexo, pitch, controles de velocidade
  • Deslizantes de calor e respiração
  • Emoção/predefinições de estilo
  • 2.000 caracteres por geração
Inscreva-se gratuitamente
Pro
  • Salvar designs de voz personalizados
  • Controlo da idade ajustada
  • Produção de lotes
  • Acesso à API
  • Usar designs em todas as ferramentas
Actualização

Perguntas Frequentes

O Voice Design Studio permite que você crie vozes personalizadas de IA descrevendo características como laço, velocidade, calor, respiração e idade — sem necessidade de gravação. A IA gera uma voz que corresponda com sua descrição usando o modo de design de voz Qwen3-TTS.

Você ajuste os deslizantes (pitch, velocidade, calor, respiração, idade) ou digite uma descrição de texto livre como "chame, amigável, jovem voz feminina com um ligeiro acento britânico." A IA interpreta sua descrição e gera fala em uma voz sintética correspondente.

O design de voz usa Qwen3-TTS no modo VoiceDesign. Este modelo pode gerar vozes a partir de descrições de texto sem qualquer áudio de referência. Ele suporta uma ampla gama de características de voz e produz fala de som natural.

Sim. Uma vez que você projeta uma voz que você gosta, clique em "Salve como Predefinição" para armazenar a descrição. Você pode então usar esta predefinição em toda a geração TTS, chat vocal e agentes — sua voz personalizada está disponível em todo o lado.

A clonagem de voz recria a voz de uma pessoa real específica a partir de uma gravação. O design de voz cria uma voz sintética inteiramente nova a partir de uma descrição. O design é mais rápido (não precisa de áudio) e cria vozes únicas que não copiem ninguém.

Pitch (profundamente para alto), velocidade (lento para rápido), calor (frigorífico/profissional para quente/friendly), respiração (clar para respirar), idade (jovens para idosos), accento (americano, britânico, australiano, etc.) e sexo. Você também pode adicionar descrições personalizadas para traços específicos.

Contas gratuitas podem salvar até 5 pré-configurações de voz. Planos de início incluem 20 pré-configurações, e Planos Pro incluem pré-configurações de voz ilimitadas. Cada pré-configuração armazena a descrição completa para que você possa regenerar a mesma voz exata.

Sim. As vozes criadas através do estúdio de design são sintéticas e não copiem ninguém, por isso não há problemas de direitos. Qwen3-TTS é licenciado sob Apache 2.0, fazendo uso comercial totalmente permitido.

Atualmente o design de voz funciona melhor para inglês, chinês, japonês e coreano — as línguas Qwen3-TTS foi treinado. Mais idiomas serão adicionados à medida que modelos de design de voz multilingue ficarem disponíveis.

Sim. O estúdio fornece visualização instantânea ao ajustar os deslizantes. Uma frase de amostra curta é gerada (1-2 segundos) para que você possa iterar rapidamente. Uma vez satisfeito, gerar texto mais longo com a voz projetada.

Cada geração de design de voz usa preços de nível padrão (2x caracteres). As visualizações ao vivo usam uma frase fixa curta para minimizar o custo. Contas gratuitas começam com 15.000 caracteres.

Cada slider mapas para uma descrição da linguagem natural. Por exemplo, o slider de lançamento em 80% mapas para "voz alta". O slider de calor em 90% adiciona "tonho quente e amigável." Essas descrições são combinadas em um único prompt de perfil de voz que Qwen3-TTS usa para gerar a voz.
5.0/5 (1)

O que podemos melhorar? Seu feedback nos ajuda a resolver problemas.

Pronto para começar?

Inscreva-se gratuitamente e receba 15.000 caracteres. Não é necessário cartão de crédito.