Informar de Bug / Pedido de Feature

Estúdio de Design de Voz

Crie vozes de IA personalizadas ajustando os deslizantes. Sem necessidade de gravação — desenhe sua voz perfeita desde o zero.

Inscreva-se gratuitamente

Características da Voz

Sexo

Mulheres Masculino Neutro

Pitch Médio

ProfundidadeAlta

Velocidade Normal

DevagarRápido

Quente Balanço

Frio / ProfissionalQuente / Amigável

Respiração Limpar

LimparRespirante

Idade Jovem Adulto

JovensIdosos

Acento

Descrição personalizada (facultativo)

Descrição da voz (auto- gerada)

Uma voz jovem adulta fêmea com altura média e velocidade normal. Calidez equilibrada, parto claro.

Texto para Falar

0/2000

2 caracteres — Inscrever-se para acompanhar o uso

Antevisão

Ajuste os deslizantes e clique em Gerar para ouvir a sua voz projetada

Predefinições de Voz Salvadas

Ainda não foram guardados presets. Conceba uma voz e guardá-la para uso posterior.

Planos de Design de Voz

Comece livre, atualização quando você precisa mais

Mais Popular

Conta Livre

15.000 caracteres livres na inscrição
Sexo, pitch, controles de velocidade
Deslizantes de calor e respiração
Emoção/predefinições de estilo
2.000 caracteres por geração

Inscreva-se gratuitamente

Pro

Salvar designs de voz personalizados
Controlo da idade ajustada
Produção de lotes
Acesso à API
Usar designs em todas as ferramentas

Actualização

Perguntas Frequentes

O Voice Design Studio permite que você crie vozes personalizadas de IA descrevendo características como laço, velocidade, calor, respiração e idade — sem necessidade de gravação. A IA gera uma voz que corresponda com sua descrição usando o modo de design de voz Qwen3-TTS.

Você ajuste os deslizantes (pitch, velocidade, calor, respiração, idade) ou digite uma descrição de texto livre como "chame, amigável, jovem voz feminina com um ligeiro acento britânico." A IA interpreta sua descrição e gera fala em uma voz sintética correspondente.

O design de voz usa Qwen3-TTS no modo VoiceDesign. Este modelo pode gerar vozes a partir de descrições de texto sem qualquer áudio de referência. Ele suporta uma ampla gama de características de voz e produz fala de som natural.

Sim. Uma vez que você projeta uma voz que você gosta, clique em "Salve como Predefinição" para armazenar a descrição. Você pode então usar esta predefinição em toda a geração TTS, chat vocal e agentes — sua voz personalizada está disponível em todo o lado.

A clonagem de voz recria a voz de uma pessoa real específica a partir de uma gravação. O design de voz cria uma voz sintética inteiramente nova a partir de uma descrição. O design é mais rápido (não precisa de áudio) e cria vozes únicas que não copiem ninguém.

Pitch (profundamente para alto), velocidade (lento para rápido), calor (frigorífico/profissional para quente/friendly), respiração (clar para respirar), idade (jovens para idosos), accento (americano, britânico, australiano, etc.) e sexo. Você também pode adicionar descrições personalizadas para traços específicos.

Contas gratuitas podem salvar até 5 pré-configurações de voz. Planos de início incluem 20 pré-configurações, e Planos Pro incluem pré-configurações de voz ilimitadas. Cada pré-configuração armazena a descrição completa para que você possa regenerar a mesma voz exata.

Sim. As vozes criadas através do estúdio de design são sintéticas e não copiem ninguém, por isso não há problemas de direitos. Qwen3-TTS é licenciado sob Apache 2.0, fazendo uso comercial totalmente permitido.

Atualmente o design de voz funciona melhor para inglês, chinês, japonês e coreano — as línguas Qwen3-TTS foi treinado. Mais idiomas serão adicionados à medida que modelos de design de voz multilingue ficarem disponíveis.

Sim. O estúdio fornece visualização instantânea ao ajustar os deslizantes. Uma frase de amostra curta é gerada (1-2 segundos) para que você possa iterar rapidamente. Uma vez satisfeito, gerar texto mais longo com a voz projetada.

Cada geração de design de voz usa preços de nível padrão (2x caracteres). As visualizações ao vivo usam uma frase fixa curta para minimizar o custo. Contas gratuitas começam com 15.000 caracteres.

Cada slider mapas para uma descrição da linguagem natural. Por exemplo, o slider de lançamento em 80% mapas para "voz alta". O slider de calor em 90% adiciona "tonho quente e amigável." Essas descrições são combinadas em um único prompt de perfil de voz que Qwen3-TTS usa para gerar a voz.

5.0/5 (1)

Pronto para começar?

Inscreva-se gratuitamente e receba 15.000 caracteres. Não é necessário cartão de crédito.

Inscreva-se gratuitamente Ver Preços

Estúdio de Design de Voz

Características da Voz

Texto para Falar

Antevisão

Predefinições de Voz Salvadas

Planos de Design de Voz

Perguntas Frequentes

O que é o Voice Design Studio?

Como funciona o design da voz?

Qual modelo dá poder ao design de voz?

Posso salvar uma voz projetada?

Como é que isto é diferente da clonagem de voz?

Que características posso controlar?

Quantas vozes personalizadas posso criar?

Posso usar vozes projetadas para projetos comerciais?

Que idiomas apoia o design da voz?

Posso ouvir uma previsão antes de salvar?

O design de voz é gratuito?

Como funciona o mapeamento slider-to-prompt?

Pronto para começar?