Pintura de áudio da IA
Substitua uma seção de áudio com fala sintetizada por IA que corresponda à voz circundante. Corrija uma má tomada sem re-gravar a coisa toda.
Carregar áudio para Inpaint
500 caracteres por segundo de áudio substituídosArraste e largue o seu arquivo aqui, ou navegar
Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.file.mp3
0 MBáudio de origem — esfregar para encontrar a má tomada
Configurações de Pintura
A clonar a voz e a sintetizar a substituição...
Divisão → clonagem de voz → splicing com crossfadeAntes (Original)
Depois (Inpetrado)
Como funciona a pintura de áudio
A pintura é o equivalente áudio do preenchimento de conteúdo-consciente da Photoshop. clonamos a voz do áudio que circunda a sua seleção, sintetizamos a nova linha nessa voz, e alastramo-la de volta com um corte crosssfade.
Melhores resultados: deixe pelo menos 3 segundos de discurso limpo imediatamente antes do ponto de edição para que o clonador tenha bom material de referência.
Dicas para os melhores resultados
- Manter o intervalo marcado o mais apertado possível — apenas a má tomada
- O texto de substituição deve ser aproximadamente o mesmo comprimento que o que substitui
- Definir a linguagem para corresponder ao áudio de origem para a melhor correspondência de voz
- 80ms crossfade é geralmente invisível; buck a 150ms se você ouvir um clique
- Para editações longas (>10s), considere re-gravar a passagem inteira em vez disso
Como funciona a pintura de áudio da IA
Edições cirúrgicas, combinadas com voz, sem sessão de re-gravação.
Subir + Rango de Marcas
Envie o seu áudio e use o scrubber para marcar o início/fim da seção que deseja substituir. Digite o texto de substituição.
Clone de voz + Sintetização
Extraímos até 12 segundos de áudio de referência limpo em torno da sua seleção, clonamos a voz do alto-falante e sintetizamos a nova linha nessa voz.
Espuma cruzada
O clipe sintetizado é disperso na gravação original com um cruzamento de igual potência em ambos os pontos de edição. Os limites são inauditíveis.
Planos de pintura de áudio
Comece livre, atualização quando você precisa mais
- Arquivos de fonte até 10 minutos
- Texto de substituição de 500 caracteres
- Pintura de 4 segundos por pedido
- 80ms de espessura cruzada
- Motores OpenVoice + CosyVoice 2
- Arquivos de fonte até 10 minutos
- Texto de substituição de 5000 caracteres
- Fadas cruzadas tuníveis (0-250ms)
- Override do modelo de voz
- Histórico de geração + re-edição
- Arquivos de fontes até 30 minutos
- Texto de substituição de 100.000 caracteres
- Fila GPU prioritária
- Acesso à API (/v1/audio-inpaint/)
- Pintura em lote (plaços múltiplos)
Perguntas Frequentes
O que podemos melhorar? Seu feedback nos ajuda a resolver problemas.
Corrigir seu áudio em segundos
Substitua qualquer parte de qualquer gravação com voz sintetizada IA que coincida com a voz original. Inscreva-se livre para começar.