Pintura de son AI

Substituír unha sección de son por voz sintetizada por IA que coincida coa voz circundante. Corrixir unha toma mala sen volver gravar todo.

Non o facemos. Vender a túa voz

Enviar o son a Inpaint

Substituíronse 500 caracteres por segundo de son

Arrastre e solte o ficheiro aquí, ou navegar

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

ficheiro.mp3

0 MB

Fonte de son — limpa para atopar a toma incorrecta

0.00s / 0.00s

Configuración de Inpaint

0 / 500 caracteres
O tempo que se mesturarán os puntos de unión. Por omisión son 80 ms. Os cortes de unión son naturais, non hai disparo dobre audible.
Inscríbase gratuitamente para usar o inpainting de son
A pintar o son...

A clonar a voz e sintetizar a substitución...

Rebanar → clonar a voz circundante → empalme con fundido cruzado
Leva un tempo? O seu resultado aparecerá no seu historial de xeración cando estea listo.
Preparado para son pintado

Antes (Orixinal)

Despois (Pintado)

Obter o son pintado

Como funciona a incrustación de son

A pintura é o equivalente á realización de son do recheo consciente do contido de Photoshop. Clonamos a voz do son que rodea a selección, sintetizamos a nova liña nesa voz e ensamblámola de novo cun breve esvaecemento.

Os mellores resultados: deixe polo menos 3 segundos de fala limpa inmediatamente antes do punto de edición para que o clonador teña un bo material de referencia.

Consellos para obter os mellores resultados

  • Manter o rango marcado o máis estreito posíbel - só as tomas malas
  • O texto de substitución debe ter aproximadamente a mesma lonxitude que o que substitue
  • Escolla a lingua para que coincida co son de orixe para a mellor concordancia de voz
  • O esvaecemento de 80 ms é normalmente invisíbel; aumente a 150 ms se escoita un clic
  • Para edicións longas (> 10s), considere gravar de novo toda a pasaxe

Como funciona a pintura de son da IA

Edicións cirúrxicas, correspondentes á voz, sen sesión de regravación.

Paso 1

Enviar + Marcar o Rango

Envíe o seu son e empregue o deslizador para marcar o comezo/ fin da sección que queira substituír. Escriba o texto de substitución.

Paso 2

Clonar e sintetizar a voz

Extraemos ata 12 segundos de son de referencia limpo arredor da súa selección, clonamos a voz do falante e sintetizamos a nova liña nesa voz.

Paso 3

Empalme de esvaecemento

O clip sintetizado é empalmeado na gravación orixinal cun esvaecemento de igual potencia en ambos os puntos de edición. Os límites son inaudíbeis.

Planos de incrustación de son

Comece de balde, actualice cando precise máis

Libre
  • Ficheiros de orixe de ata 10 minutos
  • Texto de substitución de 500 caracteres
  • Pintar 4 segundos por pedido
  • 80ms crossfade splice
  • Infraestruturas de OpenVoice + CosyVoice 2Name
Máis popular
Conta libre
  • Ficheiros de orixe de ata 10 minutos
  • Texto de substitución de 5. 000 caracteres
  • Desvanecemento sintonizable (0- 250ms)
  • Sobrescribir o modelo de voz
  • Historial de xeración + re- edición
Inscríbete gratis
Pro
  • Ficheiros de orixe de ata 30 minutos
  • Texto de substitución de 100. 000 caracteres
  • Fila de prioridade da GPU
  • Acceso á API (/v1/audio-inpaint/)
  • Pintura por lotes (múltiplos rangos)
Actualizar

Preguntas frecuentes

A pintura de son (tamén chamada preenchimento de son ou sobregravación de voz) permítelle substituír unha sección dunha gravación de son existente por unha nova voz sintetizada por IA que coincida coa voz orixinal. É o equivalente á preenchimento consciente do contido de Photoshop: pinte sobre a parte que non queira, escriba o que debería estar alí e a IA xerará unha substitución perfecta.

Marque o intervalo de tempo que quere substituír, escriba a nova liña de diálogo e prema en Pintar. A nosa IA clonará a voz do son que rodea a selección, sintetizará a nova liña nesa voz e volverá a engadila á gravación cun breve fundido para que a edición non se poida escoitar.

Úsao cando teña unha soa palabra mala, mala pronuncia, nome errado, palabra malsonante ou erro de feito nunha toma que por outra parte é boa. Regravar a pasaxe enteira a miúdo introduce un desajuste tonal co resto do proxecto; a inpintura corrixe só o que precisa ser corrixido mantendo intacta cada outra sílaba.

Os usuarios gratuítos poden engadir ficheiros de ata 10 minutos de duración. Os subscritores poden engadir ficheiros de ata 30 minutos. O texto de substitución está limitado a 500 caracteres para os usuarios gratuítos, 5. 000 para as contas gratuítas e 100. 000 para os plans de pago.

Moi preto. A IA emprega ata 12 segundos de son arredor da edición como referencia de voz, o que é suficiente para que calquera dos nosos modelos capaces de clonar (OpenVoice, CosyVoice 2) capture o timbre, o ton e o estilo de fala do falante. Para obter os mellores resultados, deixe polo menos 3 segundos de fala limpa inmediatamente antes do punto de edición.

Por omisión, aplicamos un esvaecemento cruzado de 80 ms de potencia igual en ambos os puntos de unión (cabeza→substitución e substitución→coa). Pode axustar isto desde 0 ms (corte duro) ata 250 ms mediante o control deslizante de esvaecemento cruzado. Os esvaecementos cruzados máis longos agochan a edición máis completamente, pero poden mesturar audiblemente as palabras superpostas no límite.

A incrustación de son segue a mesma cobertura de linguaxe que a clonación de voz. Escollemos automaticamente OpenVoice para a maioría das linguas e CosyVoice 2 para chinés, xaponés e coreano. Pode sobrescribir o modelo na configuración avanzada.

Cóbranlle 500 caracteres por segundo de son substituído. Unha corrección de 4 segundos custa 2000 caracteres. O custo é independente da lonxitude do texto de substitución, xa que a síntese de clonación subxacente está controlada polo tempo de execución do novo clip, non pola lonxitude do texto.

Segundo os nosos termos de servizo, só pode engadir son que sexa seu ou que teña permiso explícito para editar. Está prohibido xerar citas falsas, contido enganoso ou suplantación. Marcamos o son xerado e rexistramos todos os traballos de engadido para revisión de abusos.

Cortar un clip deixa un espazo perceptible no ritmo e na respiración; fundindo dúas tomas deixa un desajuste tonal. A inpintura enche o espazo co discurso que coincide coa voz circundante, de xeito que os oíntes escoitan un son continuo e natural.

Si — POST a / v1/ audio- inpaint / co ficheiro de son, start_ sec, end_ sec e replacement_ text. O punto final devolve un UUID da tarefa; consulta / v1/ speech/ results/? uuid= para recuperar o son pintado cando estea listo. Consulte a documentación da API para máis detalles.

ElevenLabs Speech- to- Speech rexenerou toda a liña de voz desde cero nunha voz de destino. A nosa pintura de son é cirúrxica: edita só o rango marcado, mantén todos os outros bytes da gravación orixinal intactos e combina o novo clip coa voz circundante en vez dunha biblioteca de voz separada.
5.0/5 (1)

Que podemos mellorar? Os seus comentarios axúdannos a corrixir os problemas.

Corrixa o seu son en segundos

Substitua calquera parte de calquera gravación por voz sintetizada por IA que coincida coa voz orixinal. Inscríbase de balde para comezar.