Informar dun erro / Solicitar unha funcionalidade

Pintura de son AI

Substituír unha sección de son por voz sintetizada por IA que coincida coa voz circundante. Corrixir unha toma mala sen volver gravar todo.

Inscríbete gratis

Non o facemos. Vender a túa voz

Enviar o son a Inpaint

Substituíronse 500 caracteres por segundo de son

Arrastre e solte o ficheiro aquí, ou navegar

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Configuración de Inpaint

Comezo (segundos)

Fin (segundos)

Texto de substitución - o que se debería dicir no espazo 0 / 500 caracteres

Lingua

Desvanecemento 80 ms O tempo que se mesturarán os puntos de unión. Por omisión son 80 ms. Os cortes de unión son naturais, non hai disparo dobre audible.

Inscríbase gratuitamente para usar o inpainting de son

Como funciona a incrustación de son

A pintura é o equivalente á realización de son do recheo consciente do contido de Photoshop. Clonamos a voz do son que rodea a selección, sintetizamos a nova liña nesa voz e ensamblámola de novo cun breve esvaecemento.

Os mellores resultados: deixe polo menos 3 segundos de fala limpa inmediatamente antes do punto de edición para que o clonador teña un bo material de referencia.

Consellos para obter os mellores resultados

Manter o rango marcado o máis estreito posíbel - só as tomas malas
O texto de substitución debe ter aproximadamente a mesma lonxitude que o que substitue
Escolla a lingua para que coincida co son de orixe para a mellor concordancia de voz
O esvaecemento de 80 ms é normalmente invisíbel; aumente a 150 ms se escoita un clic
Para edicións longas (> 10s), considere gravar de novo toda a pasaxe

Como funciona a pintura de son da IA

Edicións cirúrxicas, correspondentes á voz, sen sesión de regravación.

Paso 1

Enviar + Marcar o Rango

Envíe o seu son e empregue o deslizador para marcar o comezo/ fin da sección que queira substituír. Escriba o texto de substitución.

Paso 2

Clonar e sintetizar a voz

Extraemos ata 12 segundos de son de referencia limpo arredor da súa selección, clonamos a voz do falante e sintetizamos a nova liña nesa voz.

Paso 3

Empalme de esvaecemento

O clip sintetizado é empalmeado na gravación orixinal cun esvaecemento de igual potencia en ambos os puntos de edición. Os límites son inaudíbeis.

Planos de incrustación de son

Comece de balde, actualice cando precise máis

Libre

Ficheiros de orixe de ata 10 minutos
Texto de substitución de 500 caracteres
Pintar 4 segundos por pedido
80ms crossfade splice
Infraestruturas de OpenVoice + CosyVoice 2Name

Máis popular

Conta libre

Ficheiros de orixe de ata 10 minutos
Texto de substitución de 5. 000 caracteres
Desvanecemento sintonizable (0- 250ms)
Sobrescribir o modelo de voz
Historial de xeración + re- edición

Inscríbete gratis

Pro

Ficheiros de orixe de ata 30 minutos
Texto de substitución de 100. 000 caracteres
Fila de prioridade da GPU
Acceso á API (/v1/audio-inpaint/)
Pintura por lotes (múltiplos rangos)

Actualizar

Preguntas frecuentes

A pintura de son (tamén chamada preenchimento de son ou sobregravación de voz) permítelle substituír unha sección dunha gravación de son existente por unha nova voz sintetizada por IA que coincida coa voz orixinal. É o equivalente á preenchimento consciente do contido de Photoshop: pinte sobre a parte que non queira, escriba o que debería estar alí e a IA xerará unha substitución perfecta.

Marque o intervalo de tempo que quere substituír, escriba a nova liña de diálogo e prema en Pintar. A nosa IA clonará a voz do son que rodea a selección, sintetizará a nova liña nesa voz e volverá a engadila á gravación cun breve fundido para que a edición non se poida escoitar.

Úsao cando teña unha soa palabra mala, mala pronuncia, nome errado, palabra malsonante ou erro de feito nunha toma que por outra parte é boa. Regravar a pasaxe enteira a miúdo introduce un desajuste tonal co resto do proxecto; a inpintura corrixe só o que precisa ser corrixido mantendo intacta cada outra sílaba.

Os usuarios gratuítos poden engadir ficheiros de ata 10 minutos de duración. Os subscritores poden engadir ficheiros de ata 30 minutos. O texto de substitución está limitado a 500 caracteres para os usuarios gratuítos, 5. 000 para as contas gratuítas e 100. 000 para os plans de pago.

Moi preto. A IA emprega ata 12 segundos de son arredor da edición como referencia de voz, o que é suficiente para que calquera dos nosos modelos capaces de clonar (OpenVoice, CosyVoice 2) capture o timbre, o ton e o estilo de fala do falante. Para obter os mellores resultados, deixe polo menos 3 segundos de fala limpa inmediatamente antes do punto de edición.

Por omisión, aplicamos un esvaecemento cruzado de 80 ms de potencia igual en ambos os puntos de unión (cabeza→substitución e substitución→coa). Pode axustar isto desde 0 ms (corte duro) ata 250 ms mediante o control deslizante de esvaecemento cruzado. Os esvaecementos cruzados máis longos agochan a edición máis completamente, pero poden mesturar audiblemente as palabras superpostas no límite.

A incrustación de son segue a mesma cobertura de linguaxe que a clonación de voz. Escollemos automaticamente OpenVoice para a maioría das linguas e CosyVoice 2 para chinés, xaponés e coreano. Pode sobrescribir o modelo na configuración avanzada.

Cóbranlle 500 caracteres por segundo de son substituído. Unha corrección de 4 segundos custa 2000 caracteres. O custo é independente da lonxitude do texto de substitución, xa que a síntese de clonación subxacente está controlada polo tempo de execución do novo clip, non pola lonxitude do texto.

Segundo os nosos termos de servizo, só pode engadir son que sexa seu ou que teña permiso explícito para editar. Está prohibido xerar citas falsas, contido enganoso ou suplantación. Marcamos o son xerado e rexistramos todos os traballos de engadido para revisión de abusos.

Cortar un clip deixa un espazo perceptible no ritmo e na respiración; fundindo dúas tomas deixa un desajuste tonal. A inpintura enche o espazo co discurso que coincide coa voz circundante, de xeito que os oíntes escoitan un son continuo e natural.

Si — POST a / v1/ audio- inpaint / co ficheiro de son, start_ sec, end_ sec e replacement_ text. O punto final devolve un UUID da tarefa; consulta / v1/ speech/ results/? uuid= para recuperar o son pintado cando estea listo. Consulte a documentación da API para máis detalles.

ElevenLabs Speech- to- Speech rexenerou toda a liña de voz desde cero nunha voz de destino. A nosa pintura de son é cirúrxica: edita só o rango marcado, mantén todos os outros bytes da gravación orixinal intactos e combina o novo clip coa voz circundante en vez dunha biblioteca de voz separada.

5.0/5 (1)

Corrixa o seu son en segundos

Substitua calquera parte de calquera gravación por voz sintetizada por IA que coincida coa voz orixinal. Inscríbase de balde para comezar.

Inscríbete gratis Ver os prezos

Pintura de son AI

Enviar o son a Inpaint

Fonte de son — limpa para atopar a toma incorrecta

Configuración de Inpaint

Antes (Orixinal)

Despois (Pintado)

Como funciona a incrustación de son

Consellos para obter os mellores resultados

Como funciona a pintura de son da IA

Enviar + Marcar o Rango

Clonar e sintetizar a voz

Empalme de esvaecemento

Planos de incrustación de son

Preguntas frecuentes

Corrixa o seu son en segundos

Pintura de son AI

Enviar o son a Inpaint

Fonte de son — limpa para atopar a toma incorrecta

Configuración de Inpaint

Antes (Orixinal)

Despois (Pintado)

Como funciona a incrustación de son

Consellos para obter os mellores resultados

Como funciona a pintura de son da IA

Enviar + Marcar o Rango

Clonar e sintetizar a voz

Empalme de esvaecemento

Planos de incrustación de son

Preguntas frecuentes

Que é a incrustación de son?

Como funciona?

Cando debo empregar a pintura de son no canto de gravar de novo?

Canto tempo pode durar o son de orixe?

O discurso pintado soará exactamente como o falante orixinal?

Que ocorre nos límites de edición?

Que idiomas están soportados?

Canto custa a pintura de son?

Podo usar isto para poñerlle palabras na bocalguén que nunca as dixo?

Por que usar inpainting no canto de simplemente borrar a sección incorrecta?

Está dispoñíbel a API de incrustación de son?

Como se compara isto co ElevenLabs Speech-to-Speech?

Corrixa o seu son en segundos