Imagerie audio de l'IA
Remplacez une section d'audio par un discours synthétisé AI qui correspond à la voix environnante. Corrigez une mauvaise prise sans réenregistrer l'ensemble.
Télécharger l'audio sur Inpaint
500 caractères par seconde d'audio remplacéFaites glisser et déposez votre fichier ici, ou parcourir
Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.fichier.mp3
0 MBSource audio — gommage pour trouver la mauvaise prise
Paramètres de l' image
Cloner la voix et synthétiser le remplacement...
Sciage → clonage autour de la voix → épissage avec la fade croiséeAvant (Original)
Après (incarné)
Comment fonctionne l'inpeinture audio
L'inpeinture est l'équivalent audio du remplissage de contenu de Photoshop. Nous clonons la voix de l'audio entourant votre sélection, synthétisez la nouvelle ligne dans cette voix, et recopiez-la avec une courte crossfade.
Meilleurs résultats : laissez au moins 3 secondes de parole propre immédiatement avant le point d'édition, de sorte que le cloner dispose d'un bon matériel de référence.
Conseils pour les meilleurs résultats
- Gardez la plage marquée aussi serrée que possible — seulement la mauvaise prise
- Le texte de remplacement devrait avoir à peu près la même longueur que ce qu'il remplace.
- Définir la langue pour correspondre à l'audio source pour la meilleure correspondance vocale
- 80ms crossfade est généralement invisible; bosse jusqu'à 150ms si vous entendez un clic
- Pour les éditions longues (>10s), envisager de réenregistrer l'intégralité du passage à la place
Comment fonctionne l'inpeinture audio de l'IA
Éditions chirurgicales, appariées à la voix, sans session de réenregistrement.
Charger + Marquer la plage
Téléchargez votre audio et utilisez le gommage pour marquer le début/fin de la section que vous souhaitez remplacer. Tapez le texte de remplacement.
Clé vocale + Synthétisation
Nous extrait jusqu'à 12 secondes d'audio de référence propre entourant votre sélection, clone la voix de l'orateur, et synthétise la nouvelle ligne dans cette voix.
Épice à flasque croisé
Le clip synthétisé est plié dans l'enregistrement original avec une interface de puissance égale aux deux points d'édition. Les limites sont inaudibles.
Plans de peinture audio
Commencez gratuitement, mise à niveau lorsque vous avez besoin de plus
- Jusqu'à 10 minutes de fichiers sources
- Texte de remplacement de 500 caractères
- 4 secondes de peinture par demande
- Agrafe de 80 ms à flasme croisé
- OpenVoice + CosyVoice 2 moteurs
- Jusqu'à 10 minutes de fichiers sources
- Texte de remplacement de 5 000 caractères
- Fenêtres intercalaires (entre 0 et 250 ms)
- Redéfinition du modèle vocal
- Historique de la génération + réédition
- Jusqu'à 30 minutes de fichiers sources
- Texte de remplacement de 100 000 caractères
- file d'attente GPU prioritaire
- Accès à l'API (/v1/audio-inpaint/)
- Peinture par lots (intervalles multiples)
Foire aux questions
Que pourrions-nous améliorer? Vos commentaires nous aident à résoudre les problèmes.
Correction de votre audio en secondes
Remplacez n'importe quelle partie de tout enregistrement par un discours synthétique AI qui correspond à la voix d'origine. Inscrivez-vous gratuitement pour commencer.