Àwọn àwòrán àwòrán AI
Replace a section of audio with AI-synthesized speech that matches the surrounding voice. Fix a bad take without re-recording the whole thing.
Fi Ojúkọ̀ Pánẹ́ẹ̀lì Hàn
Àwọn àyọkà 500 nínú ìsàlẹ̀-ilà ìṣàfarawéGbé àwọn fáìlì rẹ̀ lọ́wọ́lọ́wọ́ síbẹ̀, tàbí Wá
Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.fáìlì.mp3
0 MBSource audio — scrub to find the bad take
Àwọn Àtòjọ-ẹ̀yàn
Ń kọ́lù àwòrán àti ìṣàfarawe àwọn ìṣàmúlò-ètò...
Ìṣàfilọ́lẹ̀ → ìṣàfilọ́lẹ̀ àwòrán ààyè-iṣẹ́ → ìṣàfilọ́lẹ̀ láti inú ìṣàfarawéÀwọn àwọn ààyè-iṣẹ́
Àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn àwọn
Bií Àwọn Àwọn Àkọ́kọ́ Àkọ́kọ́ Rẹ́
Inpainting is the audio equivalent of Photoshop's content-aware fill. We clone the voice from the audio surrounding your selection, synthesize the new line in that voice, and splice it back with a short crossfade.
Best results: leave at least 3 seconds of clean speech immediately before the edit point so the cloner has good reference material.
Àwọn Ìṣàmúlò-ètò fún Àwọn Àtòjọ-ẹ̀yàn
- Keep the marked range as tight as possible — only the bad take
- Àkọlé àwòrán Àwọn àwọn àyọkà ìṣàmúlò-ètò yẹ ki o jẹ́ ìgbà jú ohun tí o ń pàtó lọ
- Àtòjọ àwọn ìṣàmúlò-ètò fún ìṣàmúlò-ètò ìṣàfihàn àwọn ìrísí-lẹ́tà fún ìṣàfihàn àwòrán tí o dara ju
- 80ms crossfade ní pàtó pé kò lè rí; bọ́tìnì sí 150ms tí o bá gbọ́ kọ́ọ̀kan
- Fun àwọn ìṣàmúlò-ètò ìgbà (>10s), róòlú ìṣàfihàn ìṣàfarawé àwọn ààyè-iṣẹ́ nípa
Bií a ṣe lè Lódúró Ìṣàfilọ́lẹ̀ Àwọn Àmì-ìwé AI
Àwọn ìṣàmúlò-ètò ìṣàfarawé, àwọn ìṣàmúlò-ètò ìṣàfarawé, àti àwọn sáà ìṣàfilọ́lẹ̀.
Àwọn ààyè-iṣẹ́
Fi àwòrán rẹ pamọ́ sínú àti ló àwọn àwọn àmì-ìwé láti fi àmì-ìwé hàn nínú ìṣàfihàn/ìparì ààyè-iṣẹ́ tí o fẹ́ láti pàtó. Ṣàfihàn àwọn àkọlé àti àwọn àmì-ìwé ìpàtó.
Àwọn Àmì-ìwé
We extract up to 12 seconds of clean reference audio surrounding your selection, clone the speaker's voice, and synthesize the new line in that voice.
Àwọn àwọn ìṣàfarawé àwọn àwọn ìṣàfarawé
The synthesized clip is spliced into the original recording with an equal-power crossfade at both edit points. The boundaries are inaudible.
Àwọn Àwọn Ààyè-iṣẹ́ Àwọn Àwòrán
Ṣílẹ̀ ọ̀fẹ́, ṣíṣàfihàn tí o bà fẹ́ diẹ́ sii
- Àwọn fáìlì ìṣàmúlò-ètò tí o tó 10 àwọn iṣẹ́jú
- Àwọn àyọkà ìṣàfarawé àwọn àmì-ìwé 500
- 4-sekondì àwọn àwọ̀ àwọn ìṣàmúlò-ètò
- 80ms crossfade splice
- Àwọn ààyè-iṣẹ́ OpenVoice + CosyVoice 2
- Àwọn fáìlì ìṣàmúlò-ètò tí o tó 10 àwọn iṣẹ́jú
- Àwọn àyọkà ìṣàfarawé àwọn àmì-ìwé 5,000
- Tunable crossfade (0-250ms)
- Àwọn ìṣàmúlò-ètò ìṣàfarawé àwọn ìṣàmúlò-ètò ìsàlẹ̀-ètò
- Ìtàn ìṣàfarawégbè + ìṣàfarawé padà
- Àwọn fáìlì ìṣàmúlò-ètò láti déètì 30
- Àwọn àyọkà ìsàlẹ̀-ilà 100,000
- Àwọn ìṣàmúlò-ètò GPU ìṣàfarawé
- Àwọn ìṣàfihàn API (/v1/audio-inpaint/)
- Àwọn àwọn ìṣàfarawé àwọn àwọn ìṣàmúlò-ètò
Àwọn Àtòjọ-ẹ̀yàn
Àwọn àwọn àgbéwọlé rẹ̀ lè jẹ́ ìrànwọ́ fún wa.
Ṣàtunkọ Àwòrán Rẹ̀ nínú àwọn ìṣísẹ̀
Replace any part of any recording with AI-synthesized speech that matches the original voice. Sign up free to start.