Laporkan Permintaan Kutu / Fitur

Mengecat Audio AI

Ganti bagian audio dengan pidato AI-sintesis yang cocok dengan suara sekitarnya. Perbaiki pengambilan yang buruk tanpa merekam ulang semuanya.

Daftar Bebas

Kami belum memiliki suara TTS dalam bahasamu. Juallah Suara Anda

Unggah Audio ke Inpaint

500 karakter per detik audio diganti

Seret & jatuhkan berkas anda di sini, atau ramban

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Pengaturan Cat

Mulai (detik)

Akhir (detik)

Teks penggantian apa yang harus dikatakan dalam celah 0 / 500 karakter

Bahasa

CrossfadeCity in Texas, United States 80 ms Berapa lama untuk mencampur titik-titik splice. 80m adalah default match-cuts merasa alami, tidak terdengar double-trigger.

Daftar bebas untuk menggunakan cat audio

Cara Pembuatan Gambar Audio

Kami mengkloning suara dari audio yang ada di sekeliling pilihan Anda, mensintesis baris baru dengan suara itu, dan mengirisnya kembali dengan crossfade pendek.

Hasil terbaik: tinggalkan setidaknya 3 detik dari pidato bersih segera sebelum titik edit jadi kloner memiliki bahan referensi yang baik.

Tip untuk Hasil - Hasil Terbaik

Jaga jarak yang ditandai seketat mungkin hanya yang buruk mengambil
Teks pengganti seharusnya kurang lebih sama dengan apa yang digantikannya
Atur bahasa yang cocok dengan sumber audio untuk pencocokan suara terbaik
80ms crossfade biasanya tidak terlihat; benjolan ke 150ms jika Anda mendengar klik
Untuk pengeditan panjang (>10s), lebih baik mempertimbangkan untuk merekam ulang seluruh bagian

Bagaimana Cara Kerja yang Mencat Audio AI

Suntingan bedah, sound-matched, tanpa re-recording sesi.

Langkah 1

Unggah + Jangkauan Mark

Unggah audio Anda dan gunakan scrubber untuk menandai awal/akhir dari bagian yang ingin Anda ganti. Ketik teks pengganti.

Langkah 2

Klonan Suara + Synthesize

Kami mengekstrak hingga 12 detik dari referensi audio bersih sekitar pilihan Anda, mengklon suara pembicara, dan mensintesis baris baru dalam suara itu.

Langkah 3

Crossfade Splice

Klip yang disintesis disambung ke dalam rekaman asli dengan nilai silang yang sama pada kedua titik sunting. Batas-batasnya tidak terdengar.

Rencana Mencat Audio

Mulai bebas, upgrade ketika Anda membutuhkan lebih banyak

Bebas

Hingga berkas sumber 10 menit
500-karakter pengganti teks
4-detik cat per permintaan
80ms crossfade splice
OpenVoice + CosyVoice 2 backends

Paling Populer

Akun Bebas

Hingga berkas sumber 10 menit
5,000-character pengganti teks
crossfade tunable (0-250ms)
Penimpa model suara
Sejarah generasi + re-edit

Daftar Bebas

Pro

Berkas sumber hingga 30 menit
100.000-karakter teks pengganti
Antrian GPU prioritas
Akses API (/v1/audio-inpaint/)
Batch in painting (jangkauan multiple)

Tingkatkan

Pertanyaan yang Sering Diajukan

Inpaiting audio (juga disebut isi audio atau pidato overdub) memungkinkan Anda mengganti suatu bagian dari rekaman audio yang ada dengan pidato Al-sintesis baru yang cocok dengan suara aslinya. Ini adalah audio yang setara dengan isi-pengaman fotoshop mengisi cat ® di atas bagian yang tidak Anda inginkan, ketikkan apa yang seharusnya ada, dan AI menghasilkan pengganti yang mulus.

Tandai rentang waktu untuk mengganti, ketik baris dialog baru, dan klik Inpaint. AI mengkloning suara dari audio yang mengelilingi pilihan Anda, mensintesis baris baru dalam suara itu, dan splices kembali ke rekaman Anda dengan crossfade pendek sehingga sunting tidak terdengar.

Gunakan ketika Anda memiliki satu kata yang buruk, salah pernyataan, nama slip, sumpah-sumpah, atau fakta kesalahan dalam tindakan sebaliknya-baik. merekam kembali seluruh bagian sering kali memperkenalkan tonal ketidakcocokan dengan sisa proyek memperbaiki hanya apa yang perlu diperbaiki sambil menjaga setiap suku kata lainnya utuh.

Pengguna bebas dapat meng-incat berkas hingga 10 menit. Para penyusun dapat mengecat berkas hingga 30 menit. Teks pengganti itu sendiri ditempelkan pada 500 karakter untuk pengguna gratis, 5.000 untuk akun gratis, dan 100.000 untuk rencana pembayaran.

AI menggunakan hingga 12 detik audio yang mengelilingi edit sebagai referensi suara, yang cukup untuk setiap model yang dapat dikloning (OpenVoice, CosyVoice 2) untuk menangkap timbre pembicara, pitch, dan berbicara gaya terbaik. Untuk hasil terbaik, tinggalkan setidaknya 3 detik dari pidato bersih segera sebelum titik edit.

Kami menerapkan sebuah crossfade dengan kekuatan 80ms pada kedua titik splice (kepala → replacement dan penggantian →tail) secara baku. Anda dapat menyeleksi ini dari 0ms (keras dipotong) hingga 250m melalui slider Crossfade.

Meninjau audio mengikuti liputan bahasa yang sama dengan kloning suara. Kami memilih otomatis OpenVoice untuk kebanyakan bahasa dan CosyVoice 2 untuk Bahasa Cina, Jepang, dan Korea. Anda dapat menimpa model dalam pengaturan lanjutan.

Anda diisi 500 karakter per detik dari audio diganti. Biaya perbaikan 4 detik 2.000 karakter. Biayanya adalah bebas dari berapa lama teks pengganti, karena sintesis klon yang mendasarinya dihadangkan oleh waktu berjalan dari klip baru, bukan panjang teks.

Per Terms of Service kami, Anda mungkin hanya memasukkan audio Anda sendiri atau memiliki izin eksplisit untuk menyunting. Menjangkitkan kutipan palsu, konten menipu, atau peniruan dilarang.

Memotong sebuah klip meninggalkan celah yang terlihat dalam jarak dan napas; peningkat silang dua mengambil daun yang tidak cocok tonal. Melukis mengisi kesenjangan dengan pidato yang cocok dengan suara sekitarnya, sehingga pendengar mendengar audio yang terus menerus dan terdengar alami.

Ya POST untuk /v1/audio-inpaint/ dengan berkas audio, start_sec, end_sec, dan pengganti_text. Titik akhir mengembalikan suatu UUID pekerjaan; polling /v1/speech/reults/?uid= untuk mengambil audio yang telah diincat ketika siap. Lihat doc API untuk rincian.

Sebelas labs Speech-to-Speech meregenerasi seluruh garis suara dari goresan dengan suara target.

5.0/5 (1)

Perbaiki Audio Anda dalam Detik

Ganti setiap bagian dari rekaman dengan pidato buatan AI yang cocok dengan suara aslinya. Daftar bebas untuk memulai.

Daftar Bebas Tilik Pricing

Mengecat Audio AI

Unggah Audio ke Inpaint

Informasi audio sumber untuk menemukan yang buruk.

Pengaturan Cat

Sebelum (Original)

Setelah (dicat)

Cara Pembuatan Gambar Audio

Tip untuk Hasil - Hasil Terbaik

Bagaimana Cara Kerja yang Mencat Audio AI

Unggah + Jangkauan Mark

Klonan Suara + Synthesize

Crossfade Splice

Rencana Mencat Audio

Pertanyaan yang Sering Diajukan

Perbaiki Audio Anda dalam Detik

Mengecat Audio AI

Unggah Audio ke Inpaint

Informasi audio sumber untuk menemukan yang buruk.

Pengaturan Cat

Sebelum (Original)

Setelah (dicat)

Cara Pembuatan Gambar Audio

Tip untuk Hasil - Hasil Terbaik

Bagaimana Cara Kerja yang Mencat Audio AI

Unggah + Jangkauan Mark

Klonan Suara + Synthesize

Crossfade Splice

Rencana Mencat Audio

Pertanyaan yang Sering Diajukan

Apa yang diin painting suara?

Bagaimana cara kerjanya?

Kapan saya harus menggunakan cat audio bukannya re-recording?

Berapa lama audio sumber akan?

Apakah kata - kata yang dicat itu akan terdengar persis seperti pembicara yang semula?

Apa yang terjadi pada batas-batas sunting?

Bahasa apa saja yang didukung?

Berapa biaya cat audio?

Dapatkah saya menggunakan ini untuk menempatkan kata-kata dalam mulut seseorang mereka tidak pernah mengatakan?

Mengapa menggunakan cat bukan hanya menghapus bagian yang buruk?

Apakah API in painting audio tersedia?

Bagaimana ini dibandingkan dengan ElevenLabs Speech-to-Speech?

Perbaiki Audio Anda dalam Detik