Mengecat Audio AI

Ganti bagian audio dengan pidato AI-sintesis yang cocok dengan suara sekitarnya. Perbaiki pengambilan yang buruk tanpa merekam ulang semuanya.

Kami belum memiliki suara TTS dalam bahasamu. Juallah Suara Anda

Unggah Audio ke Inpaint

500 karakter per detik audio diganti

Seret & jatuhkan berkas anda di sini, atau ramban

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

berkas.mp3

0 MB

Informasi audio sumber untuk menemukan yang buruk.

0.00s / 0.00s

Pengaturan Cat

0 / 500 karakter
Berapa lama untuk mencampur titik-titik splice. 80m adalah default match-cuts merasa alami, tidak terdengar double-trigger.
Daftar bebas untuk menggunakan cat audio
Meninjau audio...

Menyelubungi suara dan mensintesis penggantian...

Mengiris → mengkloning sekeliling suara → mengiris dengan garis silang
Ambil waktu sebentar, hasilmu akan muncul dalam dirimu. riwayat generasi kapan siap.
Audio yang Dicat Siap

Sebelum (Original)

Setelah (dicat)

Unduh Audio Yang Dicat

Cara Pembuatan Gambar Audio

Kami mengkloning suara dari audio yang ada di sekeliling pilihan Anda, mensintesis baris baru dengan suara itu, dan mengirisnya kembali dengan crossfade pendek.

Hasil terbaik: tinggalkan setidaknya 3 detik dari pidato bersih segera sebelum titik edit jadi kloner memiliki bahan referensi yang baik.

Tip untuk Hasil - Hasil Terbaik

  • Jaga jarak yang ditandai seketat mungkin hanya yang buruk mengambil
  • Teks pengganti seharusnya kurang lebih sama dengan apa yang digantikannya
  • Atur bahasa yang cocok dengan sumber audio untuk pencocokan suara terbaik
  • 80ms crossfade biasanya tidak terlihat; benjolan ke 150ms jika Anda mendengar klik
  • Untuk pengeditan panjang (>10s), lebih baik mempertimbangkan untuk merekam ulang seluruh bagian

Bagaimana Cara Kerja yang Mencat Audio AI

Suntingan bedah, sound-matched, tanpa re-recording sesi.

Langkah 1

Unggah + Jangkauan Mark

Unggah audio Anda dan gunakan scrubber untuk menandai awal/akhir dari bagian yang ingin Anda ganti. Ketik teks pengganti.

Langkah 2

Klonan Suara + Synthesize

Kami mengekstrak hingga 12 detik dari referensi audio bersih sekitar pilihan Anda, mengklon suara pembicara, dan mensintesis baris baru dalam suara itu.

Langkah 3

Crossfade Splice

Klip yang disintesis disambung ke dalam rekaman asli dengan nilai silang yang sama pada kedua titik sunting. Batas-batasnya tidak terdengar.

Rencana Mencat Audio

Mulai bebas, upgrade ketika Anda membutuhkan lebih banyak

Bebas
  • Hingga berkas sumber 10 menit
  • 500-karakter pengganti teks
  • 4-detik cat per permintaan
  • 80ms crossfade splice
  • OpenVoice + CosyVoice 2 backends
Paling Populer
Akun Bebas
  • Hingga berkas sumber 10 menit
  • 5,000-character pengganti teks
  • crossfade tunable (0-250ms)
  • Penimpa model suara
  • Sejarah generasi + re-edit
Daftar Bebas
Pro
  • Berkas sumber hingga 30 menit
  • 100.000-karakter teks pengganti
  • Antrian GPU prioritas
  • Akses API (/v1/audio-inpaint/)
  • Batch in painting (jangkauan multiple)
Tingkatkan

Pertanyaan yang Sering Diajukan

Inpaiting audio (juga disebut isi audio atau pidato overdub) memungkinkan Anda mengganti suatu bagian dari rekaman audio yang ada dengan pidato Al-sintesis baru yang cocok dengan suara aslinya. Ini adalah audio yang setara dengan isi-pengaman fotoshop mengisi cat ® di atas bagian yang tidak Anda inginkan, ketikkan apa yang seharusnya ada, dan AI menghasilkan pengganti yang mulus.

Tandai rentang waktu untuk mengganti, ketik baris dialog baru, dan klik Inpaint. AI mengkloning suara dari audio yang mengelilingi pilihan Anda, mensintesis baris baru dalam suara itu, dan splices kembali ke rekaman Anda dengan crossfade pendek sehingga sunting tidak terdengar.

Gunakan ketika Anda memiliki satu kata yang buruk, salah pernyataan, nama slip, sumpah-sumpah, atau fakta kesalahan dalam tindakan sebaliknya-baik. merekam kembali seluruh bagian sering kali memperkenalkan tonal ketidakcocokan dengan sisa proyek memperbaiki hanya apa yang perlu diperbaiki sambil menjaga setiap suku kata lainnya utuh.

Pengguna bebas dapat meng-incat berkas hingga 10 menit. Para penyusun dapat mengecat berkas hingga 30 menit. Teks pengganti itu sendiri ditempelkan pada 500 karakter untuk pengguna gratis, 5.000 untuk akun gratis, dan 100.000 untuk rencana pembayaran.

AI menggunakan hingga 12 detik audio yang mengelilingi edit sebagai referensi suara, yang cukup untuk setiap model yang dapat dikloning (OpenVoice, CosyVoice 2) untuk menangkap timbre pembicara, pitch, dan berbicara gaya terbaik. Untuk hasil terbaik, tinggalkan setidaknya 3 detik dari pidato bersih segera sebelum titik edit.

Kami menerapkan sebuah crossfade dengan kekuatan 80ms pada kedua titik splice (kepala → replacement dan penggantian →tail) secara baku. Anda dapat menyeleksi ini dari 0ms (keras dipotong) hingga 250m melalui slider Crossfade.

Meninjau audio mengikuti liputan bahasa yang sama dengan kloning suara. Kami memilih otomatis OpenVoice untuk kebanyakan bahasa dan CosyVoice 2 untuk Bahasa Cina, Jepang, dan Korea. Anda dapat menimpa model dalam pengaturan lanjutan.

Anda diisi 500 karakter per detik dari audio diganti. Biaya perbaikan 4 detik 2.000 karakter. Biayanya adalah bebas dari berapa lama teks pengganti, karena sintesis klon yang mendasarinya dihadangkan oleh waktu berjalan dari klip baru, bukan panjang teks.

Per Terms of Service kami, Anda mungkin hanya memasukkan audio Anda sendiri atau memiliki izin eksplisit untuk menyunting. Menjangkitkan kutipan palsu, konten menipu, atau peniruan dilarang.

Memotong sebuah klip meninggalkan celah yang terlihat dalam jarak dan napas; peningkat silang dua mengambil daun yang tidak cocok tonal. Melukis mengisi kesenjangan dengan pidato yang cocok dengan suara sekitarnya, sehingga pendengar mendengar audio yang terus menerus dan terdengar alami.

Ya POST untuk /v1/audio-inpaint/ dengan berkas audio, start_sec, end_sec, dan pengganti_text. Titik akhir mengembalikan suatu UUID pekerjaan; polling /v1/speech/reults/?uid= untuk mengambil audio yang telah diincat ketika siap. Lihat doc API untuk rincian.

Sebelas labs Speech-to-Speech meregenerasi seluruh garis suara dari goresan dengan suara target.
5.0/5 (1)

Umpan balikmu membantu kita memperbaiki masalah.

Perbaiki Audio Anda dalam Detik

Ganti setiap bagian dari rekaman dengan pidato buatan AI yang cocok dengan suara aslinya. Daftar bebas untuk memulai.