Pelukis Audio AI

Ganti bahagian audio dengan ucapan disintesis AI yang sepadan dengan suara sekeliling. Baiki tangkapan yang buruk tanpa merakam semula keseluruhannya.

Kami belum mempunyai suara TTS dalam bahasa anda. Bantu kami tambahkan suara anda! Jual Suara Anda

Muat naik Audio ke Inpaint

500 aksara per saat audio digantikan

Seret dan lepaskan fail anda di sini, atau layari

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

fail.mp3

0 MB

Sumber audio — gosok untuk cari ambil yang buruk

0.00s / 0.00s

Tetapan Inpaint

0 / 500 aksara
Berapa lama untuk mencampurkan titik sambungan. 80ms adalah piawai - potong-padanan terasa semulajadi, tiada pemicu-dua-dengar.
Daftar secara percuma untuk menggunakan inpainting audio
Melukis audio...

Mengklon suara dan mensintesis pengganti...

Memotong → mengklon suara sekeliling → menyambung dengan pemisah
Berapa lama? Hasil anda akan muncul dalam sejarah penjanaan bila dah sedia.
Audio Sedia Dilukis

Sebelum (Asli)

Selepas (Dilukis)

Bagaimana Inpainting Audio Berfungsi

Inpainting adalah setara audio bagi isian sedar-kandungan Photoshop. Kami klon suara dari audio yang mengelilingi pemilihan anda, sintesis baris baru dalam suara itu, dan splice ia semula dengan pemisahan silang pendek.

Hasil terbaik: tinggalkan sekurang- kurangnya 3 saat ucapan bersih segera sebelum titik penyuntingan supaya kloner mempunyai bahan rujukan yang baik.

Panduan untuk Hasil Terbaik

  • Kekalkan julat yang ditandakan sekuat mungkin — hanya ambil yang buruk
  • Teks penggantian sepatutnya kira-kira sama panjang dengan apa yang ia ganti
  • Tetapkan bahasa untuk sepadan dengan audio sumber untuk sepadan suara terbaik
  • 80ms crossfade biasanya tidak kelihatan; bump ke 150ms jika anda dengar klik
  • Untuk penyuntingan panjang (>10s), pertimbangkan untuk merakam semula keseluruhan laluan

Bagaimana Pelukis Audio AI Berfungsi

Penyuntingan pembedahan, suara-cocok, tanpa sesi rekaman semula.

Langkah 1

Muat naik + Tandakan Julat

Muat naik audio anda dan gunakan pelembap untuk menandakan permulaan/akhir bahagian yang anda ingin ganti. Taip teks penggantian.

Langkah 2

Klon Suara + Sintetis

Kami mengekstrak sehingga 12 saat audio rujukan bersih mengelilingi pemilihan anda, klon suara pembicara, dan mensintesis baris baru dalam suara itu.

Langkah 3

Splice Crossfade

Klip yang disintesis disambungkan ke dalam rakaman asal dengan pemisahan bertindih kuasa sama pada kedua-dua titik penyuntingan. Batas tidak dapat didengar.

Reka Bentuk Inpenting Audio

Mulakan percuma, naik taraf bila anda perlukan lebih

Bebas
  • Fail sumber sehingga 10 minit
  • Teks pengganti 500-aksara
  • 4-saat inpaint per permintaan
  • Splice 80ms crossfade
  • Backend OpenVoice + CosyVoice 2
Paling Popular
Akaun Bebas
  • Fail sumber sehingga 10 minit
  • Teks pengganti 5,000-aksara
  • Pemisah-silang boleh diset (0-250ms)
  • Tiada model suara
  • Sejarah penjanaan + sunting semula
Daftar Masuk
Pro
  • Fail sumber sehingga 30 minit
  • Teks penggantian 100,000-aksara
  • Baris gilir GPU keutamaan
  • Capaian API (/v1/audio-inpaint/)
  • Melukis secara berkelompok (berbilang julat)
Naik taraf

Soalan Lazim

Pewarnaan dalam audio (juga dipanggil isian audio atau overdub ucapan) membolehkan anda menggantikan bahagian rakaman audio sedia ada dengan ucapan baru yang disintesis AI yang sepadan dengan suara asal. Ia adalah setara audio dengan isian kandungan-sedar Photoshop - lukiskan bahagian yang anda tidak mahu, taip apa yang sepatutnya ada, dan AI menghasilkan penggantian tanpa sekat.

Tandakan julat masa untuk diganti, taip baris dialog baru, dan klik Inpaint. AI kami mengklon suara dari audio yang mengelilingi pemilihan anda, mensintesiskan baris baru dalam suara itu, dan menyambungkannya semula ke dalam rakaman anda dengan pemisahan silang pendek supaya penyuntingan tidak dapat didengar.

Gunakannya bila anda ada satu perkataan buruk, salah ungkapan, nama terlepas, perkataan sumpah, atau ralat fakta dalam satu mengambil yang baik. Menyalin semula keseluruhan bahagian sering memperkenalkan ketidakcocokan nada dengan selebihnya projek - inpainting hanya memperbaiki apa yang perlu diperbaiki sementara menjaga setiap suku kata lain tidak rosak.

Pengguna percuma boleh mewarna fail sehingga 10 minit panjang. Pelanggan boleh mewarna fail sehingga 30 minit. Teks penggantian sendiri dihadkan pada 500 aksara untuk pengguna percuma, 5,000 untuk akaun percuma, dan 100,000 untuk rancangan berbayar.

Sangat dekat. AI menggunakan sehingga 12 saat audio mengelilingi penyuntingan sebagai rujukan suara, yang cukup untuk mana-mana model kami yang mampu klon (OpenVoice, CosyVoice 2) untuk menangkap timbre, nada, dan gaya bercakap pembicara. Untuk hasil terbaik, tinggalkan sekurang-kurangnya 3 saat ucapan bersih segera sebelum titik penyuntingan.

Kami melaksanakan 80ms kelajuan sama-lenyap silang pada kedua-dua titik sambungan (kepala→penggantian dan penggantian→ekor) secara lalai. Anda boleh tetapkan ini dari 0ms (potongan keras) sehingga 250ms melalui pelaris Lenyap silang. Lenyap silang yang lebih panjang menyembunyikan penyuntingan lebih teliti tetapi boleh mencampurkan perkataan tumpang tindih pada sempadan.

Pelukis audio mengikut liputan bahasa yang sama seperti klon suara. Kami memilih secara automatik OpenVoice untuk kebanyakan bahasa dan CosyVoice 2 untuk Cina, Jepun, dan Korea. Anda boleh menetapkan semula model dalam tetapan lanjut.

Anda dikenakan bayaran 500 aksara per saat bagi audio yang digantikan. Pemecah 4 saat berharga 2,000 aksara. Kosnya bebas dari berapa lama teks penggantian, kerana sintesis klon yang mendasari dihalang oleh masa jalan klip baru, bukan panjang teks.

Menurut Terma Perkhidmatan kami, anda hanya boleh melukis audio yang anda miliki atau mempunyai kebenaran eksplisit untuk mengedit. Menjana kutipan palsu, kandungan menipu, atau perbuatan palsu dilarang. Kami tanda air audio yang dihasilkan dan log semua kerja melukis untuk tinjauan penyalahgunaan.

Memotong klip meninggalkan jurang yang ketara dalam pergerakan dan nafas; memotong dua mengambil meninggalkan ketidakcocokan nada. Melukis mengisi jurang dengan ucapan yang sepadan dengan suara sekeliling, jadi pendengar mendengar audio berbunyi semulajadi yang berterusan.

Ya — POST ke /v1/audio-inpaint/ dengan fail audio, start_sec, end_sec, dan replacement_text. Titik akhir mengembalikan UUID kerja; poll /v1/speech/results/?uuid= untuk mendapatkan audio terpahat bila siap. Lihat dokumen API untuk perincian.

ElevenLabs Percakapan-ke-Percakapan memulihkan semula keseluruhan baris suara dari awal dalam suara sasaran. Pewarnaan audio kami adalah pembedahan: ia hanya menyunting julat yang ditanda, menyimpan setiap bait lain dari rakaman asal anda tidak disentuh, dan sepadan klip baru dengan suara sekeliling bukannya pustaka suara terpisah.
5.0/5 (1)

Apa yang boleh kami perbaiki?

Baiki Audio Anda dalam beberapa saat

Ganti mana-mana bahagian rakaman dengan ucapan yang disintesis AI yang sepadan dengan suara asal. Daftar secara percuma untuk mula.