Lapor Pepijat / Permintaan Ciri

Pelukis Audio AI

Ganti bahagian audio dengan ucapan disintesis AI yang sepadan dengan suara sekeliling. Baiki tangkapan yang buruk tanpa merakam semula keseluruhannya.

Daftar Masuk

Kami belum mempunyai suara TTS dalam bahasa anda. Bantu kami tambahkan suara anda! Jual Suara Anda

Muat naik Audio ke Inpaint

500 aksara per saat audio digantikan

Seret dan lepaskan fail anda di sini, atau layari

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

Tetapan Inpaint

Mula (saat)

Akhir (saat)

Teks pengganti — apa yang patut dikatakan dalam ruang kosong 0 / 500 aksara

Bahasa

Pemisah 80 ms Berapa lama untuk mencampurkan titik sambungan. 80ms adalah piawai - potong-padanan terasa semulajadi, tiada pemicu-dua-dengar.

Daftar secara percuma untuk menggunakan inpainting audio

Bagaimana Inpainting Audio Berfungsi

Inpainting adalah setara audio bagi isian sedar-kandungan Photoshop. Kami klon suara dari audio yang mengelilingi pemilihan anda, sintesis baris baru dalam suara itu, dan splice ia semula dengan pemisahan silang pendek.

Hasil terbaik: tinggalkan sekurang- kurangnya 3 saat ucapan bersih segera sebelum titik penyuntingan supaya kloner mempunyai bahan rujukan yang baik.

Panduan untuk Hasil Terbaik

Kekalkan julat yang ditandakan sekuat mungkin — hanya ambil yang buruk
Teks penggantian sepatutnya kira-kira sama panjang dengan apa yang ia ganti
Tetapkan bahasa untuk sepadan dengan audio sumber untuk sepadan suara terbaik
80ms crossfade biasanya tidak kelihatan; bump ke 150ms jika anda dengar klik
Untuk penyuntingan panjang (>10s), pertimbangkan untuk merakam semula keseluruhan laluan

Bagaimana Pelukis Audio AI Berfungsi

Penyuntingan pembedahan, suara-cocok, tanpa sesi rekaman semula.

Langkah 1

Muat naik + Tandakan Julat

Muat naik audio anda dan gunakan pelembap untuk menandakan permulaan/akhir bahagian yang anda ingin ganti. Taip teks penggantian.

Langkah 2

Klon Suara + Sintetis

Kami mengekstrak sehingga 12 saat audio rujukan bersih mengelilingi pemilihan anda, klon suara pembicara, dan mensintesis baris baru dalam suara itu.

Langkah 3

Splice Crossfade

Klip yang disintesis disambungkan ke dalam rakaman asal dengan pemisahan bertindih kuasa sama pada kedua-dua titik penyuntingan. Batas tidak dapat didengar.

Reka Bentuk Inpenting Audio

Mulakan percuma, naik taraf bila anda perlukan lebih

Bebas

Fail sumber sehingga 10 minit
Teks pengganti 500-aksara
4-saat inpaint per permintaan
Splice 80ms crossfade
Backend OpenVoice + CosyVoice 2

Paling Popular

Akaun Bebas

Fail sumber sehingga 10 minit
Teks pengganti 5,000-aksara
Pemisah-silang boleh diset (0-250ms)
Tiada model suara
Sejarah penjanaan + sunting semula

Daftar Masuk

Pro

Fail sumber sehingga 30 minit
Teks penggantian 100,000-aksara
Baris gilir GPU keutamaan
Capaian API (/v1/audio-inpaint/)
Melukis secara berkelompok (berbilang julat)

Naik taraf

Soalan Lazim

Pewarnaan dalam audio (juga dipanggil isian audio atau overdub ucapan) membolehkan anda menggantikan bahagian rakaman audio sedia ada dengan ucapan baru yang disintesis AI yang sepadan dengan suara asal. Ia adalah setara audio dengan isian kandungan-sedar Photoshop - lukiskan bahagian yang anda tidak mahu, taip apa yang sepatutnya ada, dan AI menghasilkan penggantian tanpa sekat.

Tandakan julat masa untuk diganti, taip baris dialog baru, dan klik Inpaint. AI kami mengklon suara dari audio yang mengelilingi pemilihan anda, mensintesiskan baris baru dalam suara itu, dan menyambungkannya semula ke dalam rakaman anda dengan pemisahan silang pendek supaya penyuntingan tidak dapat didengar.

Gunakannya bila anda ada satu perkataan buruk, salah ungkapan, nama terlepas, perkataan sumpah, atau ralat fakta dalam satu mengambil yang baik. Menyalin semula keseluruhan bahagian sering memperkenalkan ketidakcocokan nada dengan selebihnya projek - inpainting hanya memperbaiki apa yang perlu diperbaiki sementara menjaga setiap suku kata lain tidak rosak.

Pengguna percuma boleh mewarna fail sehingga 10 minit panjang. Pelanggan boleh mewarna fail sehingga 30 minit. Teks penggantian sendiri dihadkan pada 500 aksara untuk pengguna percuma, 5,000 untuk akaun percuma, dan 100,000 untuk rancangan berbayar.

Sangat dekat. AI menggunakan sehingga 12 saat audio mengelilingi penyuntingan sebagai rujukan suara, yang cukup untuk mana-mana model kami yang mampu klon (OpenVoice, CosyVoice 2) untuk menangkap timbre, nada, dan gaya bercakap pembicara. Untuk hasil terbaik, tinggalkan sekurang-kurangnya 3 saat ucapan bersih segera sebelum titik penyuntingan.

Kami melaksanakan 80ms kelajuan sama-lenyap silang pada kedua-dua titik sambungan (kepala→penggantian dan penggantian→ekor) secara lalai. Anda boleh tetapkan ini dari 0ms (potongan keras) sehingga 250ms melalui pelaris Lenyap silang. Lenyap silang yang lebih panjang menyembunyikan penyuntingan lebih teliti tetapi boleh mencampurkan perkataan tumpang tindih pada sempadan.

Pelukis audio mengikut liputan bahasa yang sama seperti klon suara. Kami memilih secara automatik OpenVoice untuk kebanyakan bahasa dan CosyVoice 2 untuk Cina, Jepun, dan Korea. Anda boleh menetapkan semula model dalam tetapan lanjut.

Anda dikenakan bayaran 500 aksara per saat bagi audio yang digantikan. Pemecah 4 saat berharga 2,000 aksara. Kosnya bebas dari berapa lama teks penggantian, kerana sintesis klon yang mendasari dihalang oleh masa jalan klip baru, bukan panjang teks.

Menurut Terma Perkhidmatan kami, anda hanya boleh melukis audio yang anda miliki atau mempunyai kebenaran eksplisit untuk mengedit. Menjana kutipan palsu, kandungan menipu, atau perbuatan palsu dilarang. Kami tanda air audio yang dihasilkan dan log semua kerja melukis untuk tinjauan penyalahgunaan.

Memotong klip meninggalkan jurang yang ketara dalam pergerakan dan nafas; memotong dua mengambil meninggalkan ketidakcocokan nada. Melukis mengisi jurang dengan ucapan yang sepadan dengan suara sekeliling, jadi pendengar mendengar audio berbunyi semulajadi yang berterusan.

Ya — POST ke /v1/audio-inpaint/ dengan fail audio, start_sec, end_sec, dan replacement_text. Titik akhir mengembalikan UUID kerja; poll /v1/speech/results/?uuid= untuk mendapatkan audio terpahat bila siap. Lihat dokumen API untuk perincian.

ElevenLabs Percakapan-ke-Percakapan memulihkan semula keseluruhan baris suara dari awal dalam suara sasaran. Pewarnaan audio kami adalah pembedahan: ia hanya menyunting julat yang ditanda, menyimpan setiap bait lain dari rakaman asal anda tidak disentuh, dan sepadan klip baru dengan suara sekeliling bukannya pustaka suara terpisah.

5.0/5 (1)

Baiki Audio Anda dalam beberapa saat

Ganti mana-mana bahagian rakaman dengan ucapan yang disintesis AI yang sepadan dengan suara asal. Daftar secara percuma untuk mula.

Daftar Masuk Lihat Harga

Pelukis Audio AI

Muat naik Audio ke Inpaint

Sumber audio — gosok untuk cari ambil yang buruk

Tetapan Inpaint

Sebelum (Asli)

Selepas (Dilukis)

Bagaimana Inpainting Audio Berfungsi

Panduan untuk Hasil Terbaik

Bagaimana Pelukis Audio AI Berfungsi

Muat naik + Tandakan Julat

Klon Suara + Sintetis

Splice Crossfade

Reka Bentuk Inpenting Audio

Soalan Lazim

Baiki Audio Anda dalam beberapa saat

Pelukis Audio AI

Muat naik Audio ke Inpaint

Sumber audio — gosok untuk cari ambil yang buruk

Tetapan Inpaint

Sebelum (Asli)

Selepas (Dilukis)

Bagaimana Inpainting Audio Berfungsi

Panduan untuk Hasil Terbaik

Bagaimana Pelukis Audio AI Berfungsi

Muat naik + Tandakan Julat

Klon Suara + Sintetis

Splice Crossfade

Reka Bentuk Inpenting Audio

Soalan Lazim

Apa itu inpainting audio?

Bagaimana ia berfungsi?

Bilakah saya patut menggunakan inpainting audio bukannya rekaman semula?

Berapa lama audio sumber boleh?

Adakah ucapan yang dilukis akan berbunyi sama seperti pembicara asal?

Apa yang berlaku pada sempadan penyuntingan?

Bahasa apa yang disokong?

Berapakah kos melukis audio?

Bolehkah saya menggunakan ini untuk meletakkan kata-kata di mulut seseorang yang mereka tidak pernah berkata?

Kenapa gunakan inpainting bukannya hanya memadam bahagian yang rosak?

Adakah API inpainting audio tersedia?

Bagaimana ini dibandingkan dengan ElevenLabs Speech-to-Speech?

Baiki Audio Anda dalam beberapa saat