AI Ses Resimlendirme

Ses parçasının yerini çevredeki sesle eşleşen yapay zeka sentezli konuşma ile değiştir. Kötü bir kaydı tümünü yeniden kaydetmeden düzeltin.

Sesleri Inpaint' e Yükle

Saniyede 500 karakterlik ses değiştirildi

Dosyanızı buraya çekin ve bırakın, ya da browse

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

dosya.mp3

0 MB

Kaynak ses — kötü çekimi bulmak için temizle

0.00s / 0.00s

Resim Ayarları

0 / 500 karakter
Bağlama noktalarının karışımı ne kadar sürer. Varsayılan değer 80ms - eşleştirme kesimi doğal hissettiriyor, duyulan çift tetikleme yok.
Sesli resimlemeyi kullanmak için ücretsiz olarak kayıt olun
Ses boyanıyor...

Sesi klonlamak ve yerine yenisini sentezlemek...

Slice → çevredeki sesin klonlanması → crossfade ile birleşme
Bir süre alıyor mu? üretim tarihi Hazır olduğunda.
Ses hazır

Önce (Orjinal)

Sonra (Boyanmış)

Sesli İndir

Ses Resimleme Nasıl Çalışıyor

Resim içi doldurma, Photoshop'un içerik bilinçli doldurma işleminin ses eşdeğeridir. Seçiminizin etrafındaki seslerden sesini klonlar, o sesteki yeni satırı sentezler ve kısa bir geçişle geri birleştirir.

En iyi sonuçlar: klonlama makinesi iyi referans malzemesine sahip olsun diye düzenleme noktasından hemen önce en az 3 saniye temiz konuşma bırakın.

En İyi Sonuçlar İçin Öneriler

  • Marked range as tight as possible — only the bad take
  • Yer değiştiren metin, yerine koyduğu şeyle yaklaşık aynı uzunlukta olmalıdır
  • En iyi ses eşleşmesi için kaynak sesle eşleyecek dil ayarları
  • 80ms crossfade genellikle görünmez; bir tıklama duyarsanız 150ms' e yükseltin
  • Uzun düzenlemeler için (>10s), bunun yerine tüm bölümü yeniden kaydetmeyi düşünün

Yapay Zeka Ses Resimleme Nasıl Çalışıyor

Cerrahi düzenlemeler, ses eşleştirmeleri, tekrar kayıt olmadan.

1. Adım

Yükle + Aralığı İşaretle

Sesinizi yükleyin ve değiştirmek istediğiniz bölümün başlangıcı/sonunu işaretlemek için sıçramayı kullanın. Yerleşik metni girin.

2. Adım

Ses Klonlama + Seçim

Seçiminizi çevreleyen 12 saniyelik temiz referans ses çıkarırız, konuşanın sesini klonlarız ve o sesin yeni satırını sentezleriz.

Adım 3

Crossfade Karışımı

Sintezlerken, sentezlenen klip, her iki düzenleme noktasında da eşit güçte bir geçişle orijinal kayıtla birleşir. Sınırlar duyulmaz.

Ses Resim Planları

Bedava başla, daha fazlasına ihtiyacın olduğunda yükselt

Özgür
  • 10 dakikaya kadar kaynak dosyaları
  • 500 karakterlik değiştirme metni
  • İstek başına 4 saniyelik resimleme
  • 80ms crossfade splice
  • OpenVoice + CosyVoice 2 arka planları
En Popüler
Bedava Hesap
  • 10 dakikaya kadar kaynak dosyaları
  • 5000 karakterlik değiştirme metni
  • Düzenlenebilir crossfading (0-250ms)
  • Ses modeli üst üste gelmesi
  • Üretim geçmişi + yeniden düzenleme
Ücretsiz kayıt ol
Pro
  • 30 dakikaya kadar kaynak dosyaları
  • 100.000 karakterlik değiştirme metni
  • Öncelik GPU kuyruğu
  • API erişimi (/v1/audio-inpaint/)
  • Grup resimleme (çoklu aralıklarla)
Üst düzeye çıkar

Sıkça Sorulan Sorular

Ses doldurma (audio fill veya speech overdub olarak da adlandırılır) mevcut bir ses kayıtının bir bölümünü orijinal sesle eşleşen yeni yapay zeka sentezli konuşmayla değiştirmenizi sağlar. Bu, Photoshop'un içerik bilinçli doldurmasının ses eşdeğeridir - istemediğiniz kısmı boyayın, yerine ne olmalı olduğunu yazın ve yapay zeka bir dizilimsiz değiştirme oluşturur.

Yer değiştirmek istediğiniz zaman aralığını işaretleyin, yeni diyalog satırı yazın ve Resmet'e tıklayın. Yapay zekamız seçtiğiniz sesin etrafındaki sesleri klonlar, o sesin yeni satırını sentezler ve kısa bir geçişle kayıtınıza geri bağlar, böylece düzenleme işitilmez olur.

Tek bir kötü kelime, yanlış telaffuz, isim kaybı, küfür kelimesi veya diğer yönden iyi bir kayda sahipken bu özelliği kullanın. Tüm bölümü tekrar kaydetmek çoğu zaman projenin geri kalanıyla ton eşleşmesini getirir - inpainting sadece düzeltilmesi gerekenleri düzeltirken diğer tüm heceleri bozulmadan tutar.

Ücretsiz kullanıcılar 10 dakikaya kadar dosyaları inpaint edebilir. Üyeler 30 dakikaya kadar dosyaları inpaint edebilir. Yedekleme metin kendisi ücretsiz kullanıcılar için 500 karakter, ücretsiz hesaplar için 5.000 ve ücretli planlar için 100.000 karakterle sınırlıdır.

Çok yakın. AI, düzenlemeyi çevreleyen 12 saniyelik ses parçasını ses referansı olarak kullanır, bu da konuşmacının timbre, ses tonu ve konuşma tarzını yakalamak için klonlama yeteneği olan herhangi bir modelimiz (OpenVoice, CosyVoice 2) için yeterlidir. En iyi sonuçlar için, düzenleme noktasından hemen önce en az 3 saniye temiz konuşma bırakın.

Varsayılan olarak her iki birleşme noktasında (baş→değiştir ve değiştir→kuyruk) 80ms eşit güçte bir karışık soyulma uyguluyoruz. Bu değeri Karışık Soyulma kaydırıcısıyla 0ms (sert kesme) ile 250ms arasında ayarlayabilirsiniz. Uzun karışık soyulmalar düzenlemeyi daha iyi gizler ama sınırda örtüşen kelimeleri sesli olarak karıştırabilir.

Ses renklendirmesi ses klonlamasıyla aynı dil kaplamasını izler. Çoğu dil için OpenVoice'ı ve Çince, Japonca ve Korece için CosyVoice 2'yi otomatik olarak seçiyoruz. Modeli ileri ayarlarda üstesinden gelebilirsin.

Saniyede 500 karakterlik ses değiştirme ücreti ödüyorsunuz. 4 saniyelik bir düzeltme 2000 karaktere mal oluyor. Bu ücret, değiştirilen metin ne kadar uzunsa o kadar pahalı, çünkü altta yatan klon sentezi yeni klipin çalışma süresi tarafından kontrol ediliyor, metin uzunluğu değil.

Hizmet Şartlarımıza göre, sadece sahip olduğunuz veya düzenleme izniniz olan sesleri resimleyebiliyorsunuz. Sahte alıntı, aldatıcı içerik veya sahte kimlik oluşturmak yasak. Yaratılan sesleri su damgası ile işaretliyoruz ve tüm resimleme işlerini kötüye kullanım incelemesi için kaydediyoruz.

Bir klip kesmek tempo ve nefes alımda fark edilebilir bir boşluk bırakır; iki alımın birbiriyle karışması tonlarda bir uyumsuzluk bırakır. İçe dövme boşluğu çevredeki sesiyle uyumlu olan konuşmayla doldurur, böylece dinleyiciler sürekli, doğal ses duyarlar.

Evet — Ses dosyası, start_sec, end_sec ve replacement_text ile /v1/audio-inpaint/'e POST yap. Son nokta bir iş UUID'i geri verir; hazır olduğunda boyanmış sesleri almak için /v1/speech/results/?uuid='ı sorgular. Detaylar için API belgelerine bakınız.

ElevenLabs Speech-to-Speech, hedef sesin tüm ses çizgisini sıfırdan yeniden üretir. Ses renklendirmemiz cerrahidir: sadece işaretlenen aralığı düzenler, orijinal kayıtınızın diğer her baytını dokunmadan tutar ve yeni klipleri ayrı bir ses kütüphanesi yerine çevresindeki seslerle eşleştirir.
5.0/5 (1)

Neyi geliştirebiliriz?

Sesinizi saniyeler içinde düzeltin

Herhangi bir kayıt parçasının yerini orijinal sesiyle eşleşen yapay zeka sentezli konuşma ile değiştirin. Başlamak için ücretsiz olarak kayıt olun.