نقاشی صوتی AI

جایگزین کردن بخش صدا با گفتار ترکیب شده توسط هوش مصنوعی که با صدای اطراف مطابقت دارد. اصلاح یک ضبط بد بدون ضبط مجدد کل چیز.

هنوز صداهای TTS برای زبان شما نداریم. به ما کمک کنید تا صداهای خودتان را اضافه کنیم! فروش صدای خود

بارگذاری صدا به Inpaint

۵۰۰ کاراکتر در ثانیه از صدا جایگزین شد

پروندۀ خود را به اینجا بکشید و بگذارید ، یا مرور

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

پرونده.mp3

0 MB

منبع صدا — برای پیدا کردن ضبط بد، پاک کنید

0.00s / 0.00s

تنظیمات رنگ

0 / 500 نویسه‌ها
مدت زمان مخلوط کردن نقاط اسپلیک. ۸۰ میلی‌ثانیه پیش‌فرض است — قطع‌های هم‌خوانی طبیعی به نظر می‌رسند، هیچ دوگانه فعال‌سازی شنیداری وجود ندارد.
برای استفاده از رنگ‌آمیزی صوتی رایگان ثبت نام کنید
در حال رنگ‌آمیزی صدا...

...کلوني کردن صدا و ساختن جايگزين

اتصالات
يه مدت طول ميکشه؟ تاریخچه تولید وقتي آماده شدي
آماده‌سازی صدای رنگ‌آمیزی‌شده

قبل از) اصل (

بعد از) رنگ‌آمیزی (

دانلود صدای Inpainted

چگونه صدای نقاشی کار می‌کند

نقاشی کردن معادل صوتی پر کردن محتویات فتوشاپ است. ما صدا را از صدای اطراف انتخاب شما شبیه سازی می‌کنیم ، خط جدید را در آن صدا ترکیب می‌کنیم ، و آن را با یک ناپدید شدن کوتاه به هم وصل می‌کنیم.

بهترین نتایج: حداقل ۳ ثانیه از سخنرانی تمیز را بلافاصله قبل از نقطه ویرایش بگذارید تا کلونر دارای مواد مرجع خوبی باشد.

نکات برای بهترین نتایج

  • محدوده علامت‌گذاری شده را تا جایی که ممکن است تنگ نگه دارید — فقط در صورتی که بد باشد
  • متن جایگزین باید تقریباً با همان طولی که جایگزین می‌شود باشد
  • تنظیم زبان برای تطابق با صدای منبع برای بهترین تطابق صدا
  • ناپدید شدن متقاطع ۸۰ میلی‌ثانیه معمولاً نامرئی است؛ اگر صدای کلیک را بشنوید ، به ۱۵۰ میلی‌ثانیه بزنید
  • برای ویرایش‌های طولانی (> ۱۰ ثانیه)، در عوض، دوباره ضبط کردن تمام بخش را در نظر بگیرید

چگونه AI صدای نقاشی کار می‌کند

ویرایش جراحي، صداي هماهنگ، بدون جلسه ضبط مجدد

گام ۱

بارگذاری + علامت زدن محدوده

صدای خود را بارگذاری کنید و از نوار برای نشان دادن آغاز/پایان بخش که می‌خواهید جایگزین کنید استفاده کنید. متن جایگزین را تایپ کنید.

گام دوم

شبیه‌سازی صدا + ترکیب

ما تا 12 ثانيه از صداي مرجع پاک اطراف انتخاب شما رو استخراج ميکنيم صداي سخنگو رو شبيه سازي ميکنيم و خط جديد رو تو اون صدا سنتز ميکنيم

گام ۳

پیوند ناپدید شدن

کلیپ ترکیب شده با یک گذرگاه قدرت برابر در هر دو نقطه ویرایش به ضبط اصلی متصل می‌شود. مرزها شنیده نمی‌شوند.

نقشه‌های رنگ‌آمیزی صوتی

شروع مجانی، ارتقاء وقتی که بیشتر نیاز دارید

آزاد
  • پرونده‌های منبع تا ۱۰ دقیقه
  • متن جایگزین ۵۰۰ نویسه‌ای
  • رنگ‌آمیزی ۴ ثانیه‌ای در هر درخواست
  • اتصال ناپایدار ۸۰ میلی ثانیه
  • پشته OpenVoice + CosyVoice ۲Name
محبوب‌ترین
حساب آزاد
  • پرونده‌های منبع تا ۱۰ دقیقه
  • متن جایگزین ۵۰۰۰ نویسه‌ای
  • ناپدید شدن هم‌زمان تنظیم‌پذیر) ۰- ۲۵۰ میلی‌ثانیه (
  • جایگزینی مدل صدا
  • تاریخچه تولید + ویرایش مجدد
ثبت نام
حرفه اي
  • پرونده‌های منبع تا ۳۰ دقیقه
  • متن جایگزین ۱۰۰۰۰۰ کاراکتر
  • صف اولویت GPU
  • دسترسی API) /v1/audio-inpaint / (
  • نقاشی دسته) چندین محدوده (
ارتقا

پرسشهای متداول

رنگ آمیزی صوتی (که همچنین به عنوان پر کردن صوتی یا پر کردن صدای فراگیر شناخته می‌شود) به شما اجازه می‌دهد تا بخش‌هایی از یک ضبط صوتی موجود را با گفتار جدیدی که توسط هوش مصنوعی ترکیب شده و با صدای اصلی مطابقت دارد، جایگزین کنید. این معادل صوتی پر کردن محتویات آگاهانه فتوشاپ است - روی قسمتی که نمی‌خواهید نقاشی کنید، آنچه را که باید در آنجا باشد تایپ کنید و هوش مصنوعی جایگزینی بی‌نقصی را تولید می‌کند.

محدوده زمانی را برای جایگزینی علامت بزنید، خط جدید گفتگو را تایپ کنید و روی Inpaint کلیک کنید. هوش مصنوعی ما صدا را از صدای اطراف انتخاب شما شبیه سازی می‌کند، خط جدید را در آن صدا ترکیب می‌کند و آن را با یک ناپدید شدن کوتاه به ضبط شما برمی‌گرداند تا ویرایش شنیده نشود.

از این روش زمانی استفاده کنید که یک کلمه بد، تلفظ اشتباه، لغو نام، کلمه توهین آمیز یا اشتباه در یک صحنه خوب داشته باشید. ضبط مجدد کل متن اغلب باعث عدم تطابق با بقیه پروژه می‌شود — نقاشی کردن فقط آنچه را که نیاز به تصحیح دارد را تصحیح می‌کند در حالی که هر سطر دیگر را سالم نگه می‌دارد.

کاربران رایگان می‌توانند تا ۱۰ دقیقه فایل‌ها را رنگ‌آمیزی کنند. مشترکان می‌توانند تا ۳۰ دقیقه فایل‌ها را رنگ‌آمیزی کنند. متن جایگزین خود حداکثر ۵۰۰ کاراکتر برای کاربران رایگان، ۵۰۰۰ برای حساب‌های رایگان و ۱۰۰۰۰۰ برای برنامه‌های پرداختی است.

بسیار نزدیک. هوش مصنوعی تا ۱۲ ثانیه از صدای اطراف ویرایش را به عنوان مرجع صدا استفاده می‌کند ، که برای هر یک از مدل‌های قادر به شبیه‌سازی ما (OpenVoice ، CosyVoice ۲) برای ضبط طنین ، ارتفاع و سبک گفتار گوینده کافی است. برای بهترین نتایج ، حداقل ۳ ثانیه از گفتار تمیز را بلافاصله قبل از نقطه ویرایش بگذارید.

ما به صورت پیش‌فرض یک ناپدید شدن متقاطع با قدرت برابر ۸۰ میلی‌ثانیه را در هر دو نقطهٔ پیوند (سر→جایگزینی و جایگزینی→پایان) اعمال می‌کنیم. می‌توانید این را از طریق لغزنده ناپدید شدن متقاطع از ۰ میلی‌ثانیه (برش سخت) تا ۲۵۰ میلی‌ثانیه تنظیم کنید. ناپدید شدن‌های متقاطع طولانی‌تر ویرایش را به‌طور کاملتر پنهان می‌کنند ، اما می‌توانند به صورت شنیداری کلمات همپوشانی را در مرز ترکیب کنند.

رنگ‌آمیزی صوتی ، پوشش زبانی مشابه شبیه‌سازی صدا را دنبال می‌کند. ما به طور خودکار OpenVoice را برای بیشتر زبانها و CosyVoice ۲ را برای چینی ، ژاپنی و کره‌ای انتخاب می‌کنیم. می‌توانید مدل را در تنظیمات پیشرفته جایگزین کنید.

شما ۵۰۰ کاراکتر در ثانیه از صدای جایگزین شده را پرداخت می‌کنید. یک تصحیح ۴ ثانیه ۲۰۰۰ کاراکتر هزینه دارد. هزینه از طول متن جایگزین مستقل است ، زیرا ترکیب شبیه سازی زیرین توسط زمان اجرا کلیپ جدید ، نه طول متن ، کنترل می‌شود.

بر اساس شرایط خدمات ما، شما فقط می‌توانید صدایی را که مالک آن هستید یا اجازه صریح ویرایش دارید را نقاشی کنید. تولید نقل قول‌های جعلی، محتوای فریبنده یا تقلید ممنوع است. ما صدای تولید شده را علامت آبی می‌کنیم و تمام کارهای نقاشی را برای بررسی سوء استفاده ثبت می‌کنیم.

قطع کردن یک کلیپ یک شکاف قابل توجه در سرعت و نفس را به جا می‌گذارد؛ از بین رفتن دو بار یک عدم تطابق نغمی را به جا می‌گذارد.

بله — POST به /v1/audio-inpaint/ با فایل صوتی، start_sec، end_sec، و replacement_text. نقطه پایانی یک UUID کار را برمی‌گرداند؛ برای بازیابی صدای رنگ شده هنگام آماده‌باش، /v1/speech/results/?uuid= را پرس و جو می‌کند. برای جزئیات، مستندات API را ببینید.

یازده آزمایشگاه گفتار به گفتار تمام خط صدا را از صفر در یک صدای هدف بازسازی می‌کند. رنگ آمیزی صوتی ما جراحی است: فقط محدودهٔ مشخص شده را ویرایش می‌کند ، هر بایت دیگر از ضبط اصلی شما را دست نخورده نگه می‌دارد ، و کلیپ جدید را با صدای اطراف مطابقت می‌دهد ، به جای یک کتابخانهٔ صدای جداگانه.
5.0/5 (1)

چه چیزی میتونیم بهتر کنیم؟ بازخورد شما به ما کمک میکنه مشکلات رو حل کنیم.

صدای خود را در چند ثانیه درست کنید

هر قسمتی از هر ضبط را با گفتار ترکیب شده توسط هوش مصنوعی که با صدای اصلی مطابقت دارد جایگزین کنید. برای شروع مجانی ثبت نام کنید.