گزارش اشکال / درخواست ویژگی

نقاشی صوتی AI

جایگزین کردن بخش صدا با گفتار ترکیب شده توسط هوش مصنوعی که با صدای اطراف مطابقت دارد. اصلاح یک ضبط بد بدون ضبط مجدد کل چیز.

ثبت نام

هنوز صداهای TTS برای زبان شما نداریم. به ما کمک کنید تا صداهای خودتان را اضافه کنیم! فروش صدای خود

بارگذاری صدا به Inpaint

۵۰۰ کاراکتر در ثانیه از صدا جایگزین شد

پروندۀ خود را به اینجا بکشید و بگذارید ، یا مرور

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

تنظیمات رنگ

آغاز به ثانیه

پایان) ثانیه (

متن جایگزین — آنچه باید در شکاف گفته شود 0 / 500 نویسه‌ها

زبان

ناپدید شدن 80 ms مدت زمان مخلوط کردن نقاط اسپلیک. ۸۰ میلی‌ثانیه پیش‌فرض است — قطع‌های هم‌خوانی طبیعی به نظر می‌رسند، هیچ دوگانه فعال‌سازی شنیداری وجود ندارد.

برای استفاده از رنگ‌آمیزی صوتی رایگان ثبت نام کنید

چگونه صدای نقاشی کار می‌کند

نقاشی کردن معادل صوتی پر کردن محتویات فتوشاپ است. ما صدا را از صدای اطراف انتخاب شما شبیه سازی می‌کنیم ، خط جدید را در آن صدا ترکیب می‌کنیم ، و آن را با یک ناپدید شدن کوتاه به هم وصل می‌کنیم.

بهترین نتایج: حداقل ۳ ثانیه از سخنرانی تمیز را بلافاصله قبل از نقطه ویرایش بگذارید تا کلونر دارای مواد مرجع خوبی باشد.

نکات برای بهترین نتایج

محدوده علامت‌گذاری شده را تا جایی که ممکن است تنگ نگه دارید — فقط در صورتی که بد باشد
متن جایگزین باید تقریباً با همان طولی که جایگزین می‌شود باشد
تنظیم زبان برای تطابق با صدای منبع برای بهترین تطابق صدا
ناپدید شدن متقاطع ۸۰ میلی‌ثانیه معمولاً نامرئی است؛ اگر صدای کلیک را بشنوید ، به ۱۵۰ میلی‌ثانیه بزنید
برای ویرایش‌های طولانی (> ۱۰ ثانیه)، در عوض، دوباره ضبط کردن تمام بخش را در نظر بگیرید

چگونه AI صدای نقاشی کار می‌کند

ویرایش جراحي، صداي هماهنگ، بدون جلسه ضبط مجدد

گام ۱

بارگذاری + علامت زدن محدوده

صدای خود را بارگذاری کنید و از نوار برای نشان دادن آغاز/پایان بخش که می‌خواهید جایگزین کنید استفاده کنید. متن جایگزین را تایپ کنید.

گام دوم

شبیه‌سازی صدا + ترکیب

ما تا 12 ثانيه از صداي مرجع پاک اطراف انتخاب شما رو استخراج ميکنيم صداي سخنگو رو شبيه سازي ميکنيم و خط جديد رو تو اون صدا سنتز ميکنيم

گام ۳

پیوند ناپدید شدن

کلیپ ترکیب شده با یک گذرگاه قدرت برابر در هر دو نقطه ویرایش به ضبط اصلی متصل می‌شود. مرزها شنیده نمی‌شوند.

نقشه‌های رنگ‌آمیزی صوتی

شروع مجانی، ارتقاء وقتی که بیشتر نیاز دارید

آزاد

پرونده‌های منبع تا ۱۰ دقیقه
متن جایگزین ۵۰۰ نویسه‌ای
رنگ‌آمیزی ۴ ثانیه‌ای در هر درخواست
اتصال ناپایدار ۸۰ میلی ثانیه
پشته OpenVoice + CosyVoice ۲Name

محبوب‌ترین

حساب آزاد

پرونده‌های منبع تا ۱۰ دقیقه
متن جایگزین ۵۰۰۰ نویسه‌ای
ناپدید شدن هم‌زمان تنظیم‌پذیر) ۰- ۲۵۰ میلی‌ثانیه (
جایگزینی مدل صدا
تاریخچه تولید + ویرایش مجدد

ثبت نام

حرفه اي

پرونده‌های منبع تا ۳۰ دقیقه
متن جایگزین ۱۰ کاراکتر
صف اولویت GPU
دسترسی API) /v1/audio-inpaint / (
نقاشی دسته) چندین محدوده (

ارتقا

پرسشهای متداول

رنگ آمیزی صوتی (که همچنین به عنوان پر کردن صوتی یا پر کردن صدای فراگیر شناخته می‌شود) به شما اجازه می‌دهد تا بخش‌هایی از یک ضبط صوتی موجود را با گفتار جدیدی که توسط هوش مصنوعی ترکیب شده و با صدای اصلی مطابقت دارد، جایگزین کنید. این معادل صوتی پر کردن محتویات آگاهانه فتوشاپ است - روی قسمتی که نمی‌خواهید نقاشی کنید، آنچه را که باید در آنجا باشد تایپ کنید و هوش مصنوعی جایگزینی بی‌نقصی را تولید می‌کند.

محدوده زمانی را برای جایگزینی علامت بزنید، خط جدید گفتگو را تایپ کنید و روی Inpaint کلیک کنید. هوش مصنوعی ما صدا را از صدای اطراف انتخاب شما شبیه سازی می‌کند، خط جدید را در آن صدا ترکیب می‌کند و آن را با یک ناپدید شدن کوتاه به ضبط شما برمی‌گرداند تا ویرایش شنیده نشود.

از این روش زمانی استفاده کنید که یک کلمه بد، تلفظ اشتباه، لغو نام، کلمه توهین آمیز یا اشتباه در یک صحنه خوب داشته باشید. ضبط مجدد کل متن اغلب باعث عدم تطابق با بقیه پروژه می‌شود — نقاشی کردن فقط آنچه را که نیاز به تصحیح دارد را تصحیح می‌کند در حالی که هر سطر دیگر را سالم نگه می‌دارد.

کاربران رایگان می‌توانند تا ۱۰ دقیقه فایل‌ها را رنگ‌آمیزی کنند. مشترکان می‌توانند تا ۳۰ دقیقه فایل‌ها را رنگ‌آمیزی کنند. متن جایگزین خود حداکثر ۵۰۰ کاراکتر برای کاربران رایگان، ۵۰۰۰ برای حساب‌های رایگان و ۱۰ برای برنامه‌های پرداختی است.

بسیار نزدیک. هوش مصنوعی تا ۱۲ ثانیه از صدای اطراف ویرایش را به عنوان مرجع صدا استفاده می‌کند ، که برای هر یک از مدل‌های قادر به شبیه‌سازی ما (OpenVoice ، CosyVoice ۲) برای ضبط طنین ، ارتفاع و سبک گفتار گوینده کافی است. برای بهترین نتایج ، حداقل ۳ ثانیه از گفتار تمیز را بلافاصله قبل از نقطه ویرایش بگذارید.

ما به صورت پیش‌فرض یک ناپدید شدن متقاطع با قدرت برابر ۸۰ میلی‌ثانیه را در هر دو نقطهٔ پیوند (سر→جایگزینی و جایگزینی→پایان) اعمال می‌کنیم. می‌توانید این را از طریق لغزنده ناپدید شدن متقاطع از ۰ میلی‌ثانیه (برش سخت) تا ۲۵۰ میلی‌ثانیه تنظیم کنید. ناپدید شدن‌های متقاطع طولانی‌تر ویرایش را به‌طور کاملتر پنهان می‌کنند ، اما می‌توانند به صورت شنیداری کلمات همپوشانی را در مرز ترکیب کنند.

رنگ‌آمیزی صوتی ، پوشش زبانی مشابه شبیه‌سازی صدا را دنبال می‌کند. ما به طور خودکار OpenVoice را برای بیشتر زبانها و CosyVoice ۲ را برای چینی ، ژاپنی و کره‌ای انتخاب می‌کنیم. می‌توانید مدل را در تنظیمات پیشرفته جایگزین کنید.

شما ۵۰۰ کاراکتر در ثانیه از صدای جایگزین شده را پرداخت می‌کنید. یک تصحیح ۴ ثانیه ۲۰۰۰ کاراکتر هزینه دارد. هزینه از طول متن جایگزین مستقل است ، زیرا ترکیب شبیه سازی زیرین توسط زمان اجرا کلیپ جدید ، نه طول متن ، کنترل می‌شود.

بر اساس شرایط خدمات ما، شما فقط می‌توانید صدایی را که مالک آن هستید یا اجازه صریح ویرایش دارید را نقاشی کنید. تولید نقل قول‌های جعلی، محتوای فریبنده یا تقلید ممنوع است. ما صدای تولید شده را علامت آبی می‌کنیم و تمام کارهای نقاشی را برای بررسی سوء استفاده ثبت می‌کنیم.

قطع کردن یک کلیپ یک شکاف قابل توجه در سرعت و نفس را به جا می‌گذارد؛ از بین رفتن دو بار یک عدم تطابق نغمی را به جا می‌گذارد.

بله — POST به /v1/audio-inpaint/ با فایل صوتی، start_sec، end_sec، و replacement_text. نقطه پایانی یک UUID کار را برمی‌گرداند؛ برای بازیابی صدای رنگ شده هنگام آماده‌باش، /v1/speech/results/?uuid= را پرس و جو می‌کند. برای جزئیات، مستندات API را ببینید.

یازده آزمایشگاه گفتار به گفتار تمام خط صدا را از صفر در یک صدای هدف بازسازی می‌کند. رنگ آمیزی صوتی ما جراحی است: فقط محدودهٔ مشخص شده را ویرایش می‌کند ، هر بایت دیگر از ضبط اصلی شما را دست نخورده نگه می‌دارد ، و کلیپ جدید را با صدای اطراف مطابقت می‌دهد ، به جای یک کتابخانهٔ صدای جداگانه.

5.0/5 (1)

صدای خود را در چند ثانیه درست کنید

هر قسمتی از هر ضبط را با گفتار ترکیب شده توسط هوش مصنوعی که با صدای اصلی مطابقت دارد جایگزین کنید. برای شروع مجانی ثبت نام کنید.

ثبت نام نمایش قیمت

نقاشی صوتی AI

بارگذاری صدا به Inpaint

منبع صدا — برای پیدا کردن ضبط بد، پاک کنید

تنظیمات رنگ

قبل از) اصل (

بعد از) رنگ‌آمیزی (

چگونه صدای نقاشی کار می‌کند

نکات برای بهترین نتایج

چگونه AI صدای نقاشی کار می‌کند

بارگذاری + علامت زدن محدوده

شبیه‌سازی صدا + ترکیب

پیوند ناپدید شدن

نقشه‌های رنگ‌آمیزی صوتی

پرسشهای متداول

صدای خود را در چند ثانیه درست کنید

نقاشی صوتی AI

بارگذاری صدا به Inpaint

منبع صدا — برای پیدا کردن ضبط بد، پاک کنید

تنظیمات رنگ

قبل از) اصل (

بعد از) رنگ‌آمیزی (

چگونه صدای نقاشی کار می‌کند

نکات برای بهترین نتایج

چگونه AI صدای نقاشی کار می‌کند

بارگذاری + علامت زدن محدوده

شبیه‌سازی صدا + ترکیب

پیوند ناپدید شدن

نقشه‌های رنگ‌آمیزی صوتی

پرسشهای متداول

صوت درون‌نگاري چيه؟

چطور کار ميکنه؟

چه زمانی باید از رنگ آمیزی صوتی به جای ضبط مجدد استفاده کنم؟

مدت زمان پخش صدا چقدر مي تونه باشه؟

آیا سخنرانی نقاشی شده دقیقاً شبیه سخنران اصلی خواهد بود؟

در مرزهای ویرایش چه اتفاقی می‌افتد؟

چه زبانهایی پشتیبانی می‌شوند؟

يه نقاشي صوتي چقدر ميشه؟

مي تونم از اين استفاده کنم تا کلماتي رو که کسي نگفته رو تو دهنش بذارم؟

چرا به جاي حذف بخش بد از نقاشي کردن استفاده ميکني؟

آیا API رنگ آمیزی صوتی در دسترس است؟

این روش در مقایسه با روش‌های دیگر مانند روش‌های شفاهی چگونه است؟

صدای خود را در چند ثانیه درست کنید