AI অডিও ইনপেইন্টিং

অডিও অংশটিকে AI-সংমিশ্রিত কথার সাথে প্রতিস্থাপন করুন যা চারপাশের শব্দের সাথে মিলবে। পুরো রেকর্ডটি পুনরায় রেকর্ড না করেই একটি খারাপ টেক ঠিক করুন।

নিবন্ধন করুন

অডিও ইনপেইন্ট-এ আপলোড করুন

প্রতি সেকেন্ডে ৫০০ অক্ষর অডিও প্রতিস্থাপন করা হয়েছে

আপনার ফাইল এখানে টেনে নিয়ে যান, অথবা ব্রাউজ

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

ইনপেইন্ট সেটিংস

আরম্ভ (সেকেন্ড)

শেষ (সেকেন্ড)

প্রতিস্থাপন টেক্সট — ফাঁকা স্থানে কী বলা উচিত 0 / 500 অক্ষর

ভাষা

ক্রসফেড 80 ms স্প্লাস বিন্দু কতক্ষণ মিশ্রিত করা হবে। ডিফল্ট মান ৮০ মিলিসেকেন্ড। ম্যাচ-কাট করা হলে স্বাভাবিক অনুভূতি হবে, কোন শব্দবিহীন দ্বৈত-ট্র্যাগার হবে না।

অডিও ইনপেইন্টিং ব্যবহার করতে বিনামূল্যে নিবন্ধন করুন

অডিও ইনপেইন্টিং কিভাবে কাজ করে

ইনপেইন্টিং হচ্ছে ফোটোশপের বিষয়বস্তু-সচেতন ভর্তির অডিও সমতুল্য। আমরা আপনার নির্বাচনের চারপাশের অডিও থেকে শব্দ ক্লোন করি, সেই শব্দের নতুন লাইন সংশ্লেষণ করি, এবং এটিকে একটি সংক্ষিপ্ত ক্রসফেডের সাথে পুনরায় সংযুক্ত করি।

সেরা ফলাফল: সম্পাদন বিন্দুর ঠিক আগে অন্তত ৩ সেকেন্ডের পরিষ্কার কথা বলার সুযোগ দিন যাতে ক্লোনারের কাছে ভাল রেফারেন্স উপাদান থাকে।

সর্বোত্তম ফলাফল পেতে টিপস

চিহ্নিত পরিসীমা যতটা সম্ভব সংকীর্ণ রাখুন - শুধুমাত্র খারাপ টেক
প্রতিস্থাপনের টেক্সটটি প্রতিস্থাপনের জন্য ব্যবহৃত টেক্সটের সমান লম্বা হওয়া উচিত
সর্বোত্তম শব্দের মিল পাওয়ার জন্য উৎস অডিও-র সাথে মিলবে এমন ভাষা নির্ধারণ করুন
৮০মি. সে. ক্রসফেড সাধারণত অদৃশ্য; আপনি যদি ক্লিক শুনতে পান তবে ১৫০মি. সে.-এ বাম্প করুন
দীর্ঘ সম্পাদনার জন্য (>১০ সেকেন্ড), এর পরিবর্তে সম্পূর্ণ অংশটি পুনরায় রেকর্ড করার কথা বিবেচনা করুন

AI অডিও ইনপেইন্টিং কিভাবে কাজ করে

সার্জারির মাধ্যমে সম্পাদনা, কণ্ঠের সাথে মিল, আর কোন রেকর্ডিং সেশন নেই।

১ম ধাপ

আপলোড + চিহ্নিত এলাকা

আপনার অডিও আপলোড করুন এবং আপনি যে অংশটি প্রতিস্থাপন করতে চান তার শুরু/শেষ চিহ্নিত করতে স্ক্রাবার ব্যবহার করুন। প্রতিস্থাপনের জন্য লেখা লিখুন।

২য় ধাপ

শব্দ ক্লোন + সংশ্লেষণ

আমরা আপনার নির্বাচনের চারপাশে ১২ সেকেন্ড পর্যন্ত পরিষ্কার রেফারেন্স অডিও বের করি, স্পিকারের কণ্ঠের ক্লোন করি এবং সেই কণ্ঠে নতুন লাইন সংশ্লেষণ করি।

৩য় ধাপ

ক্রসফেড স্প্লিস

সংশ্লেষিত ক্লিপটি মূল রেকর্ডের সাথে সংযুক্ত করা হবে, উভয় সম্পাদনা বিন্দুতে সমান শক্তির ক্রসফেডের মাধ্যমে। সীমানাগুলো শোনা যাবে না।

অডিও ইনপেইন্টিং পরিকল্পনা

বিনামূল্যে শুরু করুন, আরো প্রয়োজন হলে আপগ্রেড করুন

মুক্ত

১০ মিনিটের উৎস ফাইল
৫০০ অক্ষরের প্রতিস্থাপন টেক্সট
প্রতি অনুরোধের জন্য ৪- সেকেন্ডের ইনপেইন্ট
৮০ms ক্রসফেড স্প্লিস
OpenVoice + CosyVoice ২ ব্যাকএন্ড

সবচেয়ে জনপ্রিয়

ফ্রি অ্যাকাউন্ট

১০ মিনিটের উৎস ফাইল
৫,০০০ অক্ষরের প্রতিস্থাপন টেক্সট
টুনযোগ্য ক্রসফেড (০-২৫০মি. সে.)
শব্দ-মডেল অগ্রাহ্য করা হবে
উৎপাদন ইতিহাস + পুনরায় সম্পাদন

নিবন্ধন করুন

প্রফেশনাল

৩০ মিনিটের উৎস ফাইল
১০০,০০০ অক্ষরের প্রতিস্থাপন টেক্সট
অগ্রাধিকারযুক্ত GPU কলাম
API প্রবেশাধিকার (/v1/audio-inpaint/)
ব্যাচ চিত্র আঁকা (বহুমাত্রিক)

উন্নীতকরণ

প্রায়শ জিজ্ঞাসিত প্রশ্ন

অডিও ইনপেইন্টিং (অডিও ফিল বা স্পিকার ওভারড্যাব নামেও পরিচিত) আপনাকে একটি বিদ্যমান অডিও রেকর্ডের একটি অংশকে নতুন AI-সংশ্লেষিত কথা দ্বারা প্রতিস্থাপন করতে দেয় যা মূল কন্ঠের সাথে মিলবে। এটি ফটোশপের বিষয়বস্তু-সচেতন ফিল-এর অডিও সমতুল্য - আপনি যে অংশের উপরে আঁকা চান না, তার পরিবর্তে সেখানে যা থাকা উচিত তা টাইপ করুন, এবং AI একটি নিখুঁত প্রতিস্থাপন তৈরি করে।

প্রতিস্থাপনের জন্য সময়সীমা চিহ্নিত করুন, ডায়ালগের নতুন লাইন টাইপ করুন এবং ইনপেইন্ট ক্লিক করুন। আমাদের AI আপনার নির্বাচনের চারপাশের অডিও থেকে কন্ঠ ক্লোন করে, সেই কন্ঠের নতুন লাইন সংশ্লেষিত করে এবং এটি আপনার রেকর্ডিংয়ে একটি সংক্ষিপ্ত ক্রসফেডের সাথে পুনরায় সংযুক্ত করে যাতে সম্পাদনাটি অদৃশ্য হয়।

যখন আপনার কাছে একটি খারাপ শব্দ, ভুল উচ্চারণ, নামের ছিদ্র, শপথ শব্দ, অথবা অন্যথায় ভাল টেকে তথ্যের ভুল থাকে তখন এটি ব্যবহার করুন। সমগ্র অংশটি পুনরায় রেকর্ড করা প্রকল্পের বাকি অংশের সাথে প্রায়শই টোন মিসমেচ প্রবেশ করায় - ইনপেইন্টিং শুধুমাত্র যা ঠিক করার প্রয়োজন তা ঠিক করে, অন্য সব শব্দাংশ অক্ষত রাখে।

ফ্রি ব্যবহারকারীরা ১০ মিনিট পর্যন্ত ফাইল আঁকা করতে পারেন। সাবস্ক্রাইবাররা ৩০ মিনিট পর্যন্ত ফাইল আঁকা করতে পারেন। প্রতিস্থাপন টেক্সটটি ফ্রি ব্যবহারকারীদের জন্য ৫০০ অক্ষর, ফ্রি অ্যাকাউন্টের জন্য ৫,০০০ অক্ষর এবং পে-পাইড প্ল্যানের জন্য ১০০,০০০ অক্ষর পর্যন্ত সীমাবদ্ধ।

খুবই নিকটবর্তী। AI-এর জন্য সম্পাদনকে ঘিরে ১২ সেকেন্ডের অডিও ব্যবহার করা হয়, যা আমাদের ক্লোনিং-সক্ষম মডেল (ওপেনভয়েস, কোসিভয়েস ২)-এর জন্য যথেষ্ট, যা স্পিকারের টাইমব্রে, পিট এবং কথা বলার ধরন ধারণ করতে পারে। সর্বোত্তম ফলাফল পেতে, সম্পাদন বিন্দুর ঠিক আগে অন্তত ৩ সেকেন্ডের পরিষ্কার কথা বলার সময় রাখুন।

ডিফল্টভাবে আমরা উভয় স্প্লিস পয়েন্টে (হেড→রিপ্লেসমেন্ট এবং রিপ্লেসমেন্ট→টেল) ৮০ মিলিসেকেন্ডের সম-শক্তি ক্রসফেড প্রয়োগ করি। ক্রসফেড স্লাইডার ব্যবহার করে আপনি এটি ০ মিলিসেকেন্ড থেকে ২৫০ মিলিসেকেন্ড পর্যন্ত টুল করতে পারেন। দীর্ঘ ক্রসফেড সম্পাদনাকে আরও ভালভাবে লুকিয়ে রাখে কিন্তু সীমানায় ওভারল্যাপিং শব্দগুলোকে শোনা যায়।

অডিও ইনপেইন্টিং শব্দের ক্লোনিং-এর মতো একই ভাষার কভারেজ অনুসরণ করে। আমরা অধিকাংশ ভাষার জন্য স্বয়ংক্রিয়ভাবে ওপেনভয়েস এবং চীনা, জাপানি এবং কোরীয় ভাষার জন্য কোসিভয়েস ২ বেছে নিই। আপনি উন্নত সেটিংস-এ মডেলটি অগ্রাহ্য করতে পারেন।

প্রতি সেকেন্ডে প্রতিস্থাপনকৃত অডিওতে ৫০০ অক্ষরের জন্য আপনাকে অর্থ প্রদান করতে হবে। ৪ সেকেন্ডের একটি সংশোধন ২,০০০ অক্ষরের মূল্য। প্রতিস্থাপনকৃত টেক্সটের দৈর্ঘ্য থেকে এই মূল্য মুক্ত, যেহেতু ক্লোন সংশ্লেষণ নতুন ক্লিপের র‍্যান্ডম সময় দ্বারা নিয়ন্ত্রিত হয়, টেক্সটের দৈর্ঘ্য দ্বারা নয়।

আমাদের পরিষেবা শর্ত অনুযায়ী, আপনি কেবলমাত্র আপনার নিজস্ব অডিও বা সম্পাদনার জন্য স্পষ্ট অনুমতিপ্রাপ্ত অডিও ইনপেইন্ট করতে পারবেন। ভুয়া উদ্ধৃতি, বিভ্রান্তিকর বিষয়বস্তু বা অনুকরণ করা নিষিদ্ধ। আমরা অডিও তৈরির সময় ওয়াটারমার্ক করি এবং অব্যবহারের জন্য পর্যালোচনার জন্য সকল ইনপেইন্টিং কাজ লগ করি।

একটি ক্লিপ কাটা হলে, তাপমাত্রা এবং শ্বাস প্রশ্বাসের মধ্যে একটি উল্লেখযোগ্য ফাঁক তৈরি হয়; দুইটি ধারণার মধ্যে ক্রস-ফেডিং হলে, শব্দের মিল না থাকার ফলে। ইনপেইন্টিং এই ফাঁকটিকে এমনভাবে পূর্ণ করে যে, শব্দটি চারপাশের শব্দের সাথে মিলবে, যাতে দর্শক অবিরাম, প্রাকৃতিক শব্দের অডিও শুনতে পারে।

হ্যাঁ — অডিও ফাইল, start_sec, end_sec এবং replacement_text সহযোগে /v1/audio-inpaint/ এ POST করুন। শেষ বিন্দু একটি কাজ UUID ফিরিয়ে দেয়; প্রস্তুত হলে অডিও পেইন্ট করা পুনরুদ্ধার করার জন্য /v1/speech/results/?uuid= পল করে। বিস্তারিত জানতে API ডকুমেন্ট দেখুন।

ElevenLabs Speech-to-Speech একটি লক্ষ্যস্বরে সম্পূর্ণ ভয়েস লাইনটি শূন্য থেকে পুনরুদ্ধার করে। আমাদের অডিও ইনপেইন্টিং সার্জারি: এটি শুধুমাত্র চিহ্নিত পরিসর সম্পাদনা করে, আপনার মূল রেকর্ডের প্রতিটি বাইট অক্ষত রাখে এবং একটি পৃথক ভয়েস লাইব্রেরির পরিবর্তে নতুন ক্লিপটিকে চারপাশের ভয়েসের সাথে মেলে।

5.0/5 (1)

সেকেন্ডের মধ্যে আপনার অডিও ঠিক করুন

যেকোন রেকর্ডের যেকোন অংশকে AI-সংমিশ্রিত কথার সাথে প্রতিস্থাপন করুন যা মূল শব্দের সাথে মিলবে। শুরু করতে বিনামূল্যে নিবন্ধন করুন।

নিবন্ধন করুন মূল্য প্রদর্শন

AI অডিও ইনপেইন্টিং

অডিও ইনপেইন্ট-এ আপলোড করুন

উৎস অডিও — খারাপ টেক খুঁজে বের করতে স্ক্রাব করুন

ইনপেইন্ট সেটিংস

পূর্বে (প্রকৃত)

পরে (অঙ্কিত)

অডিও ইনপেইন্টিং কিভাবে কাজ করে

সর্বোত্তম ফলাফল পেতে টিপস

AI অডিও ইনপেইন্টিং কিভাবে কাজ করে

আপলোড + চিহ্নিত এলাকা

শব্দ ক্লোন + সংশ্লেষণ

ক্রসফেড স্প্লিস

অডিও ইনপেইন্টিং পরিকল্পনা

প্রায়শ জিজ্ঞাসিত প্রশ্ন

সেকেন্ডের মধ্যে আপনার অডিও ঠিক করুন

AI অডিও ইনপেইন্টিং

অডিও ইনপেইন্ট-এ আপলোড করুন

উৎস অডিও — খারাপ টেক খুঁজে বের করতে স্ক্রাব করুন

ইনপেইন্ট সেটিংস

পূর্বে (প্রকৃত)

পরে (অঙ্কিত)

অডিও ইনপেইন্টিং কিভাবে কাজ করে

সর্বোত্তম ফলাফল পেতে টিপস

AI অডিও ইনপেইন্টিং কিভাবে কাজ করে

আপলোড + চিহ্নিত এলাকা

শব্দ ক্লোন + সংশ্লেষণ

ক্রসফেড স্প্লিস

অডিও ইনপেইন্টিং পরিকল্পনা

প্রায়শ জিজ্ঞাসিত প্রশ্ন

অডিও ইনপেইন্টিং কি?

এটা কিভাবে কাজ করে?

পুনরায় রেকর্ড করার পরিবর্তে কখন অডিও ইনপেইন্টিং ব্যবহার করা উচিত?

উৎস অডিও কতটা দীর্ঘ হতে পারে?

চিত্রিত ভাষণের শব্দ কি আসল ভাষকের মতোই হবে?

সম্পাদন সীমানায় কি ঘটে?

কোন ভাষা সমর্থিত?

অডিও ইনপেইন্টিং এর খরচ কত?

আমি কি এটা দিয়ে কারো মুখে এমন কথা ঢুকিয়ে দিতে পারি যেটা তারা কখনো বলেনি?

কেন শুধুমাত্র খারাপ অংশ মুছে ফেলার পরিবর্তে ইনপেইন্টিং ব্যবহার করা হবে?

অডিও ইনপেইন্টিং API কি উপলব্ধ?

এলিভেনল্যাবস্‌ স্পিকার-টু-স্পিকারের সাথে এর তুলনা কিভাবে হবে?

সেকেন্ডের মধ্যে আপনার অডিও ঠিক করুন