AI অডিও ইনপেইন্টিং

অডিও অংশটিকে AI-সংমিশ্রিত কথার সাথে প্রতিস্থাপন করুন যা চারপাশের শব্দের সাথে মিলবে। পুরো রেকর্ডটি পুনরায় রেকর্ড না করেই একটি খারাপ টেক ঠিক করুন।

আপনার ভাষায় এখনো TTS শব্দ নেই। আমাদের আপনার শব্দ যোগ করতে সাহায্য করুন! আপনার কণ্ঠ বিক্রি করুন

অডিও ইনপেইন্ট-এ আপলোড করুন

প্রতি সেকেন্ডে ৫০০ অক্ষর অডিও প্রতিস্থাপন করা হয়েছে

আপনার ফাইল এখানে টেনে নিয়ে যান, অথবা ব্রাউজ

Supports MP3, WAV, FLAC, OGG, M4A. Max 500 MB (2 GB on paid plans). Up to 10 minutes.

ফাইল.mp3

0 MB

উৎস অডিও — খারাপ টেক খুঁজে বের করতে স্ক্রাব করুন

0.00s / 0.00s

ইনপেইন্ট সেটিংস

0 / 500 অক্ষর
স্প্লাস বিন্দু কতক্ষণ মিশ্রিত করা হবে। ডিফল্ট মান ৮০ মিলিসেকেন্ড। ম্যাচ-কাট করা হলে স্বাভাবিক অনুভূতি হবে, কোন শব্দবিহীন দ্বৈত-ট্র্যাগার হবে না।
অডিও ইনপেইন্টিং ব্যবহার করতে বিনামূল্যে নিবন্ধন করুন
অডিও আঁকা হচ্ছে...

কণ্ঠস্বর ক্লোন করা হচ্ছে এবং প্রতিস্থাপন সংশ্লেষিত হচ্ছে...

টুকরো টুকরো করা → চারপাশের শব্দের ক্লোন করা → ক্রসফেডের সাথে সংযোগ করা
একটু সময় লাগবে? আপনার ফলাফল আপনার প্রজন্মের ইতিহাস যখন প্রস্তুত হবে।
অডিও প্রস্তুত

পূর্বে (প্রকৃত)

পরে (অঙ্কিত)

অডিও ডাউনলোড করুন

অডিও ইনপেইন্টিং কিভাবে কাজ করে

ইনপেইন্টিং হচ্ছে ফোটোশপের বিষয়বস্তু-সচেতন ভর্তির অডিও সমতুল্য। আমরা আপনার নির্বাচনের চারপাশের অডিও থেকে শব্দ ক্লোন করি, সেই শব্দের নতুন লাইন সংশ্লেষণ করি, এবং এটিকে একটি সংক্ষিপ্ত ক্রসফেডের সাথে পুনরায় সংযুক্ত করি।

সেরা ফলাফল: সম্পাদন বিন্দুর ঠিক আগে অন্তত ৩ সেকেন্ডের পরিষ্কার কথা বলার সুযোগ দিন যাতে ক্লোনারের কাছে ভাল রেফারেন্স উপাদান থাকে।

সর্বোত্তম ফলাফল পেতে টিপস

  • চিহ্নিত পরিসীমা যতটা সম্ভব সংকীর্ণ রাখুন - শুধুমাত্র খারাপ টেক
  • প্রতিস্থাপনের টেক্সটটি প্রতিস্থাপনের জন্য ব্যবহৃত টেক্সটের সমান লম্বা হওয়া উচিত
  • সর্বোত্তম শব্দের মিল পাওয়ার জন্য উৎস অডিও-র সাথে মিলবে এমন ভাষা নির্ধারণ করুন
  • ৮০মি. সে. ক্রসফেড সাধারণত অদৃশ্য; আপনি যদি ক্লিক শুনতে পান তবে ১৫০মি. সে.-এ বাম্প করুন
  • দীর্ঘ সম্পাদনার জন্য (>১০ সেকেন্ড), এর পরিবর্তে সম্পূর্ণ অংশটি পুনরায় রেকর্ড করার কথা বিবেচনা করুন

AI অডিও ইনপেইন্টিং কিভাবে কাজ করে

সার্জারির মাধ্যমে সম্পাদনা, কণ্ঠের সাথে মিল, আর কোন রেকর্ডিং সেশন নেই।

১ম ধাপ

আপলোড + চিহ্নিত এলাকা

আপনার অডিও আপলোড করুন এবং আপনি যে অংশটি প্রতিস্থাপন করতে চান তার শুরু/শেষ চিহ্নিত করতে স্ক্রাবার ব্যবহার করুন। প্রতিস্থাপনের জন্য লেখা লিখুন।

২য় ধাপ

শব্দ ক্লোন + সংশ্লেষণ

আমরা আপনার নির্বাচনের চারপাশে ১২ সেকেন্ড পর্যন্ত পরিষ্কার রেফারেন্স অডিও বের করি, স্পিকারের কণ্ঠের ক্লোন করি এবং সেই কণ্ঠে নতুন লাইন সংশ্লেষণ করি।

৩য় ধাপ

ক্রসফেড স্প্লিস

সংশ্লেষিত ক্লিপটি মূল রেকর্ডের সাথে সংযুক্ত করা হবে, উভয় সম্পাদনা বিন্দুতে সমান শক্তির ক্রসফেডের মাধ্যমে। সীমানাগুলো শোনা যাবে না।

অডিও ইনপেইন্টিং পরিকল্পনা

বিনামূল্যে শুরু করুন, আরো প্রয়োজন হলে আপগ্রেড করুন

মুক্ত
  • ১০ মিনিটের উৎস ফাইল
  • ৫০০ অক্ষরের প্রতিস্থাপন টেক্সট
  • প্রতি অনুরোধের জন্য ৪- সেকেন্ডের ইনপেইন্ট
  • ৮০ms ক্রসফেড স্প্লিস
  • OpenVoice + CosyVoice ২ ব্যাকএন্ড
সবচেয়ে জনপ্রিয়
ফ্রি অ্যাকাউন্ট
  • ১০ মিনিটের উৎস ফাইল
  • ৫,০০০ অক্ষরের প্রতিস্থাপন টেক্সট
  • টুনযোগ্য ক্রসফেড (০-২৫০মি. সে.)
  • শব্দ-মডেল অগ্রাহ্য করা হবে
  • উৎপাদন ইতিহাস + পুনরায় সম্পাদন
নিবন্ধন করুন
প্রফেশনাল
  • ৩০ মিনিটের উৎস ফাইল
  • ১০০,০০০ অক্ষরের প্রতিস্থাপন টেক্সট
  • অগ্রাধিকারযুক্ত GPU কলাম
  • API প্রবেশাধিকার (/v1/audio-inpaint/)
  • ব্যাচ চিত্র আঁকা (বহুমাত্রিক)
উন্নীতকরণ

প্রায়শ জিজ্ঞাসিত প্রশ্ন

অডিও ইনপেইন্টিং (অডিও ফিল বা স্পিকার ওভারড্যাব নামেও পরিচিত) আপনাকে একটি বিদ্যমান অডিও রেকর্ডের একটি অংশকে নতুন AI-সংশ্লেষিত কথা দ্বারা প্রতিস্থাপন করতে দেয় যা মূল কন্ঠের সাথে মিলবে। এটি ফটোশপের বিষয়বস্তু-সচেতন ফিল-এর অডিও সমতুল্য - আপনি যে অংশের উপরে আঁকা চান না, তার পরিবর্তে সেখানে যা থাকা উচিত তা টাইপ করুন, এবং AI একটি নিখুঁত প্রতিস্থাপন তৈরি করে।

প্রতিস্থাপনের জন্য সময়সীমা চিহ্নিত করুন, ডায়ালগের নতুন লাইন টাইপ করুন এবং ইনপেইন্ট ক্লিক করুন। আমাদের AI আপনার নির্বাচনের চারপাশের অডিও থেকে কন্ঠ ক্লোন করে, সেই কন্ঠের নতুন লাইন সংশ্লেষিত করে এবং এটি আপনার রেকর্ডিংয়ে একটি সংক্ষিপ্ত ক্রসফেডের সাথে পুনরায় সংযুক্ত করে যাতে সম্পাদনাটি অদৃশ্য হয়।

যখন আপনার কাছে একটি খারাপ শব্দ, ভুল উচ্চারণ, নামের ছিদ্র, শপথ শব্দ, অথবা অন্যথায় ভাল টেকে তথ্যের ভুল থাকে তখন এটি ব্যবহার করুন। সমগ্র অংশটি পুনরায় রেকর্ড করা প্রকল্পের বাকি অংশের সাথে প্রায়শই টোন মিসমেচ প্রবেশ করায় - ইনপেইন্টিং শুধুমাত্র যা ঠিক করার প্রয়োজন তা ঠিক করে, অন্য সব শব্দাংশ অক্ষত রাখে।

ফ্রি ব্যবহারকারীরা ১০ মিনিট পর্যন্ত ফাইল আঁকা করতে পারেন। সাবস্ক্রাইবাররা ৩০ মিনিট পর্যন্ত ফাইল আঁকা করতে পারেন। প্রতিস্থাপন টেক্সটটি ফ্রি ব্যবহারকারীদের জন্য ৫০০ অক্ষর, ফ্রি অ্যাকাউন্টের জন্য ৫,০০০ অক্ষর এবং পে-পাইড প্ল্যানের জন্য ১০০,০০০ অক্ষর পর্যন্ত সীমাবদ্ধ।

খুবই নিকটবর্তী। AI-এর জন্য সম্পাদনকে ঘিরে ১২ সেকেন্ডের অডিও ব্যবহার করা হয়, যা আমাদের ক্লোনিং-সক্ষম মডেল (ওপেনভয়েস, কোসিভয়েস ২)-এর জন্য যথেষ্ট, যা স্পিকারের টাইমব্রে, পিট এবং কথা বলার ধরন ধারণ করতে পারে। সর্বোত্তম ফলাফল পেতে, সম্পাদন বিন্দুর ঠিক আগে অন্তত ৩ সেকেন্ডের পরিষ্কার কথা বলার সময় রাখুন।

ডিফল্টভাবে আমরা উভয় স্প্লিস পয়েন্টে (হেড→রিপ্লেসমেন্ট এবং রিপ্লেসমেন্ট→টেল) ৮০ মিলিসেকেন্ডের সম-শক্তি ক্রসফেড প্রয়োগ করি। ক্রসফেড স্লাইডার ব্যবহার করে আপনি এটি ০ মিলিসেকেন্ড থেকে ২৫০ মিলিসেকেন্ড পর্যন্ত টুল করতে পারেন। দীর্ঘ ক্রসফেড সম্পাদনাকে আরও ভালভাবে লুকিয়ে রাখে কিন্তু সীমানায় ওভারল্যাপিং শব্দগুলোকে শোনা যায়।

অডিও ইনপেইন্টিং শব্দের ক্লোনিং-এর মতো একই ভাষার কভারেজ অনুসরণ করে। আমরা অধিকাংশ ভাষার জন্য স্বয়ংক্রিয়ভাবে ওপেনভয়েস এবং চীনা, জাপানি এবং কোরীয় ভাষার জন্য কোসিভয়েস ২ বেছে নিই। আপনি উন্নত সেটিংস-এ মডেলটি অগ্রাহ্য করতে পারেন।

প্রতি সেকেন্ডে প্রতিস্থাপনকৃত অডিওতে ৫০০ অক্ষরের জন্য আপনাকে অর্থ প্রদান করতে হবে। ৪ সেকেন্ডের একটি সংশোধন ২,০০০ অক্ষরের মূল্য। প্রতিস্থাপনকৃত টেক্সটের দৈর্ঘ্য থেকে এই মূল্য মুক্ত, যেহেতু ক্লোন সংশ্লেষণ নতুন ক্লিপের র‍্যান্ডম সময় দ্বারা নিয়ন্ত্রিত হয়, টেক্সটের দৈর্ঘ্য দ্বারা নয়।

আমাদের পরিষেবা শর্ত অনুযায়ী, আপনি কেবলমাত্র আপনার নিজস্ব অডিও বা সম্পাদনার জন্য স্পষ্ট অনুমতিপ্রাপ্ত অডিও ইনপেইন্ট করতে পারবেন। ভুয়া উদ্ধৃতি, বিভ্রান্তিকর বিষয়বস্তু বা অনুকরণ করা নিষিদ্ধ। আমরা অডিও তৈরির সময় ওয়াটারমার্ক করি এবং অব্যবহারের জন্য পর্যালোচনার জন্য সকল ইনপেইন্টিং কাজ লগ করি।

একটি ক্লিপ কাটা হলে, তাপমাত্রা এবং শ্বাস প্রশ্বাসের মধ্যে একটি উল্লেখযোগ্য ফাঁক তৈরি হয়; দুইটি ধারণার মধ্যে ক্রস-ফেডিং হলে, শব্দের মিল না থাকার ফলে। ইনপেইন্টিং এই ফাঁকটিকে এমনভাবে পূর্ণ করে যে, শব্দটি চারপাশের শব্দের সাথে মিলবে, যাতে দর্শক অবিরাম, প্রাকৃতিক শব্দের অডিও শুনতে পারে।

হ্যাঁ — অডিও ফাইল, start_sec, end_sec এবং replacement_text সহযোগে /v1/audio-inpaint/ এ POST করুন। শেষ বিন্দু একটি কাজ UUID ফিরিয়ে দেয়; প্রস্তুত হলে অডিও পেইন্ট করা পুনরুদ্ধার করার জন্য /v1/speech/results/?uuid= পল করে। বিস্তারিত জানতে API ডকুমেন্ট দেখুন।

ElevenLabs Speech-to-Speech একটি লক্ষ্যস্বরে সম্পূর্ণ ভয়েস লাইনটি শূন্য থেকে পুনরুদ্ধার করে। আমাদের অডিও ইনপেইন্টিং সার্জারি: এটি শুধুমাত্র চিহ্নিত পরিসর সম্পাদনা করে, আপনার মূল রেকর্ডের প্রতিটি বাইট অক্ষত রাখে এবং একটি পৃথক ভয়েস লাইব্রেরির পরিবর্তে নতুন ক্লিপটিকে চারপাশের ভয়েসের সাথে মেলে।
5.0/5 (1)

আমরা কি উন্নতি করতে পারি? আপনার ফিডব্যাক আমাদের সমস্যা সমাধানে সাহায্য করে।

সেকেন্ডের মধ্যে আপনার অডিও ঠিক করুন

যেকোন রেকর্ডের যেকোন অংশকে AI-সংমিশ্রিত কথার সাথে প্রতিস্থাপন করুন যা মূল শব্দের সাথে মিলবে। শুরু করতে বিনামূল্যে নিবন্ধন করুন।