শব্দ ক্লোনিং

একটি অডিও নমুনা থেকে যেকোন শব্দ ক্লোন করুন। AI এর সাহায্যে ক্লোনকৃত শব্দে কথাবার্তা তৈরি করুন।

রেফারেন্স অডিও

আপনার ফাইল এখানে টেনে নিয়ে যান, অথবা ব্রাউজ

Upload clear speech (minimum varies by model, 3-15s). MP3, WAV, FLAC. Max 20MB.

file.mp3

0 MB
অডিও গুণমান ...
সময়কাল: -- শব্দের গতি: -- চুপচাপ থাকো: --
- অথবা সরাসরি রেকর্ড করুন -
00:00

মডেল ক্লোন করা হচ্ছে

অডিও ফাইলের সর্বনিম্ন দৈর্ঘ্য: 5s

গুণমান:
দ্রুত প্রাকদর্শন

পাঠ্য বর্ণনা করুন

ভাষার সাথে রেফারেন্স অডিও মিলবে
5 অক্ষর নিবন্ধন করুন ব্যবহার পর্যবেক্ষণ করুন

ফলাফল

রেফারেন্স ভয়েস আপলোড করুন, টেক্সট প্রবেশ করান, এবং ক্লোন করা ভয়েস শুনতে উৎপাদন করুন

শব্দ ক্লোন করা হচ্ছে এবং কথা বলার শব্দ তৈরি করা হচ্ছে...

0:00 0:00

আপনার সংরক্ষিত শব্দ

নিবন্ধন করুন পরবর্তী ব্যবহারের জন্য ক্লোন করা শব্দ সংরক্ষণ করুন ।

ভয়েস ক্লোনিং কিভাবে কাজ করে

রেফারেন্স অডিও আপলোড করুন

আপনি যে কণ্ঠস্বরটি ক্লোন করতে চান তা থেকে ১০-৩০ সেকেন্ডের পরিষ্কার বক্তৃতা প্রদান করুন। অডিও যত পরিষ্কার হবে, ফলাফল তত ভাল হবে।

২. একটি মডেল নির্বাচন করুন

OpenVoice, Chatterbox, CosyVoice2অথবা GPT-SoVITS এর মত ক্লোনিং মডেল থেকে বেছে নিন। প্রত্যেকেরই বিভিন্ন ভাষা এবং শৈলীর জন্য অনন্য শক্তি আছে।

৩. টেক্সট লিখুন এবং তৈরি করুন

আপনি যে টেক্সটটি ক্লোন করা কন্ঠে উচ্চারণ করতে চান তা টাইপ করুন এবং তৈরি করতে ক্লিক করুন । ভবিষ্যতে ব্যবহারের জন্য কন্ঠটি ডাউনলোড অথবা সংরক্ষণ করুন ।

ব্যবহারের ক্ষেত্রে

প্রতিটি সৃজনশীল এবং পেশাদার প্রয়োজনের জন্য ভয়েস ক্লোন

বিষয়বস্তু তৈরি করা হচ্ছে

পুনরায় রেকর্ড না করে আপনার নিজের কণ্ঠে স্থায়ী ভয়েসওভার তৈরি করুন। মাইক্রোফোন থেকে দূরে থাকা অবস্থায় ভুল সংশোধন করুন, নতুন অংশ যোগ করুন, অথবা আপনার কণ্ঠে বিষয়বস্তু তৈরি করুন।

বহুভাষিক দ্বৈতকরণ

আপনি যে ভাষায় কথা বলেন

খেলা & চরিত্র

খেলা, অ্যানিমেশন এবং মিথস্ক্রিয় মিডিয়ার জন্য অনন্য চরিত্রের কন্ঠ তৈরি করুন। রেফারেন্স কন্ঠ ক্লোন করুন এবং অসীমিত ডায়ালগ লাইন তৈরি করুন।

অডিওবই

সমস্ত বই একই কণ্ঠে বর্ণনা করুন। আপনার ক্লোন করা কণ্ঠ ব্যবহার করে অডিওবই উৎপাদন করুন স্টুডিওতে রেকর্ডিং না করেই।

প্রবেশযোগ্যতা

পূর্বে রেকর্ড করা নমুনা ব্যবহার করে যারা তাদের কণ্ঠ হারিয়েছে তাদেরকে আবার কথা বলতে সাহায্য করুন। ব্যক্তিগত এবং চিকিৎসাগত ব্যবহারের জন্য কণ্ঠ পরিচয় সংরক্ষণ করুন।

ব্র্যান্ড ভয়েস

সকল অডিও বিষয়বস্তুতে একটি স্থায়ী ব্র্যান্ডের কন্ঠ বজায় রাখুন। আপনার ব্র্যান্ডের মুখপাত্রকে ক্লোন করুন এবং মার্কেটিং অডিও, IVR প্রম্পট এবং বিজ্ঞপ্তি তৈরি করুন।

সর্বোত্তম ফলাফল পেতে টিপস

শনিবার

  • পরিষ্কার, শব্দহীন রেকর্ডিং ব্যবহার করুন
  • ১০-৩০ সেকেন্ডের মধ্যে কথা বলুন
  • একটি স্পিকার ব্যবহার করো
  • নিরব পরিবেশে রেকর্ড করুন
  • স্বাভাবিক কথা বলার গতি ব্যবহার করো
  • WAV অথবা উচ্চ-বিটরেটের MP3 পছন্দনীয়

এড়িয়ে যাও

  • পটভূমির শব্দ অথবা সঙ্গীত
  • রেফারেন্সে একাধিক স্পিকার
  • খুবই সংক্ষিপ্ত ক্লিপ (৩ সেকেন্ডের কম)
  • উচ্চ সংকুচিত অডিও
  • চুপচাপ কিংবা চিৎকার করে
  • রেকর্ডিংয়ের সময় প্রতিধ্বনি অথবা প্রতিধ্বনি

নমুনার দৈর্ঘ্য কিভাবে গুণগত মানকে প্রভাবিত করে

আপনার রেফারেন্স অডিও যত দীর্ঘ ও পরিষ্কার হবে, ক্লোন তত ভালো হবে। এখানে

নমুনার দৈর্ঘ্য ক্লোন গুণমান এর জন্য সেরা অ্যাক্সেস
5–10s মৌলিক দ্রুত পরীক্ষা - সাধারণ টোন ধারণ করে কিন্তু নরমতা মিস করতে পারে মুক্ত
30–60s ভাল বেশিরভাগ ব্যবহারের ক্ষেত্রের জন্য স্থায়ী ক্লোন - টোন, গতি এবং উচ্চারণ ধারণ করে মুক্ত
2–5 min দারুন হাই-ফিডেলিটি ক্লোন - প্রাকৃতিক বিন্যাস, আউটপুটের মধ্যে স্থায়ী গুণমান ফ্রি অ্যাকাউন্ট
10+ min অসাধারণ প্রায়-সম্পূর্ণ পুনঃপ্রকাশন — অডিওবুক, পডকাস্ট, পেশাদার ব্যবহারের জন্য আদর্শ ফ্রি অ্যাকাউন্ট
1–2+ hrs স্টুডিও গ্রেড আপনার কন্ঠের উপর একটি স্বনির্ধারিত মডেল ফিন-টুইন করুন - মূল থেকে আলাদা নয় প্রকল্প

সর্বোত্তম ফলাফল পেতে, একটি স্পিকারের সাথে পরিষ্কার অডিও ব্যবহার করুন, কোন পটভূমি সঙ্গীত নেই, এবং স্বাভাবিক কথাবার্তা। WAV অথবা FLAC ফরম্যাট সবচেয়ে বেশি বিস্তারিত তথ্য সংরক্ষণ করে।

শব্দ ক্লোনিং পরিকল্পনা

বিনামূল্যে শুরু করুন, আরো প্রয়োজন হলে আপগ্রেড করুন

মুক্ত
  • ৫-৬০ সেকেন্ড রেফারেন্স অডিও
  • মৌলিক ক্লোন গুণমান
  • চ্যাটবক্স মডেল
  • MP3 আউটপুট
সবচেয়ে জনপ্রিয়
ফ্রি অ্যাকাউন্ট
  • ১০ মিনিটের রেফারেন্স অডিও + ১৫,০০০ অক্ষর
  • সব ক্লোন মডেল
  • HD গুণমানের মোড
  • ক্লোন করা শব্দ সংরক্ষণ করুন
  • ক্রস- ভাষার ক্লোনিং
  • সব আউটপুট ফরম্যাট
নিবন্ধন করুন
প্রফেশনাল
  • ২ ঘন্টা+ রেফারেন্স অডিও
  • স্টুডিও-মানের ক্লোন গুণমান
  • স্বনির্বাচিত মডেল ফিন-টুইনিং
  • ব্যাচ উৎপাদন
  • API ব্যবহার
  • অগ্রাধিকার প্রসেসিং
উন্নীতকরণ

প্রায়শ জিজ্ঞাসিত প্রশ্ন

AI শব্দ ক্লোনিং একটি সংক্ষিপ্ত অডিও নমুনা থেকে একজন ব্যক্তির শব্দের অনুরূপ তৈরি করতে গভীর শিক্ষা ব্যবহার করে। একবার ক্লোন করা হলে, আপনি নতুন শব্দ তৈরি করতে পারেন যা মূল স্পিকারের মতো শোনায়। আধুনিক মডেলের জন্য ৫ সেকেন্ডের রেফারেন্স অডিও প্রয়োজন।

চ্যাটবক্স আবেগ নিয়ন্ত্রণ সহ সবচেয়ে ভাল শূন্য-শট ক্লোনিং প্রদান করে। কোসিভয়েস ২ বহুভাষিক ক্লোনিং (৮টি ভাষা) এর জন্য খুবই উপযোগী। জিপিটি-সোভিটস মাত্র ৫ সেকেন্ডের অডিও সহ অনন্য। ওপেনভয়েস বীজগাণিতিক স্টাইল নিয়ন্ত্রণ প্রদান করে।

বেশিরভাগ মডেল ৫-৩০ সেকেন্ডের পরিষ্কার অডিও সহযোগে কাজ করে। দীর্ঘতর নমুনা (৬০ সেকেন্ড পর্যন্ত) সাধারণত ভাল ফলাফল প্রদান করে। অডিওটি পরিষ্কার, একক স্পিকার, কোন পটভূমি সঙ্গীত বা শব্দহীন হওয়া উচিত।

আপনি কেবলমাত্র সেই শব্দগুলো ক্লোন করবেন যা ব্যবহারের অনুমতি রয়েছে। এর মধ্যে আপনার নিজের শব্দ, অনুমতিপ্রাপ্ত ব্যক্তির শব্দ, অথবা সঠিক লাইসেন্সপ্রাপ্ত উৎস থেকে আগত শব্দ অন্তর্ভুক্ত। অনুমোদনহীন শব্দ ক্লোন করা আপনার এলাকার আইন লঙ্ঘন করতে পারে।

হ্যাঁ! Cross-language voice cloning মডেল যেমন CosyVoice2এবং GPT-SoVITS ক্লোন করা শব্দের পরিচয় বজায় রেখে বিভিন্ন ভাষায় কথা বলতে পারে। এটি ডাবিং এবং স্থানীয়করণের জন্য উপযোগী।

একটি স্পিকারের মাধ্যমে পরিষ্কার রেকর্ডিং ব্যবহার করুন, কোন পটভূমির সঙ্গীত বা ধ্বনি নেই, এবং স্বাভাবিক ভলিউমে স্বাভাবিক কথাবার্তা। চুপচাপ কথা বলা, চিৎকার করা, বা প্রচুর পরিমাণে প্রক্রিয়াকৃত অডিও এড়িয়ে চলুন। WAV বা FLAC ফরম্যাটে ১৬kHz অথবা তার বেশি সর্বোত্তম ফলাফল প্রদান করে।

কণ্ঠস্বর ক্লোন করা বৈধ যখন আপনি কণ্ঠস্বর মালিকের অনুমতি পান অথবা আপনার নিজের কণ্ঠস্বর ব্যবহার করেন। অনেক এলাকায় কণ্ঠস্বর সদৃশ অধিকার সংরক্ষণের জন্য আইন আছে। কখনোই অন্য কাউকে অনুকরণ করার জন্য কণ্ঠস্বর ক্লোন করবেন না, deepfakes তৈরি করবেন না, অথবা প্রতারণা করবেন না। অন্য কারো কণ্ঠস্বর ক্লোন করার আগে সর্বদা সঠিক অনুমতি পান।

হ্যাঁ, আপনি ক্লোন করা কণ্ঠ বাণিজ্যিকভাবে ব্যবহার করতে পারেন যতক্ষণ আপনি রেফারেন্স কণ্ঠের অধিকার রাখেন। এর মধ্যে আপনার নিজের কণ্ঠ, ভাড়া করা কণ্ঠ অভিনেতা যারা সম্মতি দেন, অথবা সঠিকভাবে লাইসেন্সকৃত কণ্ঠ নমুনা অন্তর্ভুক্ত। উত্পাদিত অডিও পণ্য, ভিডিও এবং অ্যাপ্লিকেশনে ব্যবহার করা যেতে পারে।

হ্যাঁ, নিবন্ধিত ব্যবহারকারীরা তাদের অ্যাকাউন্টে ক্লোন করা ভয়েস প্রোফাইল সংরক্ষণ করতে পারেন। সংরক্ষণ করার পর, আপনি রেফারেন্স অডিও পুনরায় আপলোড না করে ভবিষ্যৎ প্রজন্মের জন্য ক্লোন করা ভয়েস পুনরায় ব্যবহার করতে পারবেন। এটি আপনার অ্যাকাউন্টের "আমার ভয়েস" বিভাগে পাওয়া যাবে।

Chatterbox এর মত মডেল ক্লোন করা কণ্ঠস্বরের মাধ্যমে স্পষ্টভাবে আবেগ নিয়ন্ত্রণ (আনন্দ, দুঃখ, ক্ষোভ, ইত্যাদি) প্রদান করে। অন্য মডেলগুলি আপনার রেফারেন্স অডিও থেকে সাধারণ টোন এবং শৈলী ধরে রাখে। সবচেয়ে ভাল আবেগ স্থানান্তরের জন্য, আপনার রেফারেন্স নমুনায় প্রকাশ্য কথা বলা অন্তর্ভুক্ত করুন।

মডেল এবং টেক্সটের দৈর্ঘ্যের উপর নির্ভর করে ভয়েস ক্লোন করতে সাধারণত ৩-১০ সেকেন্ড সময় লাগে। Chatterbox এবং GPT-SoVITS দ্রুত ক্লোন করার জন্য অনুকূলিত। মডেল রেফারেন্স অডিও প্রসেস করার কারণে প্রথম প্রজন্মে কিছুটা সময় লাগতে পারে।

Voice Cloning-এ Chatterbox এবং Tortoise-এর মত মডেলের জন্য ৪x অক্ষর ব্যবহার করে প্রাইম-ট্রিম মূল্য নির্ধারণ করা হয়। নিবন্ধনের সময় ফ্রি অ্যাকাউন্ট ১৫,০০০ অক্ষর পাবে। CosyVoice2-এর মত স্ট্যান্ডার্ড-ট্রিম Cloning মডেল ২x অক্ষর ব্যবহার করে।
5.0/5 (1)

AI এর সাথে যেকোন শব্দ ক্লোন করুন

একটি সংক্ষিপ্ত অডিও নমুনা আপলোড করুন এবং যেকোন শব্দে কথা বলা শুরু করুন। শুরু করতে বিনামূল্যে নিবন্ধন করুন।