ধ্বনি ক্লোনিং

এটা সংক্ষিপ্ত অডিঅ' নমুনাৰ পৰা যিকোনো শব্দ ক্লোন কৰক। AI ৰ সহায়ত ক্লোন কৰা শব্দত শব্দ নিৰ্মাণ কৰক।

প্ৰসংগ অডিঅ'

আপোনাৰ নথিপত্ৰ এখানে টানি আনুন, অথবা ব্ৰাউছ কৰক

Upload clear speech (minimum varies by model, 3-15s). MP3, WAV, FLAC. Max 20MB.

file.mp3

0 MB
Audio Quality ...
Duration: -- Loudness: -- Silence: --
— অথবা প্ৰত্যক্ষভাৱে ৰেকৰ্ড কৰক —
00:00

মডেল ক্লোন কৰা হৈছে

অডিঅ'ৰ সৰ্বনিম্ন দৈৰ্ঘ্য: 5s

Quality:
Faster preview

উচ্চাৰণযোগ্য লিপি

0/5000 আখৰ ভাষাৰ অনুলিপি অডিঅ'ৰ সৈতে মিল খাব লাগিব
5 credits Sign up to track usage

ফলাফল

এটা উদ্ধৃতি শব্দ আপলোড কৰক, টেক্সট সুমুৱাওক, আৰু ক্লোন কৰা শব্দ শুনিবলৈ সৃষ্টি কৰক

কন্ঠ ক্লোন কৰা হৈছে আৰু কথোপকথন নিৰ্মাণ কৰা হৈছে...

0:00 0:00

আপোনাৰ সংৰক্ষিত শব্দসমূহ

নিবন্ধন কৰক পিছত ব্যৱহাৰৰ বাবে ক্লোন কৰা শব্দসমূহ সংৰক্ষণ কৰিবলে।

ভয়েস ক্লোনিং কিদৰে কাম কৰে

1. উল্লিখিত অডিঅ' আপলোড কৰক

আপুনি ক্লোন কৰিব বিচৰা শব্দৰ পৰা ১০-৩০ ছেকেণ্ডৰ স্পষ্ট কথোপকথন প্ৰদান কৰক। অডিঅ' যিমান স্পষ্ট হ'ব, ফলাফল সিমান ভাল হ'ব।

এটা আৰ্হি বাছক

OpenVoice, Chatterbox, CosyVoice 2, অথবা GPT-SoVITS ৰ দৰে ক্লোনিং মডেলসমূহৰ পৰা নিৰ্বাচন কৰক। প্ৰত্যেকত বিভিন্ন ভাষা আৰু শৈলীৰ বাবে অনন্য শক্তি আছে।

3. লিখনী সুমুৱাওক আৰু সৃষ্টি কৰক

ক্লোন কৰা শব্দত যি লিপি উচ্চাৰণ কৰা হ'ব সেইটো লিখক আৰু সৃষ্টি কৰক ক্লিক কৰক। ভৱিষ্যতে ব্যৱহাৰৰ বাবে শব্দ ডাউনল'ড কৰক বা সংৰক্ষণ কৰক।

ব্যৱহাৰৰ ঘটনাসমূহ

প্ৰতিটো সৃজনশীল আৰু পেশাদাৰী প্ৰয়োজনৰ বাবে শব্দ ক্লোনিং

বিষয়বস্তু সৃষ্টি

পুনঃ ৰেকৰ্ড নকৰি আপোনাৰ নিজস্ব কন্ঠৰ সৈতে স্থায়ী ভয়েস-অভাৰসমূহ সৃষ্টি কৰক। মাইকৰ পৰা আঁতৰি থকা অৱস্থাত ত্ৰুটিসমূহ ঠিক কৰক, নতুন অংশসমূহ যোগ কৰক, অথবা আপোনাৰ কন্ঠত সমলসমূহ সৃষ্টি কৰক।

বহুভাষিক অনুবাদ

আপুনি যি ভাষা জানে সেই ভাষাত কথা কওক

খেলা আৰু আখৰ

খেল, এনিমেশন আৰু প্ৰতিক্ৰিয়াশীল মিডিয়াৰ বাবে অবিকল্পিত আখৰৰ শব্দ নিৰ্মাণ কৰক। সংশ্লিষ্ট শব্দ ক্লোন কৰক আৰু অসীমিত সংলাপ শাৰীসমূহ নিৰ্মাণ কৰক।

অডিঅ'বই

সম্পূৰ্ণ কিতাপসমূহ এটা স্থায়ী কন্ঠত বৰ্ণনা কৰক। আপোনাৰ ক্লোন কৰা কন্ঠ ব্যৱহাৰ কৰি অডিঅ' কিতাপসমূহ সফলতাৰে প্ৰস্তুত কৰক স্টুডিঅ' ৰেকৰ্ডিংৰ ঘন্টা অবিহনে।

অভিগম্যতা

আগতে ৰেকৰ্ড কৰা এটা নমুনা ব্যৱহাৰ কৰি নিজৰ কণ্ঠ হেৰুওৱা লোকক পুনৰ ক'বলৈ সহায় কৰক। ব্যক্তিগত আৰু চিকিৎসাগত ব্যৱহাৰৰ বাবে কণ্ঠৰ পৰিচয় সংৰক্ষণ কৰক।

ব্ৰ্যান্ডৰ শব্দ

সকলো অডিঅ' সমলসমূহত এটা স্থিতিশীল ব্ৰ্যান্ডৰ কণ্ঠ বজাই ৰাখক। আপোনাৰ ব্ৰ্যান্ডৰ মুখপাত্ৰক ক্লোন কৰক আৰু বিপণন অডিঅ', IVR প্ৰম্পটসমূহ, আৰু অধিসূচনাসমূহ সৃষ্টি কৰক।

সৰ্বোত্তম ফলাফলৰ বাবে ইঙ্গিত

বুধ

  • স্পষ্ট, ধ্বনি বিহীন ৰেকৰ্ডিং ব্যৱহাৰ কৰক
  • ১০-৩০ ছেকেণ্ডৰ বাবে লক্ষ্য কৰক
  • এটা স্পিকার ব্যৱহাৰ কৰক
  • শান্ত পৰিবেশত ৰেকৰ্ড কৰক
  • স্বাভাৱিক কথোপকথনৰ গতি ব্যৱহাৰ কৰক
  • WAV অথবা উচ্চ-বিটৰেট MP3 পছন্দ কৰা হয়

পৰিহাৰ কৰক

  • পটভূমিৰ শব্দ অথবা সঙ্গীত
  • প্ৰসংগত একাধিক স্পিকার
  • অতি সংক্ষিপ্ত ক্লিপ (৩ ছেকেণ্ডৰ কম)
  • উচ্চ সংকোচন অডিঅ'
  • হুমুনিয়াহ অথবা চিঞৰ
  • ৰেকৰ্ডিংত প্ৰতিধ্বনি অথবা প্ৰতিধ্বনি

How Sample Length Affects Quality

The longer and cleaner your reference audio, the better the clone. Here's what to expect at each level:

Sample Length Clone Quality Best For Access
5–10s Basic Quick test — captures general tone but may miss nuances Free
30–60s Good Solid clone for most use cases — captures tone, pace, and accent Free
2–5 min Great High-fidelity clone — natural inflections, consistent quality across outputs Free Account
10+ min Excellent Near-perfect reproduction — ideal for audiobooks, podcasts, professional use Free Account
1–2+ hrs Studio Grade Fine-tune a custom model on your voice — indistinguishable from original Pro Plan

For best results, use clean audio with a single speaker, no background music, and natural speech. WAV or FLAC format preserves the most detail.

সদায় সোধা প্ৰশ্নসমূহ

AI শব্দ ক্লোনিং এটা সংক্ষিপ্ত অডিঅ' নমুনাৰ পৰা এটা ব্যক্তিৰ শব্দ প্ৰতিলিপি কৰিবলৈ গভীৰ শিক্ষা ব্যৱহাৰ কৰে। একবাৰ ক্লোন কৰা হ'লে, আপুনি নতুন কথা সৃষ্টি কৰিব পাৰিব যি মূল কথোপকথকৰ দৰে শব্দ কৰে। আধুনিক মডেলসমূহৰ বাবে ৫ ছেকেণ্ডৰ পৰা কম সংৰক্ষণ অডিঅ'ৰ প্ৰয়োজন।

Chatterbox এ অনুভূতি নিয়ন্ত্ৰণৰ সৈতে সৰ্বোত্তম শূণ্য-শট ক্লোনিং প্ৰদান কৰে। CosyVoice2এ বহুভাষিক ক্লোনিং (৮টা ভাষা) ৰ বাবে ভাল। GPT-SoVITS এ কেৱল ৫ ছেকেণ্ডৰ অডিঅ'ৰ সৈতে উত্তম। OpenVoice এ granular style control প্ৰদান কৰে।

অধিকাংশ মডেলে ৫-৩০ ছেকেণ্ডৰ পৰিষ্কাৰ অডিঅ'ৰ সৈতে কাম কৰে। দীঘল নমুনা (৬০ ছেকেণ্ডলৈকে) সাধাৰণতে ভাল ফলাফল প্ৰদান কৰে। অডিঅ'টো পৰিষ্কাৰ হ'ব লাগিব, একক স্পিকার, পটভূমিৰ সঙ্গীত বা ধ্বনি নোহোৱাকৈ।

আপুনি কেৱল আপোনাৰ ব্যৱহাৰৰ অনুমতি থকা ধ্বনিসমূহ ক্লোন কৰিব লাগিব। ইয়াত আপোনাৰ নিজৰ ধ্বনিসমূহ, অনুমোদিত ব্যক্তিসকলৰ ধ্বনিসমূহ, অথবা যথাযথভাৱে লাইচেঞ্চ কৰা উৎসসমূহৰ পৰা ধ্বনিসমূহ অন্তৰ্ভুক্ত আছে। অপ্ৰমাণিত ধ্বনি ক্লোন কৰা আপোনাৰ শাখাৰ আইনসমূহ লঙ্ঘন কৰিব পাৰে।

হ্যাঁ! CosyVoice2এবং GPT-SoVITS ৰ দৰে ক্ৰচ-লেঙ্গুৱেজ কন্ঠ ক্লোনিং মডেলসমূহে ক্লোন কৰা কন্ঠৰ পৰিচয় বজাই ৰাখি বিভিন্ন ভাষাত কথোপকথন সৃষ্টি কৰিব পাৰে। ই ডাবিং আৰু স্থানীয়কৰণৰ বাবে ব্যৱহাৰযোগ্য।

এটা স্পিকারৰ সৈতে এটা পৰিষ্কাৰ ৰেকৰ্ড ব্যৱহাৰ কৰক, কোনো পটভূমিৰ সঙ্গীত অথবা ধ্বনি নাই, আৰু স্থায়ী ভলিউমত স্বাভাৱিক কথোপকথন। চুইচ, চিঞৰ বা ব্যাপকভাৱে প্ৰক্ৰিয়াকৃত অডিঅ' এৰোধ কৰক। WAV অথবা FLAC বিন্যাস ১৬kHz অথবা অধিকত সৰ্বোত্তম ফলাফল দিয়ে।

শব্দ ক্লোন কৰা বৈধ যদি আপুনি শব্দৰ গৰাকীৰ পৰা অনুমতি পায় অথবা আপোনাৰ নিজস্ব শব্দ ব্যৱহাৰ কৰে। বহুতো প্ৰশাসনিক অঞ্চলত শব্দৰ অনুকৰণ অধিকাৰ সুৰক্ষাৰ বাবে আইন আছে। কাৰোবাক অনুকৰণ কৰিবলৈ, deepfakes সৃষ্টি কৰিবলৈ, অথবা প্ৰতাৰণা কৰিবলৈ কেতিয়াও শব্দ ক্লোন নকৰিব। অন্য কাৰোবাৰ শব্দ ক্লোন কৰাৰ পূৰ্বে সদায় সঠিক অনুমতি প্ৰাপ্ত কৰক।

হ'ব, আপুনি ক্লোন কৰা কন্ঠসমূহ বাণিজ্যিকভাৱে ব্যৱহাৰ কৰিব পাৰে যিহেতু আপোনাৰ সংগ্ৰহস্থলৰ কণ্ঠৰ অধিকাৰ আছে। ইয়াত আপোনাৰ নিজৰ কণ্ঠ, অনুমতি দিয়া ভাড়া কৰা কণ্ঠ অভিনেতাসমূহ, অথবা সঠিকভাৱে লাইচেঞ্চ কৰা কণ্ঠ নমুনাসমূহ অন্তৰ্ভুক্ত আছে। উৎপাদিত অডিঅ'সমূহ উৎপাদন, ভিডিঅ'সমূহ আৰু এপ্লিকেচনসমূহত ব্যৱহাৰ কৰিব পাৰিব।

হ্যাঁ, নিবন্ধিত ব্যৱহাৰকাৰীসকলে ক্লোন কৰা কন্ঠৰ আলেখ্যনসমূহ তেওঁলোকৰ একাওন্টত সংৰক্ষণ কৰিব পাৰে। সংৰক্ষণ কৰা হ'লে, আপুনি ক্লোন কৰা কন্ঠক ভৱিষ্যৎ প্ৰজন্মৰ বাবে পুনৰ ব্যৱহাৰ কৰিব পাৰিব সংশ্লিষ্ট অডিঅ' পুনৰ আপলোড নকৰাকৈ। এইটো আপোনাৰ একাওন্টৰ "মোৰ কন্ঠসমূহ" বিভাগত উপলব্ধ।

Chatterbox ৰ দৰে মডেলসমূহে ক্লোন কৰা কন্ঠসমূহৰ সৈতে স্পষ্ট অনুভূতি নিয়ন্ত্ৰণ প্ৰদান কৰে (আনন্দ, দুঃখ, ক্ষোভ, ইত্যাদি) । অন্য মডেলসমূহে আপোনাৰ প্ৰতিনিধি অডিঅ'ৰ পৰা সাধাৰণ টোন আৰু শৈলী গ্ৰহণ কৰে । সৰ্বোত্তম অনুভূতি স্থানান্তৰৰ বাবে, আপোনাৰ প্ৰতিনিধি নমুনাত অভিব্যক্তিমূলক কথন অন্তৰ্ভুক্ত কৰক ।

মডেল আৰু টেক্সটৰ দৈৰ্ঘ্যৰ ওপৰত নিৰ্ভৰ কৰি ধ্বনি ক্লোন কৰাত সাধাৰণতে ৩-১০ ছেকেণ্ড সময় লাগে। Chatterbox আৰু GPT-SoVITS দ্ৰুত ক্লোন কৰাৰ বাবে অনুকূলিত কৰা হৈছে। প্ৰথম প্ৰজন্মত কিছু সময় লেগে যাব যিহেতু মডেলে প্ৰসংগ অডিঅ' প্ৰক্ৰিয়া কৰে।

Voice Cloning এ Chatterbox আৰু Tortoise ৰ দৰে মডেলসমূহৰ বাবে প্ৰতি ১,০০০ আখৰৰ বাবে ৪ টি ক্ৰেডিটত প্ৰিমিয়াম-টিয়াৰ ক্ৰেডিট ব্যৱহাৰ কৰে। বিনামূলীয়া একাওন্টসমূহে নিবন্ধনৰ সময়ত ৫০ টি ক্ৰেডিট লাভ কৰে। CosyVoice ২ ৰ দৰে প্ৰমিত-টিয়াৰ ক্লোনিং মডেলসমূহে প্ৰতি ১,০০০ আখৰৰ বাবে ২ টি ক্ৰেডিট ব্যৱহাৰ কৰে।
5.0/5 (1)

AI ৰ সৈতে যিকোনো শব্দ ক্লোন কৰক

এটা সংক্ষিপ্ত অডিঅ' নমুনা আপলোড কৰক আৰু যিকোনো শব্দত কথোপকথন সৃষ্টি কৰা আৰম্ভ কৰক। আৰম্ভ কৰিবলৈ বিনামূলীয়াকৈ নিবন্ধন কৰক।