কথাৰ পৰা কথালৈName

কথোপকথনৰ অডিঅ' পৰিবৰ্তন কৰক - মূল বিষয়বস্তু সংৰক্ষণ কৰি কন্ঠ, অনুভূতি, ভাষা আৰু শৈলী পৰিবৰ্তন কৰক।

অডিঅ' উৎস

আপোনাৰ নথিপত্ৰ এখানে টানি আনুন, অথবা ব্ৰাউছ কৰক

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

file.mp3

0 MB
— অথবা আপোনাৰ কন্ঠ ৰেকৰ্ড কৰক —
00:00

পৰিবৰ্তনৰ বৈশিষ্ট্যসমূহ

আপোনাৰ নথিপত্ৰ এখানে টানি আনুন, অথবা ব্ৰাউছ কৰক

Upload a reference of the target voice. 10-30 sec recommended.

file.mp3

0 MB

ফলাফল

কথোপকথনৰ অডিঅ' আপলোড কৰক, আপোনাৰ পৰিবৰ্তন বাছক, আৰু আৰম্ভ কৰিবলৈ পৰিবৰ্তন ক্লিক কৰক

কথোপকথন পৰিবৰ্তন কৰা হৈছে... ইয়াৰ বাবে কিছু সময়ৰ প্ৰয়োজন হব পাৰে।

মূল

0:00 0:00

পৰিবৰ্তন কৰা হৈছে

0:00 0:00

কিদৰে কাম কৰে

১. উচ্চাৰণ আপলোড কৰক

আপুনি পৰিবৰ্তন কৰিব বিচৰা অডিঅ' ৰেকৰ্ড কৰক অথবা আপলোড কৰক

2. পৰিবৰ্তন নিৰ্ব্বাচন কৰক

শব্দ পৰিবৰ্তন, শৈলী স্থানান্তৰ, অথবা ভাষা ৰূপান্তৰ বাছক

AI পৰিবৰ্তন

AI প্ৰক্ৰিয়াকৰণ অডিঅ' end-to-end সংৰক্ষণ কৰোতে কথোপকথনৰ সামগ্ৰী

ডাউনলোড কৰক

ফলাফল শুনক আৰু আপোনাৰ পৰিবৰ্তিত অডিঅ' ডাউনল'ড কৰক

ব্যৱহাৰৰ ঘটনাসমূহ

বিষয়বস্তু, অভিগম্যতা, আৰু সৃজনশীল প্ৰকল্পসমূহৰ বাবে শব্দৰ পৰা শব্দলৈ

ভিডিঅ' ডুবিং

মূল কথোপকথক সংৰক্ষণ কৰি ভিডিঅ'সমূহ অন্য ভাষাত ডাব কৰক

ইমোচন সংশোধন

ৰেকৰ্ডসমূহৰ আবেগিক টোন পৰিবৰ্তন কৰক - শান্ত কথোপকথন উত্তেজিত কৰক, অথবা নিৰপেক্ষ কথোপকথন উষ্ণ আৰু বন্ধুত্বপূৰ্ণ কৰক।

বক্তৃতা প্ৰস্তুতকৰণ

বিভিন্ন ধ্বনি আৰু শৈলীৰ সৈতে কঠিন ধ্বনি ৰেকৰ্ডসমূহক সৰল ধ্বনিলৈ পৰিবৰ্তন কৰক।

ভয়েস এনোনিমাইজেশন

স্পিকার আড়াল কৰক

কথাৰ পৰা কথাৰ আৰ্হিName

OpenVoice

দ্ৰুত ধ্বনি পৰিবৰ্তনৰ সৈতে granular শৈলী নিয়ন্ত্ৰণ। ধ্বনি পৰিচয়, গতি, আৰু অনুভূতি ছেকেণ্ডত পৰিবৰ্তন কৰক।

  • দ্রুত প্ৰক্ৰিয়াকৰণ
  • বিন্যাস স্থানান্তৰ
  • ক্ৰচ-লিঙ্গুইজ

Chatterbox

Resemble AI ৰ পৰা fine-grained অনুভূতি নিয়ন্ত্ৰণৰ সৈতে Zero-shot শব্দ ক্লোনিং।

  • ইমোচন নিয়ন্ত্ৰণ
  • Zero-shot ক্লোনিং
  • উচ্চ বিশ্বাসযোগ্যতা

CosyVoice 2

প্ৰাকৃতিক প্ৰোসোডি আৰু ষ্ট্ৰীমিং সমৰ্থনৰ সৈতে ৮টা ভাষাত ক্ৰচ-লেঙ্গুৱেজ কন্ঠ ক্লোন কৰা হৈছে।

  • ভাষাসমূহ
  • শব্দ ক্লোনিং
  • স্ট্ৰিমিং

সদায় সোধা প্ৰশ্নসমূহ

Speech to Speech (STS) AI এ এটা কথোপকথনৰ অডিঅ' ৰেকৰ্ডক এটা ভিন্ন কথোপকথনৰ আউটপুটত পৰিবৰ্তন কৰে - মূল শব্দ আৰু সময় সংৰক্ষণ কৰি কন্ঠ, শৈলী, অনুভূতি, বা ভাষা পৰিবৰ্তন কৰে। ই একক পাইপলাইনত কথোপকথন চিনাক্তকৰণ, প্ৰক্ৰিয়াকৰণ, আৰু সংশ্লেষণ একত্ৰিত কৰে।

টেক্সট-টু-স্পিচ দ্বাৰা লিখিত টেক্সট অডিঅ'ত ৰূপান্তৰ কৰা হয়। টেক্সট-টু-স্পিচ দ্বাৰা বৰ্তমান অডিঅ'ক ইনপুট হিচাপে গ্ৰহণ কৰা হয় আৰু ইয়াক সরাসৰি নতুন অডিঅ'ত ৰূপান্তৰ কৰা হয় - প্লেট টেক্সটৰ পৰা কথা সৃষ্টি কৰাৰ পৰিবৰ্তে মূল ৰেকৰ্ডৰ প্ৰাকৃতিক ৰিদম, স্থগিত, জোৰ আৰু অনুভূতি সংৰক্ষণ কৰি।

সাধাৰণ ব্যৱহাৰসমূহৰ ভিতৰত ভিডিঅ'সমূহক অন্য ভাষাত ডুবিং কৰা, এটা ৰেকৰ্ডত বক্তৃতাৰ শব্দ পৰিবৰ্তন কৰা, বৰ্তমান অডিঅ'ৰ অনুভূতি অথবা টোন পৰিবৰ্তন কৰা, প্ৰস্তুত ৰেকৰ্ডসমূহৰ পৰা ভয়েসঅভাৰ সৃষ্টি কৰা, আৰু ৰেকৰ্ড কৰা শব্দসমূহৰ বিষয়বস্তু সংৰক্ষণ কৰি অজ্ঞাত কৰা অন্তৰ্ভুক্ত আছে।

OpenVoice আৰু RVC ৰ দৰে ধ্বনি পৰিবৰ্তন মডেলসমূহে ধ্বনি-থেকে-ধ্বনি পৰিবৰ্তন ব্যৱস্থাপনা কৰে। ক্ৰাছ-লেঙ্গুৱেজ ধ্বনি-থেকে-ধ্বনি ব্যৱস্থাপনাৰ বাবে, CosyVoice2এবং GPT-SoVITS এটা ভিন্ন ভাষাত ক্লোন আৰু পুনৰ-সংমিশ্ৰণ কৰিব পাৰে। Chatterbox এ reference-audio-based সংমিশ্ৰণও সমৰ্থন কৰে।

হ্যাঁ। ধ্বনি ক্লোনিং মডেল ব্যৱহাৰ কৰি, আপুনি নিজৰ ধ্বনি বৈশিষ্টসমূহ সংৰক্ষণ কৰি আপোনাৰ ধ্বনিক অন্য এটা ভাষালৈ পৰিবৰ্তন কৰিব পাৰে। AI এ আপোনাৰ ধ্বনি পৰিচয় এক্সট্ৰেক্ট কৰে আৰু লক্ষ্য ভাষা অথবা শৈলীত অডিঅ' পুনৰ-সংমিশ্ৰণ কৰে।

পাইপলাইনে প্ৰথমে আপোনাৰ কথোপকথন অনুবাদ কৰে, টেক্সটক লক্ষ্য ভাষালৈ অনুবাদ কৰে, তাৰ পিছত কথোপকথন ক্লোনিং ব্যৱহাৰ কৰি অনুবাদ কৰা টেক্সটক আপোনাৰ মূল কথোপকথনত সংশ্লেষণ কৰে। CosyVoice2ৰ দৰে মডেলসমূহে ক্ৰস-ভাষা সংশ্লেষণৰ বাবে ৮টা ভাষা সমৰ্থন কৰে।

সৰ্বোত্তম ফলাফলৰ বাবে, নিম্নতম পটভূমিৰ শব্দৰ সৈতে পৰিষ্কাৰ অডিঅ' আপলোড কৰক। 16kHz অথবা অধিকত WAV অথবা FLAC সৰ্বোত্তমভাবে কাম কৰে। MP3, OGG, M4A, আৰু WEBMও গ্ৰহণ কৰা হয়। পৰিষ্কাৰ কথোপকথনে সৰ্বাধিক সঠিক ৰূপান্তৰ প্ৰদান কৰে।

Synthesizing ৰ বাবে Kokoro আৰু recognition ৰ বাবে Faster Whisper ৰ দৰে দ্রুত মডেল ব্যৱহাৰ কৰি আমাৰ API ৰ দ্বাৰা প্ৰায়-ৰিয়েল-টাইম প্ৰক্ৰিয়াকৰণ উপলব্ধ। Latency মডেল আৰু অডিঅ' দৈৰ্ঘ্যৰ ওপৰত নিৰ্ভৰ কৰে, কিন্তু short utterances ৰ বাবে sub-3-second turnarounds উপলব্ধ হয়।

হ্যাঁ। Chatterbox, Spark TTS, আৰু IndexTTS-2 ৰ দৰে মডেলসমূহে অনুভূতি আৰু শৈলী নিয়ন্ত্ৰণ সমৰ্থন কৰে। আপুনি একই শব্দ আৰু বক্তাৰ পৰিচয় ৰক্ষা কৰি শান্ত কথোপকথনক উত্তেজিত, দুঃখিতক সুখী অথবা নিৰপেক্ষক নাটকীয়ত পৰিবৰ্তন কৰিব পাৰে।

Speech to Speech এ স্বীকৃতি আৰু সংশ্লেষণ ক্ৰেডিটসমূহ একত্ৰিত কৰে। এটা সাধাৰণ ১-মিনিটৰ পৰিবৰ্তনে নিৰ্বাচিত মডেলৰ ওপৰত নিৰ্ভৰ কৰি ৩-৮ ক্ৰেডিট ব্যৱহাৰ কৰে। Kokoro ৰ দৰে ফ্ৰি-টিয়াৰ মডেলসমূহ শূণ্য ব্যয়ত সংশ্লেষণ পদক্ষেপৰ বাবে ব্যৱহাৰ কৰিব পাৰি।

বিনামূলীয়া ব্যৱহাৰকাৰীসকলে ১ মিনিটলৈকে অডিঅ' প্ৰক্ৰিয়া কৰিব পাৰে। পৰিশোধিত প্লানসমূহ ১০ মিনিটলৈকে ফাইলসমূহ সমৰ্থন কৰে। দীঘল ৰেকৰ্ডসমূহৰ বাবে, অডিঅ'ক অংশত বিভাজন কৰক অথবা দৈৰ্ঘ্যৰ কোনো সীমা নোহোৱাকৈ ব্যাচ প্ৰক্ৰিয়াকৰণৰ বাবে আমাৰ API ব্যৱহাৰ কৰক।

হ'ব, আপলোড কৰা সকলো অডিঅ' আমাৰ সুৰক্ষিত GPU চাৰ্ভাৰত প্ৰক্ৰিয়া কৰা হয় আৰু ২৪ ঘন্টাৰ ভিতৰত স্বয়ংক্ৰিয়ভাৱে আঁতৰুৱা হয়। আমি আপোনাৰ অডিঅ'ক মডেল প্ৰশিক্ষণৰ বাবে কেতিয়াও ব্যৱহাৰ নকৰো। সকলো প্ৰেৰণ এনক্ৰিপ্ট কৰা সংযোগ ব্যৱহাৰ কৰে আৰু চাৰ্ভাৰৰ পৰা চাৰ্ভাৰৰ সংযোগ প্ৰমাণিত হয়।
5.0/5 (1)

AI ৰ সৈতে যিকোনো কথন পৰিবৰ্তন কৰক

শব্দ, অনুভূতি, ভাষা আৰু শৈলী পৰিবৰ্তন কৰক। বিনামূল্যে নিবন্ধন কৰক আৰু আৰম্ভ কৰিবলৈ ৫০ ক্রেডিট প্ৰাপ্ত কৰক।