কথাৰ পৰা কথালৈName

কথোপকথনৰ অডিঅ' পৰিবৰ্তন কৰক - মূল বিষয়বস্তু সংৰক্ষণ কৰি কন্ঠ, অনুভূতি, ভাষা আৰু শৈলী পৰিবৰ্তন কৰক।

বিনামূল্যে নিবন্ধন কৰক

আমি আপোনাৰ কণ্ঠ বিক্ৰী কৰক

অডিঅ' উৎস

আপোনাৰ নথিপত্ৰ এখানে টানি আনুন, অথবা ব্ৰাউছ কৰক

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

— অথবা আপোনাৰ কন্ঠ ৰেকৰ্ড কৰক —

00:00

পৰিবৰ্তনৰ বৈশিষ্ট্যসমূহ

পৰিবৰ্তনৰ ধৰণ

আৰ্হি

লক্ষ্য ধ্বনি

ফলাফল

কথোপকথনৰ অডিঅ' আপলোড কৰক, আপোনাৰ পৰিবৰ্তন বাছক, আৰু আৰম্ভ কৰিবলৈ পৰিবৰ্তন ক্লিক কৰক

কিদৰে কাম কৰে

১. উচ্চাৰণ আপলোড কৰক

আপুনি পৰিবৰ্তন কৰিব বিচৰা অডিঅ' ৰেকৰ্ড কৰক অথবা আপলোড কৰক

2. পৰিবৰ্তন নিৰ্ব্বাচন কৰক

শব্দ পৰিবৰ্তন, শৈলী স্থানান্তৰ, অথবা ভাষা ৰূপান্তৰ বাছক

AI পৰিবৰ্তন

AI প্ৰক্ৰিয়াকৰণ অডিঅ' end-to-end সংৰক্ষণ কৰোতে কথোপকথনৰ সামগ্ৰী

ডাউনলোড কৰক

ফলাফল শুনক আৰু আপোনাৰ পৰিবৰ্তিত অডিঅ' ডাউনল'ড কৰক

ব্যৱহাৰৰ ঘটনাসমূহ

বিষয়বস্তু, অভিগম্যতা, আৰু সৃজনশীল প্ৰকল্পসমূহৰ বাবে শব্দৰ পৰা শব্দলৈ

ভিডিঅ' ডুবিং

মূল কথোপকথক সংৰক্ষণ কৰি ভিডিঅ'সমূহ অন্য ভাষাত ডাব কৰক

ইমোচন সংশোধন

ৰেকৰ্ডসমূহৰ আবেগিক টোন পৰিবৰ্তন কৰক - শান্ত কথোপকথন উত্তেজিত কৰক, অথবা নিৰপেক্ষ কথোপকথন উষ্ণ আৰু বন্ধুত্বপূৰ্ণ কৰক।

বক্তৃতা প্ৰস্তুতকৰণ

বিভিন্ন ধ্বনি আৰু শৈলীৰ সৈতে কঠিন ধ্বনি ৰেকৰ্ডসমূহক সৰল ধ্বনিলৈ পৰিবৰ্তন কৰক।

ভয়েস এনোনিমাইজেশন

স্পিকার আড়াল কৰক

কথাৰ পৰা কথাৰ আৰ্হিName

OpenVoice

দ্ৰুত ধ্বনি পৰিবৰ্তনৰ সৈতে granular শৈলী নিয়ন্ত্ৰণ। ধ্বনি পৰিচয়, গতি, আৰু অনুভূতি ছেকেণ্ডত পৰিবৰ্তন কৰক।

দ্রুত প্ৰক্ৰিয়াকৰণ
বিন্যাস স্থানান্তৰ
ক্ৰচ-লিঙ্গুইজ

Chatterbox

Resemble AI ৰ পৰা fine-grained অনুভূতি নিয়ন্ত্ৰণৰ সৈতে Zero-shot শব্দ ক্লোনিং।

ইমোচন নিয়ন্ত্ৰণ
Zero-shot ক্লোনিং
উচ্চ বিশ্বাসযোগ্যতা

CosyVoice 2

প্ৰাকৃতিক প্ৰোসোডি আৰু ষ্ট্ৰীমিং সমৰ্থনৰ সৈতে ৮টা ভাষাত ক্ৰচ-লেঙ্গুৱেজ কন্ঠ ক্লোন কৰা হৈছে।

ভাষাসমূহ
শব্দ ক্লোনিং
স্ট্ৰিমিং

সদায় সোধা প্ৰশ্নসমূহ

Speech to Speech (STS) AI এ এটা কথোপকথনৰ অডিঅ' ৰেকৰ্ডক এটা ভিন্ন কথোপকথনৰ আউটপুটত পৰিবৰ্তন কৰে - মূল শব্দ আৰু সময় সংৰক্ষণ কৰি কন্ঠ, শৈলী, অনুভূতি, বা ভাষা পৰিবৰ্তন কৰে। ই একক পাইপলাইনত কথোপকথন চিনাক্তকৰণ, প্ৰক্ৰিয়াকৰণ, আৰু সংশ্লেষণ একত্ৰিত কৰে।

টেক্সট-টু-স্পিচ দ্বাৰা লিখিত টেক্সট অডিঅ'ত ৰূপান্তৰ কৰা হয়। টেক্সট-টু-স্পিচ দ্বাৰা বৰ্তমান অডিঅ'ক ইনপুট হিচাপে গ্ৰহণ কৰা হয় আৰু ইয়াক সরাসৰি নতুন অডিঅ'ত ৰূপান্তৰ কৰা হয় - প্লেট টেক্সটৰ পৰা কথা সৃষ্টি কৰাৰ পৰিবৰ্তে মূল ৰেকৰ্ডৰ প্ৰাকৃতিক ৰিদম, স্থগিত, জোৰ আৰু অনুভূতি সংৰক্ষণ কৰি।

সাধাৰণ ব্যৱহাৰসমূহৰ ভিতৰত ভিডিঅ'সমূহক অন্য ভাষাত ডুবিং কৰা, এটা ৰেকৰ্ডত বক্তৃতাৰ শব্দ পৰিবৰ্তন কৰা, বৰ্তমান অডিঅ'ৰ অনুভূতি অথবা টোন পৰিবৰ্তন কৰা, প্ৰস্তুত ৰেকৰ্ডসমূহৰ পৰা ভয়েসঅভাৰ সৃষ্টি কৰা, আৰু ৰেকৰ্ড কৰা শব্দসমূহৰ বিষয়বস্তু সংৰক্ষণ কৰি অজ্ঞাত কৰা অন্তৰ্ভুক্ত আছে।

OpenVoice আৰু RVC ৰ দৰে ধ্বনি পৰিবৰ্তন মডেলসমূহে ধ্বনি-থেকে-ধ্বনি পৰিবৰ্তন ব্যৱস্থাপনা কৰে। ক্ৰাছ-লেঙ্গুৱেজ ধ্বনি-থেকে-ধ্বনি ব্যৱস্থাপনাৰ বাবে, CosyVoice2এবং GPT-SoVITS এটা ভিন্ন ভাষাত ক্লোন আৰু পুনৰ-সংমিশ্ৰণ কৰিব পাৰে। Chatterbox এ reference-audio-based সংমিশ্ৰণও সমৰ্থন কৰে।

হ্যাঁ। ধ্বনি ক্লোনিং মডেল ব্যৱহাৰ কৰি, আপুনি নিজৰ ধ্বনি বৈশিষ্টসমূহ সংৰক্ষণ কৰি আপোনাৰ ধ্বনিক অন্য এটা ভাষালৈ পৰিবৰ্তন কৰিব পাৰে। AI এ আপোনাৰ ধ্বনি পৰিচয় এক্সট্ৰেক্ট কৰে আৰু লক্ষ্য ভাষা অথবা শৈলীত অডিঅ' পুনৰ-সংমিশ্ৰণ কৰে।

পাইপলাইনে প্ৰথমে আপোনাৰ কথোপকথন অনুবাদ কৰে, টেক্সটক লক্ষ্য ভাষালৈ অনুবাদ কৰে, তাৰ পিছত কথোপকথন ক্লোনিং ব্যৱহাৰ কৰি অনুবাদ কৰা টেক্সটক আপোনাৰ মূল কথোপকথনত সংশ্লেষণ কৰে। CosyVoice2ৰ দৰে মডেলসমূহে ক্ৰস-ভাষা সংশ্লেষণৰ বাবে ৮টা ভাষা সমৰ্থন কৰে।

সৰ্বোত্তম ফলাফলৰ বাবে, নিম্নতম পটভূমিৰ শব্দৰ সৈতে পৰিষ্কাৰ অডিঅ' আপলোড কৰক। 16kHz অথবা অধিকত WAV অথবা FLAC সৰ্বোত্তমভাবে কাম কৰে। MP3, OGG, M4A, আৰু WEBMও গ্ৰহণ কৰা হয়। পৰিষ্কাৰ কথোপকথনে সৰ্বাধিক সঠিক ৰূপান্তৰ প্ৰদান কৰে।

Synthesizing ৰ বাবে Kokoro আৰু recognition ৰ বাবে Faster Whisper ৰ দৰে দ্রুত মডেল ব্যৱহাৰ কৰি আমাৰ API ৰ দ্বাৰা প্ৰায়-ৰিয়েল-টাইম প্ৰক্ৰিয়াকৰণ উপলব্ধ। Latency মডেল আৰু অডিঅ' দৈৰ্ঘ্যৰ ওপৰত নিৰ্ভৰ কৰে, কিন্তু short utterances ৰ বাবে sub-3-second turnarounds উপলব্ধ হয়।

হ্যাঁ। Chatterbox, Spark TTS, আৰু IndexTTS-2 ৰ দৰে মডেলসমূহে অনুভূতি আৰু শৈলী নিয়ন্ত্ৰণ সমৰ্থন কৰে। আপুনি একই শব্দ আৰু বক্তাৰ পৰিচয় ৰক্ষা কৰি শান্ত কথোপকথনক উত্তেজিত, দুঃখিতক সুখী অথবা নিৰপেক্ষক নাটকীয়ত পৰিবৰ্তন কৰিব পাৰে।

Speech to Speech এ স্বীকৃতি আৰু সংশ্লেষণ ক্ৰেডিটসমূহ একত্ৰিত কৰে। এটা সাধাৰণ ১-মিনিটৰ পৰিবৰ্তনে নিৰ্বাচিত মডেলৰ ওপৰত নিৰ্ভৰ কৰি ৩-৮ ক্ৰেডিট ব্যৱহাৰ কৰে। Kokoro ৰ দৰে ফ্ৰি-টিয়াৰ মডেলসমূহ শূণ্য ব্যয়ত সংশ্লেষণ পদক্ষেপৰ বাবে ব্যৱহাৰ কৰিব পাৰি।

বিনামূলীয়া ব্যৱহাৰকাৰীসকলে ১ মিনিটলৈকে অডিঅ' প্ৰক্ৰিয়া কৰিব পাৰে। পৰিশোধিত প্লানসমূহ ১০ মিনিটলৈকে ফাইলসমূহ সমৰ্থন কৰে। দীঘল ৰেকৰ্ডসমূহৰ বাবে, অডিঅ'ক অংশত বিভাজন কৰক অথবা দৈৰ্ঘ্যৰ কোনো সীমা নোহোৱাকৈ ব্যাচ প্ৰক্ৰিয়াকৰণৰ বাবে আমাৰ API ব্যৱহাৰ কৰক।

হ'ব, আপলোড কৰা সকলো অডিঅ' আমাৰ সুৰক্ষিত GPU চাৰ্ভাৰত প্ৰক্ৰিয়া কৰা হয় আৰু ২৪ ঘন্টাৰ ভিতৰত স্বয়ংক্ৰিয়ভাৱে আঁতৰুৱা হয়। আমি আপোনাৰ অডিঅ'ক মডেল প্ৰশিক্ষণৰ বাবে কেতিয়াও ব্যৱহাৰ নকৰো। সকলো প্ৰেৰণ এনক্ৰিপ্ট কৰা সংযোগ ব্যৱহাৰ কৰে আৰু চাৰ্ভাৰৰ পৰা চাৰ্ভাৰৰ সংযোগ প্ৰমাণিত হয়।

5.0/5 (1)

AI ৰ সৈতে যিকোনো কথন পৰিবৰ্তন কৰক

শব্দ, অনুভূতি, ভাষা আৰু শৈলী পৰিবৰ্তন কৰক। বিনামূল্যে নিবন্ধন কৰক আৰু আৰম্ভ কৰিবলৈ ৫০ ক্রেডিট প্ৰাপ্ত কৰক।

বিনামূল্যে নিবন্ধন কৰক মূল্য দেখুৱাওক

কথাৰ পৰা কথালৈName

অডিঅ' উৎস

পৰিবৰ্তনৰ বৈশিষ্ট্যসমূহ

ফলাফল

মূল

পৰিবৰ্তন কৰা হৈছে

কিদৰে কাম কৰে

১. উচ্চাৰণ আপলোড কৰক

2. পৰিবৰ্তন নিৰ্ব্বাচন কৰক

AI পৰিবৰ্তন

ডাউনলোড কৰক

ব্যৱহাৰৰ ঘটনাসমূহ

ভিডিঅ' ডুবিং

ইমোচন সংশোধন

বক্তৃতা প্ৰস্তুতকৰণ

ভয়েস এনোনিমাইজেশন

কথাৰ পৰা কথাৰ আৰ্হিName

OpenVoice

Chatterbox

CosyVoice 2

সদায় সোধা প্ৰশ্নসমূহ

স্পীচ টু স্পীচ এআই কি?

টেক্সট-টু-স্পীচ আৰু স্পীচ-টু-স্পীচৰ মাজত কি পাৰ্থক্য আছে?

মই কিহৰ বাবে স্পীচ টু স্পীচ ব্যৱহাৰ কৰিব পাৰিম?

কোনবোৰ মডেলে স্পীচ-টু-স্পীচ সমৰ্থন কৰে?

স্পীচ-টু-স্পীচ দ্বাৰা মোৰ মূল শব্দ সংৰক্ষিত হ'ব নেকি?

কেনেকৈ কৰ্ম কৰে ভাষাৰ মাজৰ কথোপকথন?

মই কি ধৰণৰ অডিঅ' আপলোড কৰিব লাগিব?

প্ৰকৃত সময়ৰ কথোপকথন কথোপকথন সম্ভৱ নে?

মই আচৰণ বা কথা কোৱাৰ ধৰণ সলনি কৰিব পাৰিম নে?

স্পীচ-টু-স্পীচৰ মূল্য কিমান?

অডিঅ'ৰ সৰ্বাধিক দৈৰ্ঘ্য কি?

মোৰ অডিঅ' ব্যক্তিগতভাৱে ৰখা হ'ব নে?

AI ৰ সৈতে যিকোনো কথন পৰিবৰ্তন কৰক