কথাৰ পৰা লিপিলৈName

AI ৰ সহায়ত অডিঅ' আৰু ভিডিঅ'ক টেক্সটলৈ অনুবাদ কৰক। ৯৯টা ভাষা, সময়চিহ্ন, আৰু কথোপকথন চিনাক্তকৰণ সমৰ্থন কৰে।

বিনামূল্যে নিবন্ধন কৰক

অডিঅ' আপলোড কৰক

আপোনাৰ নথিপত্ৰ এখানে টানি আনুন, অথবা ব্ৰাউছ কৰক

MP3, WAV, FLAC, OGG, M4A, MP4, WebM সমৰ্থন কৰে। সৰ্বাধিক ১০০ মেগাবাইট।

— অথবা আপোনাৰ মাইক্ৰফোনৰ পৰা ৰেকৰ্ড কৰক —

00:00

বৈশিষ্ট্যাবলী

আৰ্হি

ভাষা

সময়চিহ্ন অন্তৰ্ভুক্ত কৰক

স্পিকার ডায়াৰাইজেশন

1,000/min আখৰ — নিবন্ধন কৰক ব্যৱহাৰ অনুসৰণ কৰক

অনুবাদ

এটা অডিঅ' নথিপত্ৰ আপলোড কৰক আৰু আৰম্ভ কৰিবলৈ Transcribe ক্লিক কৰক

কিদৰে কাম কৰে

অডিঅ' আপলোড কৰক

আপোনাৰ অডিঅ' অথবা ভিডিঅ' নথিপত্ৰ আপলোড কৰক। আমি MP3, WAV, FLAC, OGG, M4A, MP4, আৰু WebM বিন্যাসসমূহ ১০০ মেগাবাইটলৈকে সমৰ্থন কৰোঁ।

2. AI অনুলিপি

আমাৰ এআই মডেলসমূহে আপোনাৰ অডিঅ’ প্ৰক্ৰিয়াকৰণ কৰে, ভাষা চিনাক্ত কৰে, বক্তৃতাকাৰীক চিনাক্ত কৰে আৰু সময়সূচীৰ সৈতে সঠিক টেক্সট নিৰ্মাণ কৰে।

3. আপোনাৰ টেক্সট প্ৰাপ্ত কৰক

আপোনাৰ অনুবাদ কপি কৰক অথবা ইয়াক TXT অথবা SRT উপশীৰ্ষক বিন্যাস হিচাপে ডাউনল'ড কৰক। প্ৰয়োজন অনুসাৰে সম্পাদন কৰক আৰু উন্নত কৰক।

ব্যৱহাৰৰ ঘটনাসমূহ

প্ৰতিটো উদ্যোগ আৰু কাৰ্য্যপ্ৰবাহৰ বাবে বাক্যৰ পৰা টেক্সট

সভা আৰু সম্মেলন

স্বয়ংক্ৰিয়ভাবে Zoom, Teams, আৰু Google Meet ৰেকৰ্ডসমূহ অনুবাদ কৰক। কৰ্ম বস্তু পুনৰ কেতিয়াও হেৰুৱাব নালাগে। সভাৰ টোকা বা উপশীৰ্ষক হিচাপে এক্সপোৰ্ট কৰক।

সাক্ষাৎকাৰ আৰু সাংবাদিকতা

প্ৰবন্ধ, গৱেষণাপত্ৰ, আৰু দস্তাবেজসমূহৰ বাবে সাক্ষাৎকাৰসমূহৰ অনুলিপি কৰক। স্পীকাৰ ডায়াৰাইজেছনে সহজ অনুদানৰ বাবে কোনে কি কৈছিল তা চিনাক্ত কৰে।

পডকাস্ট আৰু মিডিয়া

পডকাস্টৰ অধ্যায়সমূহৰ বাবে অনুবাদসমূহ সৃষ্টি কৰক আৰু টোকাসমূহ দেখুৱাওক। আপোনাৰ অডিঅ' সমলসমূহৰ সন্ধানযোগ্য আৰ্কাইভসমূহ সৃষ্টি কৰক। ভিডিঅ' পডকাস্টসমূহত উপশীৰ্ষকসমূহ যোগ কৰক।

পাঠ্যক্ৰম আৰু শিক্ষা

ৰেকৰ্ড কৰা বক্তৃতাসমূহক অধ্যয়নৰ নোটসমূহত পৰিবৰ্তন কৰক। সঠিক উপশীৰ্ষকসমূহৰ সৈতে শিক্ষামূলক বিষয়বস্তুসমূহ অভিগম্য কৰক। শ্রৱণ বিকলতাৰ সৈতে ছাত্ৰসকলক সমৰ্থন কৰক।

মেডিক্যাল ডিক্টেচন

ডাক্তৰ-চিকিৎসকৰ পৰামৰ্শ, ক্লিনিক্যাল নোট, আৰু মেডিক্যাল ডিক্টেটৰ অনুবাদ কৰক। AI-চালিত সঠিকতাৰ সৈতে হস্তচালিত দস্তাবেজসমূহৰ ঘন্টাসমূহ সংৰক্ষণ কৰক।

আইনী প্ৰক্ৰিয়া

উপস্থাপন, শুনানি, আৰু গ্ৰাহক সভাসমূহ অনুলিপি কৰক। আইনী উদ্ধৃতিৰ বাবে সঠিক সময়চিহ্ন। ন্যায়ালয়ৰ দস্তাবেজসমূহৰ বাবে উপযুক্ত বিন্যাসসমূহত এক্সপোৰ্ট কৰক।

STT আৰ্হিৰ তুলনা

Whisper

৯৯টা ভাষা সমৰ্থন কৰা OpenAI ৰ শক্তিশালী কথা স্বীকৃতি মডেল।

ভাষাসমূহ
অনুবাদ
সময়চিহ্ন
ধুমুহাৰ বাবে মজবুত

OpenAI

Faster Whisper

CTranslate2 অনুকূলনৰ সৈতে Whisper ৰ পৰা 4x দ্ৰুত, সমান সঠিকতা।

4x দ্ৰুত
মেমৰি হ্ৰাস কৰক
সকলো আৰ্হিৰ আকাৰ
ব্যাচ প্ৰক্ৰিয়াকৰণ
VAD ফিল্টাৰিং

SYSTRAN

SenseVoice

আবেগ চিনাক্তকৰণৰ সৈতে কথা বুজি পোৱা মডেল, ৫০+ ভাষা।

ভাষাসমূহ
আবেগ চিনাক্তকৰণ
অডিঅ' ঘটনাসমূহ
স্পিকার বিশ্লেষণ
সমৃদ্ধ মেটাডাটা

Alibaba (FunAudioLLM)

কথা-লেখ্য পৰিকল্পনাসমূহ

বিনামূল্যে আৰম্ভ কৰক, আরো প্ৰয়োজন হ'লে উন্নত কৰক

মুক্ত

১ মিনিটৰ অডিঅ' সীমা
দ্ৰুত Whisper মডেল
মৌলিক অনুবাদ
ভাষাসমূহ

সৰ্বাধিক জনপ্ৰিয়

মুক্ত একাওন্ট

৩০ মিনিটৰ অডিঅ' + ১৫,০০০ আখৰ
সকলো STT আৰ্হি
শব্দ-স্তরৰ সময়চিহ্ন
SRT আৰু VTT উপশীৰ্ষকসমূহ ৰপ্তানি কৰক
স্পিকার ডায়াৰাইজেশন

বিনামূল্যে নিবন্ধন কৰক

প্ৰো

২ ঘন্টাৰ অডিঅ' নথিপত্ৰ
ব্যাচ অনুবাদ
অগ্ৰাধিকাৰ প্ৰক্ৰিয়াকৰণ
API অভিগম
স্বনিৰ্বাচিত শব্দভাণ্ডাৰ

উন্নত কৰক

সদায় সোধা প্ৰশ্নসমূহ

Speech to text (STT), যাক স্বয়ংক্ৰিয় ভাষা চিনাক্তকৰণ (ASR) বুলিও কোৱা হয়, কথোপকথনৰ ভাষাক লিখিত টেক্সটলৈ ৰূপান্তৰ কৰে। আমাৰ মডেলসমূহে AI ব্যৱহাৰ কৰি সভাৰ, সাক্ষাৎকাৰ, পডকাষ্ট, বক্তৃতাৰ, আৰু অধিকৰ পৰা সঠিকভাৱে অডিঅ' ট্ৰান্সক্ৰিপ্ট কৰে।

অধিকাংশ ব্যৱহাৰৰ ক্ষেত্ৰত দ্ৰুত Whisper ৰ প্ৰস্তাৱ কৰা হয় - এইটো মূল Whisper ৰ তুলনাত ৪x দ্ৰুত আৰু একই সঠিকতা বজাই ৰখা হয়। যদি আপোনাৰ অনুবাদৰ লগতে অনুভূতি চিনাক্তকৰণ বা অডিঅ' ঘটনা চিনাক্তকৰণ প্ৰয়োজন হয় তেন্তে SenseVoice ব্যৱহাৰ কৰক।

MP3, WAV, M4A, OGG, FLAC, WEBM, আৰু অধিকাংশ সাধাৰণ অডিঅ'/ভিডিঅ' বিন্যাস সমৰ্থিত। সৰ্বাধিক নথিপত্ৰৰ আকাৰ ৫০ মেগাবাইট। ডাঙৰ নথিপত্ৰসমূহৰ বাবে, অডিঅ'ক প্ৰথমে বিভাজন কৰাটো চিন্তা কৰক।

বিনামূলীয়া ব্যৱহাৰকাৰীসকলে ৫ মিনিটৰ অডিঅ' ৰেকৰ্ড কৰিব পাৰে। পৰিশোধিত পৰিকল্পনাসমূহে ২ ঘন্টাৰ অডিঅ' ফাইলসমূহ সমৰ্থন কৰে। দীঘলীয়া ৰেকৰ্ডসমূহৰ বাবে, ব্যাচ প্ৰসেসিংৰ সৈতে আমাৰ API ব্যৱহাৰ কৰক।

আমাৰ মডেলসমূহে স্পষ্ট ইংৰাজী কথোপকথনৰ ক্ষেত্ৰত ৯৫%+ সঠিকতা লাভ কৰে। সঠিকতা ভাষা, অডিঅ' গুণমান আৰু পটভূমিৰ শব্দৰ ওপৰত নিৰ্ভৰ কৰে। Faster Whisper আৰু Whisper ৯৯টা ভাষাক বিভিন্ন সঠিকতা স্তৰৰ সৈতে সমৰ্থন কৰে।

হ্যাঁ, আমাৰ উন্নত অনুবাদ মোডসমূহে অডিঅ'ত বিভিন্ন কথোপকথনকাৰীক চিনাক্ত কৰিব পাৰে আৰু লেবেল কৰিব পাৰে। কথোপকথনকাৰীৰ ডায়াৰাইজেশন বিশেষকৈ সভা অনুবাদ, সাক্ষাৎকাৰ, আৰু বহু-ব্যক্তিৰ পডকাস্টৰ বাবে ব্যৱহাৰযোগ্য য'ত আপুনি জানিবলৈ প্ৰয়োজন যে কোনে কি কৈছিল।

Faster Whisper ব্যৱহাৰ কৰি আমাৰ APIৰ জৰিয়তে ৰিয়েল-টাইম ষ্ট্ৰীমিং অনুবাদ উপলব্ধ। অডিঅ' প্ৰাপ্ত হোৱাৰ লগে লগে চুকসমূহত প্ৰক্ৰিয়া কৰা হয়, কম লেটেন্সিৰ সৈতে আংশিক অনুবাদ প্ৰদান কৰে। এইটো লাইভ উপশীৰ্ষক আৰু ৰিয়েল-টাইম টোকা লোৱাৰ বাবে আদর্শ।

হ'ব, আমাৰ অনুবাদৰ আউটপুটত শব্দ-স্তরৰ সময়চিহ্ন অন্তৰ্ভুক্ত আছে যি SRT, VTT, অথবা ASS উপশীৰ্ষক নথিপত্ৰ হিচাপে এক্সপোৰ্ট কৰিব পাৰি। YouTube ভিডিঅ', অনলাইন কৰ্মশালা, আৰু সামাজিক মিডিয়া বিষয়বস্তুত উপশীৰ্ষক যোগ কৰিবলৈ এইটো সম্পূৰ্ণ।

হ্যাঁ, অবিকল্পিতৰূপে সকলো অনুবাদৰ ফলাফলত অংশ স্তৰৰ সময়চিহ্ন অন্তৰ্ভুক্ত কৰা হয়। শব্দ স্তৰৰ সময়চিহ্নও উপলব্ধ, যি অডিঅ'ত প্ৰতিটো শব্দৰ সঠিক আৰম্ভণি আৰু সমাপ্তিৰ সময় দেখুৱায়।

Faster Whisper বিভিন্ন অডিঅ'ত প্ৰশিক্ষিত আৰু মধ্যম পটভূমিৰ ধ্বনি ভালদৰে হ্যান্ডেল কৰে। খুব ধ্বনিযুক্ত ৰেকৰ্ডিংৰ বাবে, আমি অনুৰোধ কৰো যে অডিঅ'ক আমাৰ অডিঅ' উন্নয়নকাৰীৰ দ্বাৰা প্ৰথমে চলাওক যাতে অনুবাদ কৰাৰ পূৰ্বে স্পষ্টতা উন্নত হয়।

হ'ব, আপলোড কৰা অডিঅ' নথিপত্ৰসমূহ আমাৰ সুৰক্ষিত GPU চাৰ্ভাৰত প্ৰক্ৰিয়া কৰা হয় আৰু অনুবাদ সম্পূৰ্ণ হোৱাৰ পিছত স্বয়ংক্ৰিয়ভাৱে আঁতৰুৱা হয়। আমি আপোনাৰ অডিঅ'ক প্ৰশিক্ষণৰ উদ্দেশ্যে সংৰক্ষণ, অংশীদাৰী অথবা ব্যৱহাৰ নকৰো। সকলো প্ৰেৰণ এনক্ৰিপ্ট কৰা হয়।

বিনামূলীয়া ব্যৱহাৰকাৰীসকলে ৫ মিনিটৰ অডিঅ' বিনামূলীয়াকৈ অনুবাদ কৰিব পাৰে। পৰিশোধ কৰা প্ল্যানসমূহে অডিঅ' দৈৰ্ঘ্যৰ ওপৰত ভিত্তি কৰি ক্ৰেডিট ব্যৱহাৰ কৰে: অডিঅ'ৰ প্ৰতি মিনিটত প্ৰায় ১ ক্ৰেডিট। বিস্তাৰিত প্ল্যান তথ্য আৰু ক্ৰেডিট বান্ডেলৰ বাবে আমাৰ মূল্য নিৰ্ধাৰণ পৃষ্ঠা পৰীক্ষা কৰক।

5.0/5 (1)

AI ৰ সৈতে অডিঅ' অনুবাদ কৰক

৯৯টা ভাষাত সঠিক অনুবাদ প্ৰাপ্ত কৰক। বিনামূলীয়াকৈ নিবন্ধন কৰক আৰু আৰম্ভ কৰিবলৈ ৫০টা ক্ৰেডিট প্ৰাপ্ত কৰক।

বিনামূল্যে নিবন্ধন কৰক মূল্য দেখুৱাওক

কথাৰ পৰা লিপিলৈName

অডিঅ' আপলোড কৰক

বৈশিষ্ট্যাবলী

অনুবাদ

কিদৰে কাম কৰে

অডিঅ' আপলোড কৰক

2. AI অনুলিপি

3. আপোনাৰ টেক্সট প্ৰাপ্ত কৰক

ব্যৱহাৰৰ ঘটনাসমূহ

সভা আৰু সম্মেলন

সাক্ষাৎকাৰ আৰু সাংবাদিকতা

পডকাস্ট আৰু মিডিয়া

পাঠ্যক্ৰম আৰু শিক্ষা

মেডিক্যাল ডিক্টেচন

আইনী প্ৰক্ৰিয়া

STT আৰ্হিৰ তুলনা

Whisper

Faster Whisper

SenseVoice

কথা-লেখ্য পৰিকল্পনাসমূহ

সদায় সোধা প্ৰশ্নসমূহ

স্পীচ টু টেক্সট (STT) কি?

কোনটো অনুবাদ মডেল সৰ্বোত্তম?

কি ধৰণৰ অডিঅ' বিন্যাস আপলোড কৰিব পাৰিম?

অনুবাদৰ বাবে কোনো সময়সীমা আছে নে?

অনুবাদ কিয় সঠিক?

কথোপকথনৰ পৰা টেক্সটলৈ কথোপকথনৰ ডায়াৰাইজেশন সমৰ্থন কৰে নে?

মই ৰিয়েল-টাইম অনুবাদ পাব পাৰিম নে?

আমি উপশীৰ্ষক বা SRT নথিপত্ৰ সৃষ্টি কৰিব পাৰিম নে?

অনুবাদত সময়চিহ্ন অন্তৰ্ভুক্ত আছে নে?

সঁজুলিয়ে পটভূমিৰ ধ্বনি কেনেদৰে নিয়ন্ত্ৰণ কৰে?

মোৰ অডিঅ' তথ্য ব্যক্তিগতভাৱে ৰখা হ'ব নে?

কথোপকথনৰ পৰা টেক্সটলৈ পৰিবৰ্তনৰ মূল্য কিমান?

AI ৰ সৈতে অডিঅ' অনুবাদ কৰক