কথাৰ পৰা লিপিলৈName

AI ৰ সহায়ত অডিঅ' আৰু ভিডিঅ'ক টেক্সটলৈ অনুবাদ কৰক। ৯৯টা ভাষা, সময়চিহ্ন, আৰু কথোপকথন চিনাক্তকৰণ সমৰ্থন কৰে।

অডিঅ' আপলোড কৰক

আপোনাৰ নথিপত্ৰ এখানে টানি আনুন, অথবা ব্ৰাউছ কৰক

Supports MP3, WAV, FLAC, OGG, M4A, MP4, WebM. Max 100MB.

file.mp3

0 MB
— অথবা আপোনাৰ মাইক্ৰফোনৰ পৰা ৰেকৰ্ড কৰক —
00:00

বৈশিষ্ট্যাবলী

1 credits Sign up to track usage

অনুবাদ

এটা অডিঅ' নথিপত্ৰ আপলোড কৰক আৰু আৰম্ভ কৰিবলৈ Transcribe ক্লিক কৰক

অডিঅ' ট্ৰান্সক্ৰিপ্ট কৰা হৈছে... ইয়াৰ বাবে কিছু সময়ৰ প্ৰয়োজন হব পাৰে।

চিনাক্ত কৰা হৈছে:

কিদৰে কাম কৰে

অডিঅ' আপলোড কৰক

আপোনাৰ অডিঅ' অথবা ভিডিঅ' নথিপত্ৰ আপলোড কৰক। আমি MP3, WAV, FLAC, OGG, M4A, MP4, আৰু WebM বিন্যাসসমূহ ১০০ মেগাবাইটলৈকে সমৰ্থন কৰোঁ।

2. AI অনুলিপি

আমাৰ এআই মডেলসমূহে আপোনাৰ অডিঅ’ প্ৰক্ৰিয়াকৰণ কৰে, ভাষা চিনাক্ত কৰে, বক্তৃতাকাৰীক চিনাক্ত কৰে আৰু সময়সূচীৰ সৈতে সঠিক টেক্সট নিৰ্মাণ কৰে।

3. আপোনাৰ টেক্সট প্ৰাপ্ত কৰক

আপোনাৰ অনুবাদ কপি কৰক অথবা ইয়াক TXT অথবা SRT উপশীৰ্ষক বিন্যাস হিচাপে ডাউনল'ড কৰক। প্ৰয়োজন অনুসাৰে সম্পাদন কৰক আৰু উন্নত কৰক।

ব্যৱহাৰৰ ঘটনাসমূহ

প্ৰতিটো উদ্যোগ আৰু কাৰ্য্যপ্ৰবাহৰ বাবে বাক্যৰ পৰা টেক্সট

সভা আৰু সম্মেলন

স্বয়ংক্ৰিয়ভাবে Zoom, Teams, আৰু Google Meet ৰেকৰ্ডসমূহ অনুবাদ কৰক। কৰ্ম বস্তু পুনৰ কেতিয়াও হেৰুৱাব নালাগে। সভাৰ টোকা বা উপশীৰ্ষক হিচাপে এক্সপোৰ্ট কৰক।

সাক্ষাৎকাৰ আৰু সাংবাদিকতা

প্ৰবন্ধ, গৱেষণাপত্ৰ, আৰু দস্তাবেজসমূহৰ বাবে সাক্ষাৎকাৰসমূহৰ অনুলিপি কৰক। স্পীকাৰ ডায়াৰাইজেছনে সহজ অনুদানৰ বাবে কোনে কি কৈছিল তা চিনাক্ত কৰে।

পডকাস্ট আৰু মিডিয়া

পডকাস্টৰ অধ্যায়সমূহৰ বাবে অনুবাদসমূহ সৃষ্টি কৰক আৰু টোকাসমূহ দেখুৱাওক। আপোনাৰ অডিঅ' সমলসমূহৰ সন্ধানযোগ্য আৰ্কাইভসমূহ সৃষ্টি কৰক। ভিডিঅ' পডকাস্টসমূহত উপশীৰ্ষকসমূহ যোগ কৰক।

পাঠ্যক্ৰম আৰু শিক্ষা

ৰেকৰ্ড কৰা বক্তৃতাসমূহক অধ্যয়নৰ নোটসমূহত পৰিবৰ্তন কৰক। সঠিক উপশীৰ্ষকসমূহৰ সৈতে শিক্ষামূলক বিষয়বস্তুসমূহ অভিগম্য কৰক। শ্রৱণ বিকলতাৰ সৈতে ছাত্ৰসকলক সমৰ্থন কৰক।

মেডিক্যাল ডিক্টেচন

ডাক্তৰ-চিকিৎসকৰ পৰামৰ্শ, ক্লিনিক্যাল নোট, আৰু মেডিক্যাল ডিক্টেটৰ অনুবাদ কৰক। AI-চালিত সঠিকতাৰ সৈতে হস্তচালিত দস্তাবেজসমূহৰ ঘন্টাসমূহ সংৰক্ষণ কৰক।

আইনী প্ৰক্ৰিয়া

উপস্থাপন, শুনানি, আৰু গ্ৰাহক সভাসমূহ অনুলিপি কৰক। আইনী উদ্ধৃতিৰ বাবে সঠিক সময়চিহ্ন। ন্যায়ালয়ৰ দস্তাবেজসমূহৰ বাবে উপযুক্ত বিন্যাসসমূহত এক্সপোৰ্ট কৰক।

STT আৰ্হিৰ তুলনা

Whisper

৯৯টা ভাষা সমৰ্থন কৰা OpenAI ৰ শক্তিশালী কথা স্বীকৃতি মডেল।

  • 0 ভাষাসমূহ
  • ভাষাসমূহ
  • অনুবাদ
  • সময়চিহ্ন
  • ধুমুহাৰ বাবে মজবুত
OpenAI

Faster Whisper

CTranslate2 অনুকূলনৰ সৈতে Whisper ৰ পৰা 4x দ্ৰুত, সমান সঠিকতা।

  • 0 ভাষাসমূহ
  • 4x দ্ৰুত
  • মেমৰি হ্ৰাস কৰক
  • সকলো আৰ্হিৰ আকাৰ
  • ব্যাচ প্ৰক্ৰিয়াকৰণ
  • VAD ফিল্টাৰিং
SYSTRAN

SenseVoice

আবেগ চিনাক্তকৰণৰ সৈতে কথা বুজি পোৱা মডেল, ৫০+ ভাষা।

  • 0 ভাষাসমূহ
  • ভাষাসমূহ
  • আবেগ চিনাক্তকৰণ
  • অডিঅ' ঘটনাসমূহ
  • স্পিকার বিশ্লেষণ
  • সমৃদ্ধ মেটাডাটা
Alibaba (FunAudioLLM)

Speech-to-Text Plans

Start free, upgrade when you need more

Free
  • 1-minute audio limit
  • Faster Whisper model
  • Basic transcription
  • 100+ languages
Most Popular
Free Account
  • 30-minute audio + 50 credits
  • All STT models
  • Word-level timestamps
  • SRT & VTT subtitle export
  • Speaker diarization
Sign Up Free
Pro
  • 2-hour audio files
  • Batch transcription
  • Priority processing
  • API access
  • Custom vocabulary
Upgrade

সদায় সোধা প্ৰশ্নসমূহ

Speech to text (STT), যাক স্বয়ংক্ৰিয় ভাষা চিনাক্তকৰণ (ASR) বুলিও কোৱা হয়, কথোপকথনৰ ভাষাক লিখিত টেক্সটলৈ ৰূপান্তৰ কৰে। আমাৰ মডেলসমূহে AI ব্যৱহাৰ কৰি সভাৰ, সাক্ষাৎকাৰ, পডকাষ্ট, বক্তৃতাৰ, আৰু অধিকৰ পৰা সঠিকভাৱে অডিঅ' ট্ৰান্সক্ৰিপ্ট কৰে।

অধিকাংশ ব্যৱহাৰৰ ক্ষেত্ৰত দ্ৰুত Whisper ৰ প্ৰস্তাৱ কৰা হয় - এইটো মূল Whisper ৰ তুলনাত ৪x দ্ৰুত আৰু একই সঠিকতা বজাই ৰখা হয়। যদি আপোনাৰ অনুবাদৰ লগতে অনুভূতি চিনাক্তকৰণ বা অডিঅ' ঘটনা চিনাক্তকৰণ প্ৰয়োজন হয় তেন্তে SenseVoice ব্যৱহাৰ কৰক।

MP3, WAV, M4A, OGG, FLAC, WEBM, আৰু অধিকাংশ সাধাৰণ অডিঅ'/ভিডিঅ' বিন্যাস সমৰ্থিত। সৰ্বাধিক নথিপত্ৰৰ আকাৰ ৫০ মেগাবাইট। ডাঙৰ নথিপত্ৰসমূহৰ বাবে, অডিঅ'ক প্ৰথমে বিভাজন কৰাটো চিন্তা কৰক।

বিনামূলীয়া ব্যৱহাৰকাৰীসকলে ৫ মিনিটৰ অডিঅ' ৰেকৰ্ড কৰিব পাৰে। পৰিশোধিত পৰিকল্পনাসমূহে ২ ঘন্টাৰ অডিঅ' ফাইলসমূহ সমৰ্থন কৰে। দীঘলীয়া ৰেকৰ্ডসমূহৰ বাবে, ব্যাচ প্ৰসেসিংৰ সৈতে আমাৰ API ব্যৱহাৰ কৰক।

আমাৰ মডেলসমূহে স্পষ্ট ইংৰাজী কথোপকথনৰ ক্ষেত্ৰত ৯৫%+ সঠিকতা লাভ কৰে। সঠিকতা ভাষা, অডিঅ' গুণমান আৰু পটভূমিৰ শব্দৰ ওপৰত নিৰ্ভৰ কৰে। Faster Whisper আৰু Whisper ৯৯টা ভাষাক বিভিন্ন সঠিকতা স্তৰৰ সৈতে সমৰ্থন কৰে।

হ্যাঁ, আমাৰ উন্নত অনুবাদ মোডসমূহে অডিঅ'ত বিভিন্ন কথোপকথনকাৰীক চিনাক্ত কৰিব পাৰে আৰু লেবেল কৰিব পাৰে। কথোপকথনকাৰীৰ ডায়াৰাইজেশন বিশেষকৈ সভা অনুবাদ, সাক্ষাৎকাৰ, আৰু বহু-ব্যক্তিৰ পডকাস্টৰ বাবে ব্যৱহাৰযোগ্য য'ত আপুনি জানিবলৈ প্ৰয়োজন যে কোনে কি কৈছিল।

Faster Whisper ব্যৱহাৰ কৰি আমাৰ APIৰ জৰিয়তে ৰিয়েল-টাইম ষ্ট্ৰীমিং অনুবাদ উপলব্ধ। অডিঅ' প্ৰাপ্ত হোৱাৰ লগে লগে চুকসমূহত প্ৰক্ৰিয়া কৰা হয়, কম লেটেন্সিৰ সৈতে আংশিক অনুবাদ প্ৰদান কৰে। এইটো লাইভ উপশীৰ্ষক আৰু ৰিয়েল-টাইম টোকা লোৱাৰ বাবে আদর্শ।

হ'ব, আমাৰ অনুবাদৰ আউটপুটত শব্দ-স্তরৰ সময়চিহ্ন অন্তৰ্ভুক্ত আছে যি SRT, VTT, অথবা ASS উপশীৰ্ষক নথিপত্ৰ হিচাপে এক্সপোৰ্ট কৰিব পাৰি। YouTube ভিডিঅ', অনলাইন কৰ্মশালা, আৰু সামাজিক মিডিয়া বিষয়বস্তুত উপশীৰ্ষক যোগ কৰিবলৈ এইটো সম্পূৰ্ণ।

হ্যাঁ, অবিকল্পিতৰূপে সকলো অনুবাদৰ ফলাফলত অংশ স্তৰৰ সময়চিহ্ন অন্তৰ্ভুক্ত কৰা হয়। শব্দ স্তৰৰ সময়চিহ্নও উপলব্ধ, যি অডিঅ'ত প্ৰতিটো শব্দৰ সঠিক আৰম্ভণি আৰু সমাপ্তিৰ সময় দেখুৱায়।

Faster Whisper বিভিন্ন অডিঅ'ত প্ৰশিক্ষিত আৰু মধ্যম পটভূমিৰ ধ্বনি ভালদৰে হ্যান্ডেল কৰে। খুব ধ্বনিযুক্ত ৰেকৰ্ডিংৰ বাবে, আমি অনুৰোধ কৰো যে অডিঅ'ক আমাৰ অডিঅ' উন্নয়নকাৰীৰ দ্বাৰা প্ৰথমে চলাওক যাতে অনুবাদ কৰাৰ পূৰ্বে স্পষ্টতা উন্নত হয়।

হ'ব, আপলোড কৰা অডিঅ' নথিপত্ৰসমূহ আমাৰ সুৰক্ষিত GPU চাৰ্ভাৰত প্ৰক্ৰিয়া কৰা হয় আৰু অনুবাদ সম্পূৰ্ণ হোৱাৰ পিছত স্বয়ংক্ৰিয়ভাৱে আঁতৰুৱা হয়। আমি আপোনাৰ অডিঅ'ক প্ৰশিক্ষণৰ উদ্দেশ্যে সংৰক্ষণ, অংশীদাৰী অথবা ব্যৱহাৰ নকৰো। সকলো প্ৰেৰণ এনক্ৰিপ্ট কৰা হয়।

বিনামূলীয়া ব্যৱহাৰকাৰীসকলে ৫ মিনিটৰ অডিঅ' বিনামূলীয়াকৈ অনুবাদ কৰিব পাৰে। পৰিশোধ কৰা প্ল্যানসমূহে অডিঅ' দৈৰ্ঘ্যৰ ওপৰত ভিত্তি কৰি ক্ৰেডিট ব্যৱহাৰ কৰে: অডিঅ'ৰ প্ৰতি মিনিটত প্ৰায় ১ ক্ৰেডিট। বিস্তাৰিত প্ল্যান তথ্য আৰু ক্ৰেডিট বান্ডেলৰ বাবে আমাৰ মূল্য নিৰ্ধাৰণ পৃষ্ঠা পৰীক্ষা কৰক।
5.0/5 (1)

AI ৰ সৈতে অডিঅ' অনুবাদ কৰক

৯৯টা ভাষাত সঠিক অনুবাদ প্ৰাপ্ত কৰক। বিনামূলীয়াকৈ নিবন্ধন কৰক আৰু আৰম্ভ কৰিবলৈ ৫০টা ক্ৰেডিট প্ৰাপ্ত কৰক।