Convert WAV to Text

Convert WAV audio files to text with AI. High-quality lossless audio transcription in 99 languages. Free online WAV to text tool.

আপনার ভাষায় এখনো TTS শব্দ নেই। আমাদের আপনার শব্দ যোগ করতে সাহায্য করুন! আপনার কণ্ঠ বিক্রি করুন

অডিও অথবা ভিডিও আপলোড করুন

আপনার ফাইল এখানে টেনে নিয়ে যান, অথবা ব্রাউজ

MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV সমর্থন করে। বিনামূল্যে ৫০০ মেগাবাইট পর্যন্ত · প্রফেশনাল ২ জিবি পর্যন্ত।

ফাইল.mp3

0 MB
— অথবা আপনার মাইক্রোফোন থেকে রেকর্ড করুন —
00:00

বৈশিষ্ট্য

1,000/min অক্ষর নিবন্ধন করুন ব্যবহার পর্যবেক্ষণ করুন

ট্রান্সক্রিপশন

অডিও অথবা ভিডিও ফাইল আপলোড করুন এবং শুরু করতে ট্রান্সক্রিপ্ট ক্লিক করুন

অনুবাদ করা হচ্ছে...

সনাক্ত করা হয়েছে:

এটি কিভাবে কাজ করে

১. অডিও অথবা ভিডিও আপলোড করুন

আপনার অডিও অথবা ভিডিও ফাইল আপলোড করুন। আমরা MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV এবং MKV ফরম্যাট সমর্থন করি, সর্বোচ্চ ১০০ মেগাবাইট।

২. এআই ট্রান্সক্রিপশন

আমাদের এআই মডেল আপনার অডিও প্রক্রিয়াজাত করে, ভাষা সনাক্ত করে, বক্তাদের চিহ্নিত করে এবং সময়সূচীসহ সঠিক লেখা তৈরি করে।

৩. আপনার ট্রান্সক্রিপ্ট পেতে

আপনার ট্রান্সক্রিপ্ট কপি করুন অথবা এটি TXT বা SRT সাবটাইটেল ফরম্যাটে ডাউনলোড করুন। প্রয়োজন অনুযায়ী সম্পাদনা এবং উন্নত করুন।

ব্যবহারের ক্ষেত্রে

প্রত্যেক শিল্প এবং কর্মপ্রবাহের জন্য অডিও ট্রান্সক্রিপশন

সভা ও কনফারেন্স

স্বয়ংক্রিয়ভাবে জুম, টিম এবং গুগল মিট রেকর্ডিং অনুলিপি করুন। কখনোই কোন কার্যক্রমের আইটেম মিস করবেন না। সভা নোট বা সাবটাইটেল হিসাবে রপ্তানি করুন।

সাক্ষাৎকার এবং সাংবাদিকতা

প্রবন্ধ, গবেষণাপত্র এবং তথ্যচিত্রের জন্য সাক্ষাৎকার অনুলিপি করুন। স্পিকার ডায়ারিজম সহজে অনুলিপি করার জন্য কে কী বলেছে তা চিহ্নিত করে।

পডকাস্ট এবং মিডিয়া

পডকাস্ট পর্বের জন্য ট্রান্সক্রিপশন এবং নোট প্রদর্শন করুন। আপনার অডিও উপাদানগুলির জন্য অনুসন্ধানযোগ্য আর্কাইভ তৈরি করুন। ভিডিও পডকাস্টের জন্য সাবটাইটেল যোগ করুন।

বক্তৃতা এবং শিক্ষা

রেকর্ড করা লেকচারগুলিকে অধ্যয়ন নোটে রূপান্তর করুন। সঠিক শিরোনামের সাথে শিক্ষামূলক বিষয়বস্তু প্রবেশযোগ্য করুন। শ্রবণ প্রতিবন্ধী শিক্ষার্থীদের সমর্থন করুন।

ইউটিউব এবং সামাজিক মিডিয়া

ইউটিউব ভিডিও, টিকটক এবং সামাজিক মিডিয়া বিষয়বস্তু জন্য সাবটাইটেল এবং বন্ধ শিরোনাম তৈরি করুন। সঠিক অনুবাদ সহ প্রবেশযোগ্যতা এবং এসইও উন্নত করুন।

আইনগত এবং চিকিৎসাName

প্রমাণ, শুনানি, পরামর্শ এবং ডিকশনারি অনুলিপি করুন। রেফারেন্সের জন্য সঠিক সময়সূচী। নথিভুক্ত করার জন্য উপযুক্ত ফরম্যাটে রপ্তানি করুন।

সমর্থিত ফরম্যাট

যেকোন অডিও বা ভিডিও ফাইল অনুবাদ করুন - আমরা স্বয়ংক্রিয়ভাবে অডিও এক্সট্র্যাক্ট করি

অডিও ফরম্যাট

MP3 WAV FLAC OGG M4A AAC WMA OPUS

ভিডিও ফরম্যাট

MP4 WebM AVI MOV MKV WMV FLV M4V

ভিডিও ফাইল থেকে স্বয়ংক্রিয়ভাবে অডিও এক্সট্র্যাক্ট করা হয় অনুবাদ করার জন্য।

অনুবাদ মডেল

Whisper

৯৯টি ভাষা সমর্থনকারী OpenAI's মজবুত বাক সনাক্তকরণ মডেল।

  • ৯৯টি ভাষা
  • অনুবাদ
  • সময়- স্ট্যাম্প
  • ঝামেলা থেকে রক্ষা
OpenAI

Faster Whisper

CTranslate2 অপটিমাইজেশনের সাথে Whisper এর চেয়ে ৪ গুণ দ্রুত, একই সঠিকতা।

  • ৪ গুণ দ্রুত
  • মেমরি কমাও
  • সব মডেলের আকার
  • ব্যাচ প্রসেসিং
  • VAD পরিশোধক
SYSTRAN

SenseVoice

আবেগ সনাক্তকরণ সঙ্গে কথা বুঝতে মডেল, ৫০+ ভাষায়।

  • ৫০+ ভাষা
  • আবেগ সনাক্তকরণ
  • অডিও ইভেন্ট
  • স্পিকার বিশ্লেষণ
  • সমৃদ্ধ মেটাডাটা
Alibaba (FunAudioLLM)

প্রায়শ জিজ্ঞাসিত প্রশ্ন

আপনার WAV ফাইল সরাসরি আপলোড করুন - কোন রূপান্তর প্রয়োজন নেই। আমাদের ট্রান্সক্রিপার uncompressed PCM (typically 16-bit / 44.1 kHz) স্ট্রিম ডিকোড করে, এটিকে একটি GPU এর উপর Faster Whisper-এ পাঠায়, এবং একটি সময়-স্ট্যাম্পেড ট্রান্সক্রিপ্ট এবং বৈকল্পিক SRT এবং VTT সাবটাইটেল রপ্তানি ফিরিয়ে দেয়।

WAV is uncompressed PCM (typically 16-bit / 44.1 kHz). It is most commonly produced by recording-studio masters, professional voiceover sessions, and Windows-recorded audio.

Marginally. WAV is lossless, so no codec compression artifacts are added on top of the source recording. Faster Whisper is robust to mild compression though — MP3 and AAC at 128 kbps transcribe within ~1% of WAV/WAV accuracy on the same source. The real accuracy floor is the original recording quality (mic, room, speaker clarity), not the container format.

WAV files are typically 10 MB/min at 16-bit 44.1 kHz stereo so most uploads land well under our 500 MB ceiling. Free accounts can transcribe up to 5 minutes per upload. Paid plans go up to 2 hours. If you are bumping the ceiling on long files, see the audiobook / longform tool which handles multi-hour transcription.

Yes — Faster Whisper supports 99 languages and auto-detects the spoken language in your WAV file. You can also force a specific source language via the advanced settings if auto-detect picks the wrong one (common with accented English misclassified as the listener mother tongue, or with very short clips).

Yes — the transcript includes segment timestamps and word-level timestamps, exported as SRT or VTT alongside the plain-text version. Pair the SRT with the original WAV (or a converted MP4) and you have a subtitled clip ready to publish.

Yes. Enable speaker diarization in the advanced settings and our pipeline runs pyannote.audio on top of Whisper to label each speaker. For best results on WAV, give us at least 30 seconds of audio so the diarizer has enough samples to cluster voice prints. Two-speaker recordings get the most accurate labeling.

No. Our transcriber handles WAV directly — converting to MP3 first would add a re-encoding step (potentially lossy) and waste your time. The one exception is if your WAV file uses an unusual codec our decoder does not recognize (rare); we will tell you that on upload and you can convert via our free Audio Converter.

Yes, that is the most common upload pattern for WAV. Faster Whisper handles clean recordings, noisy ones, and accented speech — you do not need to clean up the audio first. If accuracy is not what you expect, run the file through our Audio Enhancer (free for one pass) to remove background noise, then retry transcription.

৫ মিনিটের কম ফাইলের ক্ষেত্রে অনুবাদ বিনামূল্যে। প্ল্যানের জন্য প্রতি মিনিটে ~১,০০০ অক্ষর ব্যবহার করা হয়। ৬০ মিনিটের সভায় ৬০,০০০ অক্ষর অনুবাদ করা হয়; ৩ মিনিটের ভয়েস মেমো বিনামূল্যে। WAV-এর জন্য বিশেষ নোট: যদি আপনার ফাইলটি মূলত নিরব থাকে (যেমন, সভা রেকর্ডিং-এ দীর্ঘ বিরতি), তাহলে নিরবতা উপেক্ষা করার জন্য ভয়েস অ্যাক্টিভিটি সনাক্তকরণ সক্রিয় করুন এবং শুধুমাত্র কথা বলার অংশের জন্য অর্থ প্রদান করুন।

Yes. Uploaded WAV files are processed on our GPU servers and automatically deleted within 2 days. We never store the audio long-term, train models on user data, or share with third parties. The transcript stays in your account for as long as you want it.

হ্যাঁ। আপনার WAV ফাইলকে `ফাইল` ক্ষেত্রটিতে অডিও ফাইল সহযোগে বহু-পার্শ্ব বিশিষ্ট ফর্ম ডাটা হিসাবে /api/v1/transcribe/ এ POST করুন। প্রতিক্রিয়ায় অন্তর্ভুক্ত থাকবে ট্রান্সক্রিপ্ট, সেগমেন্ট টাইমসটাম্প, বৈকল্পিক শব্দ-স্তরের টাইমসটাম্প এবং একটি কাজ UUID যা আপনি SRT/VTT রপ্তানি URLs এর জন্য পোল করতে পারেন। সব পরিশোধিত পরিকল্পনায় উপলব্ধ।
5.0/5 (1)

আমরা কি উন্নতি করতে পারি? আপনার ফিডব্যাক আমাদের সমস্যা সমাধানে সাহায্য করে।

AI এর সাথে অডিও এবং ভিডিও অনুবাদ করুন

৯৯টি ভাষায় সঠিক অনুবাদ পাওয়া যাবে। বিনামূল্যে নিবন্ধন করুন এবং শুরু করতে ১৫টি ক্রেডিট পাবেন।