Report Bug / Feature Request

অডিও থেকে টেক্সট

AI সহযোগে অডিও ফাইলকে টেক্সটে রূপান্তর করুন। MP3, WAV, M4A, FLAC, অথবা যেকোন অডিও ফাইল আপলোড করুন। ৯৯টি ভাষা, টাইমসটাম্প এবং স্পিকার সনাক্তকরণ সমর্থন করে।

আপনার ভাষায় এখনো TTS শব্দ নেই। আমাদের আপনার শব্দ যোগ করতে সাহায্য করুন! আপনার কণ্ঠ বিক্রি করুন

অডিও ফাইল আপলোড করো

আপনার ফাইল এখানে টেনে নিয়ে যান, অথবা ব্রাউজ

MP3, WAV, FLAC, OGG, M4A, MP4, WebM সমর্থন করে। সর্বোচ্চ ১০০ মেগাবাইট।

ফাইল.mp3

0 MB
— অথবা আপনার মাইক্রোফোন থেকে রেকর্ড করুন —
00:00

বৈশিষ্ট্য

1,000/min অক্ষর নিবন্ধন করুন ব্যবহার পর্যবেক্ষণ করুন

রূপান্তরিত টেক্সট

একটি অডিও ফাইল আপলোড করুন এবং শুরু করতে টেক্সটে রূপান্তর করুন ক্লিক করুন

অডিওকে টেক্সটে রূপান্তর করা হচ্ছে... এটি কিছুক্ষণ সময় নেবে।

সনাক্ত করা হয়েছে:

এটি কিভাবে কাজ করে

অডিও আপলোড করো

আপনার অডিও ফাইল আপলোড করুন। আমরা MP3, WAV, FLAC, OGG, M4A এবং আরও অনেক ফরম্যাট সমর্থন করি, যার সর্বোচ্চ মাপ ১০০ মেগাবাইট।

২. AI কনভার্টস

আমাদের এআই মডেল আপনার অডিও প্রক্রিয়াজাত করে, ভাষা সনাক্ত করে, বক্তাদের চিহ্নিত করে এবং সময়সূচীসহ সঠিক লেখা তৈরি করে।

৩. আপনার লেখা পাওয়া যাবে

আপনার লেখা অনুলিপি করুন অথবা এটি TXT অথবা SRT সাবটাইটেল ফরম্যাটে ডাউনলোড করুন। প্রয়োজন অনুযায়ী সম্পাদনা এবং সংশোধন করুন।

ব্যবহারের ক্ষেত্রে

প্রত্যেক শিল্প এবং কর্মপ্রবাহের জন্য অডিও টেক্সট রূপান্তর করুন

সভা এবং কল

রেকর্ড করা সভা, জুম কল এবং ফোন কথোপকথন টেক্সটে রূপান্তর করুন। কখনোই কোন কার্যসূচীর বিষয়বস্তু মিস করবেন না। সভা নোট বা অনুসন্ধানযোগ্য নথিরূপে রপ্তানি করুন।

সাক্ষাৎকার এবং গবেষণা

সাক্ষাৎকার রেকর্ডিংটি প্রবন্ধ, গবেষণাপত্র এবং গুণগত বিশ্লেষণের জন্য টেক্সটে রূপান্তর করুন। স্পিকার সনাক্তকরণ কে কী বলেছে তা চিহ্নিত করে।

পডকাস্ট এবং অডিও বিষয়বস্তু

পডকাস্ট পর্বগুলি প্রদর্শন নোট, ব্লগ পোস্ট এবং SEO এর জন্য টেক্সটে রূপান্তর করুন। আপনার সমস্ত অডিও উপাদানগুলির জন্য অনুসন্ধানযোগ্য আর্কাইভ তৈরি করুন।

বক্তৃতা এবং শিক্ষা

রেকর্ড করা লেকচার এবং ওয়েবিনার পাঠ্যবইতে রূপান্তর করুন, যাতে আপনি তা পড়তে পারেন এবং ব্যবহার করতে পারেন। শ্রবণ প্রতিবন্ধী শিক্ষার্থীদের শিক্ষামূলক বিষয়বস্তু ব্যবহারে সহায়তা করুন।

ভয়েস নোট এবং মেমোName

আপনার ফোন থেকে ভয়েস মেমো টেক্সটে রূপান্তর করুন। iPhone বা Android ভয়েস রেকর্ডার থেকে M4A রেকর্ডিং অনুসন্ধানযোগ্য, সম্পাদনযোগ্য টেক্সট নথিতে পরিণত করুন।

আইনগত এবং চিকিৎসাName

টেক্সটে রেকর্ডিং, শুনানি, পরামর্শ এবং ডিকশনারি রেকর্ডিং রূপান্তর করুন। রেফারেন্সের জন্য সঠিক সময়সূচী। নথিভুক্তকরণ-সক্ষম ফরম্যাটে রপ্তানি করুন।

সমর্থিত অডিও ফরম্যাট

যেকোন অডিও ফাইলকে টেক্সটে রূপান্তর করুন - সব সাধারণ ফরম্যাট সমর্থিত

অডিও ফরম্যাট

MP3 WAV FLAC OGG M4A AAC WMA OPUS

ভিডিও ফরম্যাট (অডিও এক্সট্র্যাক্ট করা)

MP4 WebM AVI MOV MKV WMV FLV

ভিডিও ফাইল থেকে স্বয়ংক্রিয়ভাবে অডিও এক্সট্র্যাক্ট করা হয় রূপান্তর করার জন্য।

AI মডেল

Whisper

৯৯টি ভাষা সমর্থনকারী OpenAI's মজবুত বাক সনাক্তকরণ মডেল।

  • ৯৯টি ভাষা
  • অনুবাদ
  • সময়- স্ট্যাম্প
  • ঝামেলা থেকে রক্ষা
OpenAI

Faster Whisper

CTranslate2 অপটিমাইজেশনের সাথে Whisper এর চেয়ে ৪ গুণ দ্রুত, একই সঠিকতা।

  • ৪ গুণ দ্রুত
  • মেমরি কমাও
  • সব মডেলের আকার
  • ব্যাচ প্রসেসিং
  • VAD পরিশোধক
SYSTRAN

SenseVoice

আবেগ সনাক্তকরণ সঙ্গে কথা বুঝতে মডেল, ৫০+ ভাষায়।

  • ৫০+ ভাষা
  • আবেগ সনাক্তকরণ
  • অডিও ইভেন্ট
  • স্পিকার বিশ্লেষণ
  • সমৃদ্ধ মেটাডাটা
Alibaba (FunAudioLLM)

অডিও থেকে টেক্সট পরিকল্পনা

বিনামূল্যে শুরু করুন, আরো প্রয়োজন হলে আপগ্রেড করুন

মুক্ত
  • ১ মিনিটের অডিও সীমা
  • দ্রুত Whisper মডেল
  • মৌলিক অনুবাদ
  • ১০০+ ভাষা
সবচেয়ে জনপ্রিয়
ফ্রি অ্যাকাউন্ট
  • ৩০ মিনিট অডিও + ১৫,০০০ অক্ষর
  • সব STT মডেল
  • শব্দ-স্তরের সময়-স্ট্যাম্প
  • SRT & VTT সাবটাইটেল রপ্তানি করো
  • স্পিকারের ডায়ারিাইজেশন
নিবন্ধন করুন
প্রফেশনাল
  • ২ ঘণ্টার অডিও ফাইল
  • ব্যাচ অনুবাদ
  • অগ্রাধিকার প্রসেসিং
  • API ব্যবহার
  • স্বনির্বাচিত শব্দভাণ্ডার
উন্নীতকরণ

প্রায়শ জিজ্ঞাসিত প্রশ্ন

আপনার অডিও ফাইল আপলোড করুন (MP3, WAV, M4A, FLAC, OGG, অথবা যেকোন ফরম্যাট) এবং রূপান্তর ক্লিক করুন। আমাদের AI অডিও প্রক্রিয়াকরণ এবং সেকেন্ডের মধ্যে সঠিক টেক্সট ফিরিয়ে দেয়। কোন সফটওয়্যার ডাউনলোডের প্রয়োজন নেই - সবকিছু আপনার ব্রাউজার থেকে চলে।

আমরা সব সাধারণ অডিও ফরম্যাট সমর্থন করি, যেমন MP3, WAV, M4A, OGG, FLAC, WEBM, AAC, WMA এবং OPUS। আপনি ভিডিও ফাইল (MP4, AVI, MOV, MKV) আপলোড করতে পারেন - আমরা স্বয়ংক্রিয়ভাবে অডিও এক্সট্র্যাক্ট করি। সর্বোচ্চ ফাইল মাপ ৫০ মেগাবাইট।

হ্যাঁ, আপনি অডিও থেকে টেক্সট বিনামূল্যে ৫ মিনিট পর্যন্ত অডিও রূপান্তর করতে পারেন। ১৫,০০০ অক্ষর পেতে বিনামূল্যে অ্যাকাউন্টের জন্য নিবন্ধন করুন। দীর্ঘ অডিও সমর্থন সহ ৫০০,০০০ অক্ষরের জন্য মাসিক প্ল্যান শুরু হয় $৯ থেকে।

আমাদের AI মডেল স্পষ্ট কথা বলার ক্ষেত্রে ৯৫%+ সঠিকতা অর্জন করে। আমরা দ্রুততর হুইসপার ব্যবহার করি (প্রকৃত হুইসপার থেকে ৪ গুণ দ্রুত) এবং সেনসভয়েস ব্যবহার করি সবচেয়ে ভালো ফলাফল পাওয়ার জন্য। সঠিকতা অডিও গুণমান, পটভূমির শব্দ এবং ভাষার উপর নির্ভর করে।

হ্যাঁ, আমাদের অডিও থেকে টেক্সট রূপান্তরকারী ৯৯টি ভাষা সমর্থন করে। AI স্বয়ংক্রিয়ভাবে কথা বলা ভাষা সনাক্ত করে, অথবা আপনি এটি ভাল সঠিকতার জন্য নিজেই নির্ধারণ করতে পারেন। জনপ্রিয় ভাষাগুলির মধ্যে রয়েছে ইংরেজি, স্প্যানিশ, ফরাসি, জার্মান, জাপানি, চীনা এবং আরবি।

হ্যাঁ, সকল রূপান্তরের ক্ষেত্রে ডিফল্টভাবে সেগমেন্ট-স্তরের সময়সূচী অন্তর্ভুক্ত করা হবে। সঠিক সময় নির্ধারণের জন্য আপনি শব্দ-স্তরের সময়সূচী সক্রিয় করতে পারেন - সাবটাইটেল, শিরোনাম বা অডিও সহযোগে টেক্সট সিঙ্ক করার জন্য এটি অত্যন্ত উপযোগী।

হ্যাঁ, আপনি আপনার রূপান্তরিত টেক্সট SRT সাবটাইটেল ফাইল, প্লেইন TXT হিসাবে ডাউনলোড করতে পারেন, অথবা সরাসরি ক্লিপবোর্ডে অনুলিপি করতে পারেন। ইউটিউব ভিডিও, অনলাইন কোর্স এবং সামাজিক মিডিয়া বিষয়বস্তুতে উপশীর্ষক যোগ করার জন্য SRT ফরম্যাটটি আদর্শ।

হ্যাঁ, আমাদের অডিও থেকে টেক্সট টুল স্পিকার ডায়ারিজম সমর্থন করে - স্বয়ংক্রিয়ভাবে বিভিন্ন স্পিকারদের চিহ্নিত করে এবং লেবেল করে। এটি সভা, সাক্ষাৎকার, পডকাস্ট এবং বহু-ব্যক্তির কথোপকথনের জন্য উপকারী।

বিনামূল্যে ব্যবহারকারীরা ৫ মিনিটের অডিও ফাইল রূপান্তর করতে পারেন। বিনামূল্যে পরিকল্পনা ২ ঘণ্টার অডিও ফাইল রূপান্তর করতে পারে। দীর্ঘ রেকর্ডিংয়ের জন্য, স্বয়ংক্রিয়, কার্যকর রূপান্তরের জন্য ব্যাচ প্রসেসিং সহ আমাদের API ব্যবহার করুন।

হ্যাঁ, আপলোডকৃত অডিও আমাদের নিরাপদ GPU সার্ভারে প্রক্রিয়াকৃত হয় এবং রূপান্তরের পর স্বয়ংক্রিয়ভাবে মুছে ফেলা হয়। আমরা কখনোই আপনার অডিও সংরক্ষণ করি না, শেয়ার করি না, অথবা প্রশিক্ষণের জন্য ব্যবহার করি না। সমস্ত ট্রান্সফার HTTPS-এর মাধ্যমে এনক্রিপ্ট করা হয়।

দ্রুততর হুইস্পার অডিও প্রসেস করে ৪x বাস্তব সময়ের গতি - ১০ মিনিটের রেকর্ডিং ২.৫ মিনিটে টেক্সটে রূপান্তরিত হয়। ১ মিনিটের কম সময়ের ছোট ক্লিপ সাধারণত সেকেন্ডের মধ্যে সম্পন্ন হয়।

অডিও থেকে টেক্সট রূপান্তর ৫ মিনিটের জন্য বিনামূল্যে। পরিশোধিত পরিকল্পনা অডিও দৈর্ঘ্যের উপর ভিত্তি করে অক্ষর ব্যবহার করে: প্রতি মিনিটে প্রায় ১,০০০ অক্ষর। অক্ষর প্যাক $৫ থেকে শুরু করে ১০০,০০০ অক্ষরের জন্য। সম্পূর্ণ বিবরণের জন্য আমাদের মূল্য নির্ধারণের পৃষ্ঠা দেখুন।
5.0/5 (1)

আমরা কি উন্নতি করতে পারি? আপনার ফিডব্যাক আমাদের সমস্যা সমাধানে সাহায্য করে।

AI সহযোগে অডিওকে টেক্সটে রূপান্তর করুন

৯৯টি ভাষায় দ্রুত, সঠিক অডিও থেকে টেক্সট রূপান্তর। বিনামূল্যে নিবন্ধন করুন এবং শুরু করতে ১৫,০০০ অক্ষর পান।