Report Bug / Feature Request

বক্তৃতা থেকে টেক্সটName

AI ব্যবহার করে অডিও এবং ভিডিও টেক্সটে অনুবাদ করুন। ৯৯টি ভাষা, টাইমস্ট্যাম্প এবং স্পিকার সনাক্তকরণ সমর্থন করে।

আপনার ভাষায় এখনো TTS শব্দ নেই। আমাদের আপনার শব্দ যোগ করতে সাহায্য করুন! আপনার কণ্ঠ বিক্রি করুন

অডিও অথবা ভিডিও আপলোড করুন

আপনার ফাইল এখানে টেনে নিয়ে যান, অথবা ব্রাউজ

MP3, WAV, FLAC, OGG, M4A, MP4, WebM সমর্থন করে। সর্বোচ্চ ১০০ মেগাবাইট।

ফাইল.mp3

0 MB
— অথবা আপনার মাইক্রোফোন থেকে রেকর্ড করুন —
00:00

বৈশিষ্ট্য

1,000/min অক্ষর নিবন্ধন করুন ব্যবহার পর্যবেক্ষণ করুন

অনুবাদ

একটি অডিও ফাইল আপলোড করুন এবং শুরু করতে ট্রান্সক্রিপ্ট ক্লিক করুন

অডিও ট্রান্সক্রিপ্ট করা হচ্ছে... কিছুক্ষণ সময় লাগতে পারে।

সনাক্ত করা হয়েছে:

এটি কিভাবে কাজ করে

অডিও আপলোড করো

আপনার অডিও অথবা ভিডিও ফাইল আপলোড করুন। আমরা MP3, WAV, FLAC, OGG, M4A, MP4 এবং WebM ফরম্যাট ১০০ মেগাবাইট পর্যন্ত সমর্থন করি।

২. এআই ট্রান্সক্রিপশন

আমাদের এআই মডেল আপনার অডিও প্রসেস করে, ভাষা সনাক্ত করে, বক্তাদের চিহ্নিত করে এবং টাইমস্ট্যাম্প সহ সঠিক টেক্সট তৈরি করে।

৩. আপনার লেখা পাওয়া যাবে

আপনার অনুবাদ কপি করুন অথবা এটি TXT অথবা SRT সাবটাইটেল ফরম্যাটে ডাউনলোড করুন। প্রয়োজন অনুযায়ী সম্পাদনা এবং উন্নত করুন।

ব্যবহারের ক্ষেত্রে

প্রতিটি শিল্প এবং ওয়ার্কফ্লোর জন্য টেক্সট-এ-ভাষা

সভা ও কনফারেন্স

স্বয়ংক্রিয়ভাবে জুম, টিম এবং গুগল মিট রেকর্ডিং অনুলিপি করুন। কখনোই কোন কার্যক্রমের আইটেম মিস করবেন না। সভা নোট বা সাবটাইটেল হিসাবে রপ্তানি করুন।

সাক্ষাৎকার এবং সাংবাদিকতা

প্রবন্ধ, গবেষণাপত্র এবং তথ্যচিত্রের জন্য সাক্ষাৎকার অনুলিপি করুন। স্পিকার ডায়ারিজম সহজে অনুলিপি করার জন্য কে কী বলেছে তা চিহ্নিত করে।

পডকাস্ট এবং মিডিয়া

পডকাস্ট পর্বের জন্য ট্রান্সক্রিপশন এবং নোট প্রদর্শন করুন। আপনার অডিও উপাদানগুলির জন্য অনুসন্ধানযোগ্য আর্কাইভ তৈরি করুন। ভিডিও পডকাস্টের জন্য সাবটাইটেল যোগ করুন।

বক্তৃতা এবং শিক্ষা

রেকর্ড করা লেকচারগুলোকে অধ্যয়নের নোটে রূপান্তর করুন। সঠিক শিরোনামের মাধ্যমে শিক্ষামূলক বিষয়বস্তু প্রবেশযোগ্য করুন। শ্রবণ প্রতিবন্ধী শিক্ষার্থীদের সমর্থন করুন।

মেডিক্যাল ডিকশনারিName

ডাক্তার-রোগীর পরামর্শ, ক্লিনিক্যাল নোট এবং মেডিক্যাল ডিকশনারি অনুলিপি করুন। AI-চালিত সঠিকতার সাথে ম্যানুয়াল নথিভুক্তির ঘন্টা সংরক্ষণ করুন।

আইনগত কার্যক্রম

প্রমাণ, শুনানি এবং ক্লায়েন্ট সভা অনুলিপি করুন। আইনী রেফারেন্সের জন্য সঠিক সময়সূচী। আদালতের নথির জন্য উপযুক্ত ফরম্যাটে রপ্তানি করুন।

STT মডেলের তুলনা

Whisper

৯৯টি ভাষা সমর্থনকারী OpenAI's মজবুত বাক সনাক্তকরণ মডেল।

  • ৯৯টি ভাষা
  • অনুবাদ
  • সময়- স্ট্যাম্প
  • ঝামেলা থেকে রক্ষা
OpenAI

Faster Whisper

CTranslate2 অপটিমাইজেশনের সাথে Whisper এর চেয়ে ৪ গুণ দ্রুত, একই সঠিকতা।

  • ৪ গুণ দ্রুত
  • মেমরি কমাও
  • সব মডেলের আকার
  • ব্যাচ প্রসেসিং
  • VAD পরিশোধক
SYSTRAN

SenseVoice

আবেগ সনাক্তকরণ সঙ্গে কথা বুঝতে মডেল, ৫০+ ভাষায়।

  • ৫০+ ভাষা
  • আবেগ সনাক্তকরণ
  • অডিও ইভেন্ট
  • স্পিকার বিশ্লেষণ
  • সমৃদ্ধ মেটাডাটা
Alibaba (FunAudioLLM)

কথা থেকে টেক্সট পরিকল্পনা

বিনামূল্যে শুরু করুন, আরো প্রয়োজন হলে আপগ্রেড করুন

মুক্ত
  • ১ মিনিটের অডিও সীমা
  • দ্রুত Whisper মডেল
  • মৌলিক অনুবাদ
  • ১০০+ ভাষা
সবচেয়ে জনপ্রিয়
ফ্রি অ্যাকাউন্ট
  • ৩০ মিনিট অডিও + ১৫,০০০ অক্ষর
  • সব STT মডেল
  • শব্দ-স্তরের সময়-স্ট্যাম্প
  • SRT & VTT সাবটাইটেল রপ্তানি করো
  • স্পিকারের ডায়ারিাইজেশন
নিবন্ধন করুন
প্রফেশনাল
  • ২ ঘণ্টার অডিও ফাইল
  • ব্যাচ অনুবাদ
  • অগ্রাধিকার প্রসেসিং
  • API ব্যবহার
  • স্বনির্বাচিত শব্দভাণ্ডার
উন্নীতকরণ

প্রায়শ জিজ্ঞাসিত প্রশ্ন

স্বয়ংক্রিয়ভাবে কথা স্বীকৃতি (এএসআর) নামে পরিচিত, কথা থেকে লেখায় রূপান্তর (এসটিটি)। আমাদের মডেলগুলি সভা, সাক্ষাৎকার, পডকাস্ট, বক্তৃতা এবং আরও অনেক কিছু থেকে অডিও সঠিকভাবে অনুবাদ করতে AI ব্যবহার করে।

বেশিরভাগ ক্ষেত্রেই দ্রুত Whisper ব্যবহার করার পরামর্শ দেওয়া হয় - এটি মূল Whisper এর চেয়ে ৪ গুণ দ্রুত এবং একই সাথে সঠিকতা বজায় রাখে। যদি আপনার অনুবাদ করার পাশাপাশি আবেগ সনাক্তকরণ বা অডিও ইভেন্ট সনাক্তকরণ প্রয়োজন হয়, তাহলে SenseVoice ব্যবহার করুন।

আমরা MP3, WAV, M4A, OGG, FLAC, WEBM এবং সবচেয়ে সাধারণ অডিও/ভিডিও ফরম্যাট সমর্থন করি। সর্বোচ্চ ফাইলের আকার ৫০ মেগাবাইট। বড় ফাইলের ক্ষেত্রে, অডিওটি প্রথমে বিভক্ত করার কথা বিবেচনা করুন।

বিনামূল্যে ব্যবহারকারীরা ৫ মিনিট পর্যন্ত অডিও ট্রান্সক্রিপ্ট করতে পারেন। বিনামূল্যে পরিকল্পনা ২ ঘণ্টার অডিও ফাইল সমর্থন করে। দীর্ঘ রেকর্ডিংয়ের জন্য, ব্যাচ প্রসেসিং সহ আমাদের API ব্যবহার করুন।

আমাদের মডেল পরিষ্কার ইংরেজি কথার ক্ষেত্রে ৯৫%+ সঠিকতা অর্জন করে। সঠিকতা ভাষা, অডিও গুণমান এবং পটভূমির শব্দের উপর নির্ভর করে। ফাস্টার হুইস্পার এবং হুইস্পার ৯৯টি ভাষাকে বিভিন্ন সঠিকতা স্তর সহ সমর্থন করে।

হ্যাঁ, আমাদের উন্নত ট্রান্সক্রিপশন মোড অডিওতে বিভিন্ন বক্তাদের চিহ্নিত এবং লেবেল করতে পারে। বক্তার ডায়ারিাইজেশন বিশেষ করে মিটিং ট্রান্সক্রিপশন, সাক্ষাৎকার এবং বহু-ব্যক্তির পডকাস্টের জন্য উপযোগী, যেখানে আপনার জানা দরকার কে কী বলেছে।

ফ্যাস্টার হুইস্পার ব্যবহার করে আমাদের API-র মাধ্যমে রিয়াল-টাইম স্ট্রিমিং ট্রান্সক্রিপশন উপলব্ধ। অডিও প্রসেস করা হয় টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো টুকরো

হ্যাঁ, আমাদের অনুবাদ আউটপুট শব্দ-স্তরের সময়সূচক অন্তর্ভুক্ত করে যা SRT, VTT, অথবা ASS সাবটাইটেল ফাইল হিসাবে রপ্তানি করা যেতে পারে। এটি ইউটিউব ভিডিও, অনলাইন কোর্স এবং সামাজিক মিডিয়া বিষয়বস্তুতে শিরোনাম যোগ করার জন্য উপযুক্ত।

হ্যাঁ, সমস্ত অনুবাদ ফলাফল ডিফল্টভাবে সেগমেন্ট-স্তরের টাইমস্ট্যাম্প অন্তর্ভুক্ত করে। শব্দ-স্তরের টাইমস্ট্যাম্পও উপলব্ধ, যা অডিওতে প্রত্যেক শব্দের সঠিক শুরু এবং সমাপ্তির সময় প্রদর্শন করে।

দ্রুততর হুইস্পার বিভিন্ন অডিওতে প্রশিক্ষিত এবং মাঝারি পটভূমির শব্দ ভালভাবে পরিচালনা করে। খুবই ধ্বনিময় রেকর্ডিংয়ের জন্য, আমরা অনুরোধ করি অডিওটি আমাদের অডিও উন্নতকারীর মাধ্যমে প্রথমে চালানোর জন্য অনুলিপি করার আগে সুস্পষ্টতা উন্নত করতে।

হ্যাঁ, আপলোডকৃত অডিও ফাইলগুলি আমাদের নিরাপদ GPU সার্ভারে প্রক্রিয়াজাত করা হয় এবং অনুবাদ সম্পন্ন হবার পর স্বয়ংক্রিয়ভাবে মুছে ফেলা হয়। আমরা আপনার অডিও ফাইলগুলি সংরক্ষণ করি না, শেয়ার করি না বা প্রশিক্ষণের উদ্দেশ্যে ব্যবহার করি না। সমস্ত ট্রান্সফার এনক্রিপ্ট করা হয়।

বিনামূল্যে ব্যবহারকারীরা ৫ মিনিট অডিও বিনামূল্যে অনুবাদ করতে পারেন। পরিশোধিত পরিকল্পনা অডিও দৈর্ঘ্যের উপর ভিত্তি করে অক্ষর ব্যবহার করে: প্রতি মিনিটে অডিও প্রায় ১,০০০ অক্ষর। পরিকল্পনার বিস্তারিত তথ্য এবং অক্ষর প্যাকেজের জন্য আমাদের মূল্য নির্ধারণের পৃষ্ঠাটি দেখুন।
5.0/5 (1)

আমরা কি উন্নতি করতে পারি? আপনার ফিডব্যাক আমাদের সমস্যা সমাধানে সাহায্য করে।

AI এর সাথে অডিও অনুবাদ করুন

৯৯টি ভাষায় সঠিক অনুবাদ পাবেন। বিনামূল্যে নিবন্ধন করুন এবং শুরু করার জন্য ১৫,০০০ অক্ষর পাবেন।