বক্তৃতা থেকে টেক্সটName

AI ব্যবহার করে অডিও এবং ভিডিও টেক্সটে অনুবাদ করুন। ৯৯টি ভাষা, টাইমস্ট্যাম্প এবং স্পিকার সনাক্তকরণ সমর্থন করে।

নিবন্ধন করুন

অডিও অথবা ভিডিও আপলোড করুন

আপনার ফাইল এখানে টেনে নিয়ে যান, অথবা ব্রাউজ

MP3, WAV, FLAC, OGG, M4A, MP4, WebM সমর্থন করে। বিনামূল্যে ৫০০ মেগাবাইট পর্যন্ত · প্রফেশনাল ২ জিবি পর্যন্ত।

— অথবা আপনার মাইক্রোফোন থেকে রেকর্ড করুন —

00:00

বৈশিষ্ট্য

মডেল

ভাষা

টাইমসটাম্প অন্তর্ভুক্ত করো

স্পিকারের ডায়ারিাইজেশন

1,000/min অক্ষর — নিবন্ধন করুন ব্যবহার পর্যবেক্ষণ করুন

অনুবাদ

একটি অডিও ফাইল আপলোড করুন এবং শুরু করতে ট্রান্সক্রিপ্ট ক্লিক করুন

এটি কিভাবে কাজ করে

অডিও আপলোড করো

আপনার অডিও অথবা ভিডিও ফাইল আপলোড করুন। আমরা MP3, WAV, FLAC, OGG, M4A, MP4 এবং WebM ফরম্যাট ১০০ মেগাবাইট পর্যন্ত সমর্থন করি।

২. এআই ট্রান্সক্রিপশন

আমাদের এআই মডেল আপনার অডিও প্রসেস করে, ভাষা সনাক্ত করে, বক্তাদের চিহ্নিত করে এবং টাইমস্ট্যাম্প সহ সঠিক টেক্সট তৈরি করে।

৩. আপনার লেখা পাওয়া যাবে

আপনার অনুবাদ কপি করুন অথবা এটি TXT অথবা SRT সাবটাইটেল ফরম্যাটে ডাউনলোড করুন। প্রয়োজন অনুযায়ী সম্পাদনা এবং উন্নত করুন।

ব্যবহারের ক্ষেত্রে

প্রতিটি শিল্প এবং ওয়ার্কফ্লোর জন্য টেক্সট-এ-ভাষা

সভা ও কনফারেন্স

স্বয়ংক্রিয়ভাবে জুম, টিম এবং গুগল মিট রেকর্ডিং অনুলিপি করুন। কখনোই কোন কার্যক্রমের আইটেম মিস করবেন না। সভা নোট বা সাবটাইটেল হিসাবে রপ্তানি করুন।

সাক্ষাৎকার এবং সাংবাদিকতা

প্রবন্ধ, গবেষণাপত্র এবং তথ্যচিত্রের জন্য সাক্ষাৎকার অনুলিপি করুন। স্পিকার ডায়ারিজম সহজে অনুলিপি করার জন্য কে কী বলেছে তা চিহ্নিত করে।

পডকাস্ট এবং মিডিয়া

পডকাস্ট পর্বের জন্য ট্রান্সক্রিপশন এবং নোট প্রদর্শন করুন। আপনার অডিও উপাদানগুলির জন্য অনুসন্ধানযোগ্য আর্কাইভ তৈরি করুন। ভিডিও পডকাস্টের জন্য সাবটাইটেল যোগ করুন।

বক্তৃতা এবং শিক্ষা

রেকর্ড করা লেকচারগুলোকে অধ্যয়নের নোটে রূপান্তর করুন। সঠিক শিরোনামের মাধ্যমে শিক্ষামূলক বিষয়বস্তু প্রবেশযোগ্য করুন। শ্রবণ প্রতিবন্ধী শিক্ষার্থীদের সমর্থন করুন।

মেডিক্যাল ডিকশনারিName

ডাক্তার-রোগীর পরামর্শ, ক্লিনিক্যাল নোট এবং মেডিক্যাল ডিকশনারি অনুলিপি করুন। AI-চালিত সঠিকতার সাথে ম্যানুয়াল নথিভুক্তির ঘন্টা সংরক্ষণ করুন।

আইনগত কার্যক্রম

প্রমাণ, শুনানি এবং ক্লায়েন্ট সভা অনুলিপি করুন। আইনী রেফারেন্সের জন্য সঠিক সময়সূচী। আদালতের নথির জন্য উপযুক্ত ফরম্যাটে রপ্তানি করুন।

STT মডেলের তুলনা

Whisper

৯৯টি ভাষা সমর্থনকারী OpenAI's মজবুত বাক সনাক্তকরণ মডেল।

৯৯টি ভাষা
অনুবাদ
সময়- স্ট্যাম্প
ঝামেলা থেকে রক্ষা

OpenAI

Faster Whisper

CTranslate2 অপটিমাইজেশনের সাথে Whisper এর চেয়ে ৪ গুণ দ্রুত, একই সঠিকতা।

৪ গুণ দ্রুত
মেমরি কমাও
সব মডেলের আকার
ব্যাচ প্রসেসিং
VAD পরিশোধক

SYSTRAN

SenseVoice

আবেগ সনাক্তকরণ সঙ্গে কথা বুঝতে মডেল, ৫০+ ভাষায়।

৫০+ ভাষা
আবেগ সনাক্তকরণ
অডিও ইভেন্ট
স্পিকার বিশ্লেষণ
সমৃদ্ধ মেটাডাটা

Alibaba (FunAudioLLM)

কথা থেকে টেক্সট পরিকল্পনা

বিনামূল্যে শুরু করুন, আরো প্রয়োজন হলে আপগ্রেড করুন

মুক্ত

১ মিনিটের অডিও সীমা
দ্রুত Whisper মডেল
মৌলিক অনুবাদ
১০০+ ভাষা

সবচেয়ে জনপ্রিয়

ফ্রি অ্যাকাউন্ট

৩০ মিনিট অডিও + ১৫,০০০ অক্ষর
সব STT মডেল
শব্দ-স্তরের সময়-স্ট্যাম্প
SRT & VTT সাবটাইটেল রপ্তানি করো
স্পিকারের ডায়ারিাইজেশন

নিবন্ধন করুন

প্রফেশনাল

২ ঘণ্টার অডিও ফাইল
ব্যাচ অনুবাদ
অগ্রাধিকার প্রসেসিং
API ব্যবহার
স্বনির্বাচিত শব্দভাণ্ডার

উন্নীতকরণ

প্রায়শ জিজ্ঞাসিত প্রশ্ন

স্বয়ংক্রিয়ভাবে কথা স্বীকৃতি (এএসআর) নামে পরিচিত, কথা থেকে লেখায় রূপান্তর (এসটিটি)। আমাদের মডেলগুলি সভা, সাক্ষাৎকার, পডকাস্ট, বক্তৃতা এবং আরও অনেক কিছু থেকে অডিও সঠিকভাবে অনুবাদ করতে AI ব্যবহার করে।

বেশিরভাগ ক্ষেত্রেই দ্রুত Whisper ব্যবহার করার পরামর্শ দেওয়া হয় - এটি মূল Whisper এর চেয়ে ৪ গুণ দ্রুত এবং একই সাথে সঠিকতা বজায় রাখে। যদি আপনার অনুবাদ করার পাশাপাশি আবেগ সনাক্তকরণ বা অডিও ইভেন্ট সনাক্তকরণ প্রয়োজন হয়, তাহলে SenseVoice ব্যবহার করুন।

আমরা MP3, WAV, M4A, OGG, FLAC, WEBM এবং সবচেয়ে সাধারণ অডিও/ভিডিও ফরম্যাট সমর্থন করি। সর্বোচ্চ ফাইলের আকার ৫০ মেগাবাইট। বড় ফাইলের ক্ষেত্রে, অডিওটি প্রথমে বিভক্ত করার কথা বিবেচনা করুন।

বিনামূল্যে ব্যবহারকারীরা ৫ মিনিট পর্যন্ত অডিও ট্রান্সক্রিপ্ট করতে পারেন। বিনামূল্যে পরিকল্পনা ২ ঘণ্টার অডিও ফাইল সমর্থন করে। দীর্ঘ রেকর্ডিংয়ের জন্য, ব্যাচ প্রসেসিং সহ আমাদের API ব্যবহার করুন।

আমাদের মডেল পরিষ্কার ইংরেজি কথার ক্ষেত্রে ৯৫%+ সঠিকতা অর্জন করে। সঠিকতা ভাষা, অডিও গুণমান এবং পটভূমির শব্দের উপর নির্ভর করে। ফাস্টার হুইস্পার এবং হুইস্পার ৯৯টি ভাষাকে বিভিন্ন সঠিকতা স্তর সহ সমর্থন করে।

হ্যাঁ, আমাদের উন্নত ট্রান্সক্রিপশন মোড অডিওতে বিভিন্ন বক্তাদের চিহ্নিত এবং লেবেল করতে পারে। বক্তার ডায়ারিাইজেশন বিশেষ করে মিটিং ট্রান্সক্রিপশন, সাক্ষাৎকার এবং বহু-ব্যক্তির পডকাস্টের জন্য উপযোগী, যেখানে আপনার জানা দরকার কে কী বলেছে।

ফ্যাস্টার হুইস্পার ব্যবহার করে আমাদের API-র মাধ্যমে রিয়াল-টাইম স্ট্রিমিং ট্রান্সক্রিপশন উপলব্ধ। অডিও প্রসেস করা হয় টুকরো

হ্যাঁ, আমাদের অনুবাদ আউটপুট শব্দ-স্তরের সময়সূচক অন্তর্ভুক্ত করে যা SRT, VTT, অথবা ASS সাবটাইটেল ফাইল হিসাবে রপ্তানি করা যেতে পারে। এটি ইউটিউব ভিডিও, অনলাইন কোর্স এবং সামাজিক মিডিয়া বিষয়বস্তুতে শিরোনাম যোগ করার জন্য উপযুক্ত।

হ্যাঁ, সমস্ত অনুবাদ ফলাফল ডিফল্টভাবে সেগমেন্ট-স্তরের টাইমস্ট্যাম্প অন্তর্ভুক্ত করে। শব্দ-স্তরের টাইমস্ট্যাম্পও উপলব্ধ, যা অডিওতে প্রত্যেক শব্দের সঠিক শুরু এবং সমাপ্তির সময় প্রদর্শন করে।

দ্রুততর হুইস্পার বিভিন্ন অডিওতে প্রশিক্ষিত এবং মাঝারি পটভূমির শব্দ ভালভাবে পরিচালনা করে। খুবই ধ্বনিময় রেকর্ডিংয়ের জন্য, আমরা অনুরোধ করি অডিওটি আমাদের অডিও উন্নতকারীর মাধ্যমে প্রথমে চালানোর জন্য অনুলিপি করার আগে সুস্পষ্টতা উন্নত করতে।

হ্যাঁ, আপলোডকৃত অডিও ফাইলগুলি আমাদের নিরাপদ GPU সার্ভারে প্রক্রিয়াজাত করা হয় এবং অনুবাদ সম্পন্ন হবার পর স্বয়ংক্রিয়ভাবে মুছে ফেলা হয়। আমরা আপনার অডিও ফাইলগুলি সংরক্ষণ করি না, শেয়ার করি না বা প্রশিক্ষণের উদ্দেশ্যে ব্যবহার করি না। সমস্ত ট্রান্সফার এনক্রিপ্ট করা হয়।

বিনামূল্যে ব্যবহারকারীরা ৫ মিনিট অডিও বিনামূল্যে অনুবাদ করতে পারেন। পরিশোধিত পরিকল্পনা অডিও দৈর্ঘ্যের উপর ভিত্তি করে অক্ষর ব্যবহার করে: প্রতি মিনিটে অডিও প্রায় ১,০০০ অক্ষর। পরিকল্পনার বিস্তারিত তথ্য এবং অক্ষর প্যাকেজের জন্য আমাদের মূল্য নির্ধারণের পৃষ্ঠাটি দেখুন।

5.0/5 (1)

AI এর সাথে অডিও অনুবাদ করুন

৯৯টি ভাষায় সঠিক অনুবাদ পাবেন। বিনামূল্যে নিবন্ধন করুন এবং শুরু করার জন্য ১৫,০০০ অক্ষর পাবেন।

নিবন্ধন করুন মূল্য প্রদর্শন

বক্তৃতা থেকে টেক্সটName

অডিও অথবা ভিডিও আপলোড করুন

বৈশিষ্ট্য

অনুবাদ

এটি কিভাবে কাজ করে

অডিও আপলোড করো

২. এআই ট্রান্সক্রিপশন

৩. আপনার লেখা পাওয়া যাবে

ব্যবহারের ক্ষেত্রে

সভা ও কনফারেন্স

সাক্ষাৎকার এবং সাংবাদিকতা

পডকাস্ট এবং মিডিয়া

বক্তৃতা এবং শিক্ষা

মেডিক্যাল ডিকশনারিName

আইনগত কার্যক্রম

STT মডেলের তুলনা

Whisper

Faster Whisper

SenseVoice

কথা থেকে টেক্সট পরিকল্পনা

প্রায়শ জিজ্ঞাসিত প্রশ্ন

স্পীচ টু টেক্সট (STT) কি?

কোন ট্রান্সক্রিপশন মডেলটি সেরা?

কি ধরনের অডিও ফরম্যাট আমি আপলোড করতে পারি?

অনুবাদ করার জন্য কোন সময়সীমা আছে?

ট্রান্সক্রিপশন কতটা সঠিক?

স্পিকারের ডায়ারিজম কি টেক্সট- এ বাক্যের জন্য সমর্থন করে?

আমি কি রিয়েল-টাইম ট্রান্সক্রিপশন পেতে পারি?

আমি কি সাবটাইটেল অথবা SRT ফাইল তৈরি করতে পারি?

ট্রান্সক্রিপশনে কি টাইমস্ট্যাম্প আছে?

এই টুলটি কিভাবে পটভূমির শব্দ নিয়ন্ত্রণ করে?

আমার অডিও তথ্য কি গোপন রাখা হবে?

কথা থেকে লেখায় রূপান্তরের খরচ কত?

AI এর সাথে অডিও অনুবাদ করুন