Convert MP3 to Text

Convert MP3 files to text instantly with AI. Upload your MP3 audio and get accurate transcripts in 99 languages. Free online MP3 transcription tool.

យើង​មិន​មាន​សំឡេង TTS ក្នុង​ភាសា​របស់​អ្នក​នៅ​ឡើយ​ទេ & # 160; ។ ជួយ​យើង​បន្ថែម​របស់​អ្នក & # 160;! លក់​សំឡេង​របស់​អ្នក

ផ្ទុក​អូឌីយ៉ូ ឬ​វីដេអូ​ឡើង

អូស និង​ទម្លាក់​ឯកសារ​របស់​អ្នក​នៅ​ទីនេះ ឬ រកមើល

គាំទ្រ MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV ។ ឥតគិតថ្លៃរហូតដល់ 500 មេកាបៃ · ពេញចិត្តរហូតដល់2ជីកាបៃ។

ឯកសារ.mp3

0 MB
— ឬ​ថត​ពី​មីក្រូហ្វូន​របស់​អ្នក —
00:00

ការ​កំណត់​រចនាសម្ព័ន្ធ​

1,000/min តួអក្សរ ចុះឈ្មោះ ប្រើ​ការ​ត្រួតពិនិត្យ​ការ​ប្រើ

ចម្លង​តួ

ផ្ទុក​ឯកសារ​អូឌីយ៉ូ ឬ​វីដេអូ​ឡើង ហើយ​ចុច​បម្លែង​ដើម្បី​ចាប់ផ្ដើម

កំពុង​បម្លែង... វា​អាច​ចំណាយ​ពេល​បន្តិច & # 160; ។

បាន​រក​ឃើញ:

របៀប​ដែល​វា​ធ្វើការ

1. ផ្ទុកឡើងអូឌីយ៉ូឬវីដេអូ

ផ្ទុកឡើងឯកសារអូឌីយ៉ូឬវីដេអូរបស់អ្នក. យើងគាំទ្រ MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, និង MKV ទ្រង់ទ្រាយរហូតដល់ទៅ 100MB.

2. AI សរសេរ

ម៉ូដែល AI របស់យើងដំណើរការអូឌីយ៉ូរបស់អ្នក រកឃើញភាសា កំណត់អត្តសញ្ញាណអ្នកនិយាយ និងបង្កើតអត្ថបទត្រឹមត្រូវជាមួយ timestamps ។

3. ទទួលបានការផ្ទេររបស់អ្នក

ចម្លង​អត្ថបទ​បកប្រែ​របស់​អ្នក ឬ​ទាញយក​វា​ជា​ទ្រង់ទ្រាយ​ចំណង​ជើង​រង TXT ឬ SRT & # 160; ។ កែសម្រួល និង​កែលម្អ​តាម​ដែល​ចាំបាច់ & # 160; ។

ករណី​ប្រើ

ការ​បកប្រែ​អូឌីយ៉ូ​សម្រាប់​ឧស្សាហកម្ម និង​លំហូរ​ការងារ​ទាំងអស់

កិច្ចប្រជុំ និង​សន្និសីទ

សរសេរជាអក្សរដោយស្វ័យប្រវត្តិ Zoom, ក្រុម និង Google Meet ការថត។ កុំភ្លេចធាតុសកម្មភាពម្តងទៀត។ នាំចេញជាចំណាំកិច្ចប្រជុំឬចំណងជើងរង។

បទសម្ភាសន៍ & សារព័ត៌មាន

សរសេរ​បទសម្ភាសន៍​សម្រាប់​អត្ថបទ ឯកសារ​ស្រាវជ្រាវ និង​ឯកសារ​ឯកសារ ។ កម្មវិធី​សរសេរ​កំណត់​អត្តសញ្ញាណ​អ្នក​និយាយ​ដែល​បាន​និយាយ​អ្វី​សម្រាប់​ការ​ផ្ទេរ​ភាព​ងាយស្រួល ។

ផតខាស់ និង​មេឌៀ

បង្កើត​អត្ថបទ​បកប្រែ និង​បង្ហាញ​ចំណាំ​សម្រាប់​ផតខាស់​ភាគ ។ បង្កើត​ប័ណ្ណសារ​ដែល​អាច​ស្វែងរក​បាន​នៃ​មាតិកា​អូឌីយ៉ូ​របស់​អ្នក ។ បន្ថែម​ចំណង​ជើង​រង​ទៅ​ផតខាស់​វីដេអូ ។

វគ្គ​បង្រៀន និង​អប់រំ

បម្លែង​ការ​បង្រៀន​ដែល​បាន​ថត​ទៅ​ជា​ចំណាំ​សិក្សា ។ ធ្វើ​មាតិកា​អប់រំ​ដែល​អាច​ចូល​ដំណើរការ​បាន​ជាមួយ​ចំណង​ជើង​ត្រឹមត្រូវ ។ គាំទ្រ​សិស្ស​ដែល​មាន​ការ​ពិបាក​ស្ដាប់ ។

ប្រព័ន្ធ​ផ្សព្វផ្សាយ​សង្គម

បង្កើតចំណងជើងរងនិងចំណងជើងបិទសម្រាប់វីដេអូ YouTube, TikToks និងមាតិកាប្រព័ន្ធផ្សព្វផ្សាយសង្គម។ បង្កើនភាពងាយស្រួលនិង SEO ជាមួយការបកប្រែត្រឹមត្រូវ។

ច្បាប់ និង​វេជ្ជសាស្ត្រ

សរសេរ​ការ​ដាក់​ពាក្យ​បណ្តឹង ការ​សួរ​ដេញដោល ការ​ពិគ្រោះ​យោបល់ និង​ការ​និយាយ​បញ្ជា ។ សម្គាល់​ពេលវេលា​ត្រឹមត្រូវ​សម្រាប់​យោង ។ នាំចេញ​ជា​ទ្រង់ទ្រាយ​ដែល​សមរម្យ​សម្រាប់​ឯកសារ ។

ទ្រង់ទ្រាយ​ដែល​បាន​គាំទ្រ

បម្លែង​ឯកសារ​អូឌីយ៉ូ ឬ​វីដេអូ​ណាមួយ​ទៅ​ជា​អត្ថបទ​ដោយ​ស្វ័យប្រវត្តិ

ទ្រង់ទ្រាយ​អូឌីយ៉ូ

MP3 WAV FLAC OGG M4A AAC WMA OPUS

ទ្រង់ទ្រាយ​វីដេអូ

MP4 WebM AVI MOV MKV WMV FLV M4V

អូឌីយ៉ូ​ត្រូវ​បាន​ស្រង់​ចេញ​ដោយ​ស្វ័យ​ប្រវត្តិ​ពី​ឯកសារ​វីដេអូ​សម្រាប់​បម្លែង & # 160; ។

ម៉ូដែល​បម្លែង​ជា​សំឡេង

Whisper

ម៉ូដែល​ការ​ទទួល​ស្គាល់​ការ​និយាយ​រឹងមាំ​របស់ OpenAI ដែល​គាំទ្រ ៩៩ ភាសា ។

  • 99 ភាសា
  • ការ​បកប្រែ
  • ត្រា​ពេលវេលា
  • រឹងមាំ​ចំពោះ​សំឡេង​រំខាន
OpenAI

Faster Whisper

4x រហ័សជាង Whisper ជាមួយការបង្កើនប្រសិទ្ធិភាព CTranslate2, ភាពត្រឹមត្រូវដូចគ្នា.

  • ឆាប់​ជាង ៤ ដង
  • សតិ​ទាប
  • ទំហំ​ម៉ូដែល​ទាំងអស់
  • ការ​ដំណើរការ​បាច់
  • ការ​ត្រង VAD
SYSTRAN

SenseVoice

ម៉ូដែល​ការ​យល់​ដឹង​នៃ​ការ​និយាយ​ជាមួយ​ការ​រក​ឃើញ​អារម្មណ៍ 50+ ភាសា ។

  • 50+ ភាសា
  • ការ​រក​ឃើញ​អារម្មណ៍
  • ព្រឹត្តិការណ៍​អូឌីយ៉ូ
  • ការ​វិភាគ​អ្នក​និយាយ
  • ទិន្នន័យ​មេតា​សម្បូរបែប
Alibaba (FunAudioLLM)

សំណួរ​ដែល​សួរ​ញឹកញាប់

ផ្ទុកឡើងឯកសារ MP3 របស់អ្នកដោយផ្ទាល់ - គ្មានការបម្លែងចាំបាច់។ កម្មវិធីសរសេរឡើងវិញរបស់យើងឌិកូដស្ទ្រីម MPEG-1 Audio Layer 3 ផ្ញើវាទៅ Faster Whisper នៅលើ GPU ហើយត្រឡប់មកវិញនូវការសរសេរឡើងវិញដែលមានកាលបរិច្ឆេទរួមជាមួយការនាំចេញចំណងជើងរង SRT និង VTT ជម្រើស។

MP3 គឺ MPEG-1 Audio Layer 3 ។ វាត្រូវបានផលិតជាទូទៅបំផុតដោយ podcasts, music libraries, voice memos, and downloaded audio ។

MP3 គឺ​មាន​ការ​បាត់បង់ (MPEG-1 Audio Layer 3) ប៉ុន្តែ​ការ​បាត់បង់​កើតឡើង​ក្នុង​ជួរ​អូឌីយ៉ូ​ដែល​មិន​មាន​ព័ត៌មាន​និយាយ​ច្រើន​។ Faster Whisper សរសេរ​ជា​សំឡេង MP3 នៅ 128-320 kbps ក្នុង​ចំណោម ~ 1% នៃ​ភាព​ត្រឹមត្រូវ WAV លើ​ការ​ថត​ប្រភព​ដូចគ្នា ។ កម្រាល​ភាព​ត្រឹមត្រូវ​ពិត​ប្រាកដ​គឺ​ជា​គុណភាព​ថត​ដើម (មីក្រូហ្វូន បន្ទប់ ភាព​ច្បាស់​របស់​អ្នក​និយាយ) មិនមែន​ជា​កូឌិក MP3 ទេ ។

MP3 ឯកសារជាទូទៅគឺ 1 MB/min at 128 kbps ដូច្នេះការផ្ទុកឡើងភាគច្រើនគឺស្ថិតនៅក្រោមកម្ពស់ 500 MB របស់យើង។ គណនីឥតគិតថ្លៃអាចចម្លងរហូតដល់ទៅ5នាទីក្នុងមួយការផ្ទុកឡើង។ ផែនការដែលបានបង់ប្រាក់ឡើងទៅ2ម៉ោង។ ប្រសិនបើអ្នកកំពុងបុកកម្ពស់លើឯកសារវែងសូមមើលឧបករណ៍សៀវភៅអូឌីយ៉ូ / ទម្រង់វែងដែលគ្រប់គ្រងចម្លងច្រើនម៉ោង។

បាទ — Faster Whisper គាំទ្រ 99 ភាសា និង​រក​ឃើញ​ដោយ​ស្វ័យ​ប្រវត្តិ​ភាសា​ដែល​បាន​និយាយ​ក្នុង​ឯកសារ MP3 របស់​អ្នក & # 160; ។ អ្នក​ក៏​អាច​បង្ខំ​ឲ្យ​ប្រើ​ភាសា​ប្រភព​ជាក់លាក់​តាម​រយៈ​ការ​កំណត់​កម្រិត​ខ្ពស់​បើ​ការ​រក​ឃើញ​ដោយ​ស្វ័យ​ប្រវត្តិ​ជ្រើស​យក​មួយ​ខុស (ទូទៅ​ជាមួយ​ភាសា​អង់គ្លេស​ដែល​បាន​ដាក់​ចំណង​ជើង​ខុស​ជា​ភាសា​ម្តាយ​របស់​អ្នក​ស្តាប់ ឬ​ជាមួយ​នឹង​វីដេអូ​ខ្លី​ណាស់) & # 160; ។

បាទ - អត្ថបទ​មាន​រួម​បញ្ចូល​ការ​បោះពុម្ព​កាលបរិច្ឆេទ​ផ្នែក និង​ការ​បោះពុម្ព​កាលបរិច្ឆេទ​កម្រិត​ពាក្យ​ដែល​បាន​នាំចេញ​ជា SRT ឬ VTT ជាមួយ​នឹង​កំណែ​អត្ថបទ​ធម្មតា ។ ភ្ជាប់​ SRT ជាមួយ​នឹង MP3 ដើម (ឬ​ MP4 ដែល​បាន​បម្លែង) ហើយ​អ្នក​មាន​វីដេអូ​ចំណង​ជើង​រង​រួចរាល់​ដើម្បី​បោះពុម្ព ។

បាទ. អនុញ្ញាត​ឲ្យ​អ្នក​និយាយ​ធ្វើ​ការ​កំណត់​ជា​មុន​ហើយ​បំពង់​របស់យើង​រត់ pyannote.audio នៅ​លើ​កំពូល​របស់ Whisper ដើម្បី​ដាក់​ស្លាក​អ្នក​និយាយ​នីមួយៗ ។ សម្រាប់​លទ្ធផល​ល្អ​បំផុត​លើ MP3 ផ្តល់​ឲ្យ​យើង​យ៉ាង​ហោច​ណាស់ 30 វិនាទី​នៃ​អូឌីយ៉ូ ដូច្នេះ​អ្នក​ធ្វើ​ការ​កំណត់​ជា​មុន​មាន​គំរូ​គ្រប់គ្រាន់​ដើម្បី​បោះពុម្ព​សំឡេង​ជា​ក្រុម ។ ការ​ថត​អ្នក​និយាយ​ពីរ​នាក់​ទទួលបាន​ការ​ដាក់​ស្លាក​ដែល​ត្រឹមត្រូវ​បំផុត ។

ទេ. កម្មវិធី សរសេរ សំឡេង របស់ យើង គ្រប់គ្រង MP3 ដោយ ផ្ទាល់ — ការ បម្លែង ទៅ WAV ដំបូង នឹង បន្ថែម វិធានការ អ៊ិនកូដ ឡើងវិញ (មាន ឱកាស បាត់បង់) និង ចំណាយ ពេល របស់អ្នក. លើក លែងតែ មួយ គឺ ប្រសិន បើ ឯកសារ MP3 របស់ អ្នក ប្រើ កូឌិក ខុស ធម្មតា របស់យើង កម្មវិធី បំលែង កូដ មិន ទទួល ស្គាល់ (កម្រ); យើង នឹង ប្រាប់ អ្នក ថា លើ ការ ផ្ទុក ឡើង ហើយ អ្នក អាច បម្លែង តាមរយៈ ការ បម្លែង អូឌីយ៉ូ ដោយ ឥត គិត ថ្លៃ របស់ យើង.

បាទ, ដែល ជា លំនាំ ផ្ទុក ឡើង ទូទៅ បំផុត សម្រាប់ MP3. Faster Whisper គ្រប់គ្រង ការ ថត ស្អាត, មួយ ៗ រំខាន និង ការ និយាយ accented - អ្នក មិន ចាំបាច់ សម្អាត ឡើង អូឌីយ៉ូ ដំបូង. ប្រសិនបើ ភាព ត្រឹមត្រូវ គឺ មិន មែន អ្វីដែល អ្នក រំពឹង ទុក, រត់ ឯកសារ តាមរយៈ អូឌីយ៉ូ បង្កើន របស់យើង (ដោយ ឥត គិត ថ្លៃ សម្រាប់ មួយ ឆ្លងកាត់) ដើម្បី យក ចេញ សំឡេង ផ្ទៃខាងក្រោយ, បន្ទាប់មក ព្យាយាម សរសេរ ឡើងវិញ.

ការបកប្រែគឺឥតគិតថ្លៃសម្រាប់ឯកសារក្រោម5នាទី។ ផែនការដែលបានបង់ប្រាក់ប្រើ ~ 1,000 តួអក្សរក្នុងមួយនាទីនៃ MP3 អូឌីយ៉ូ។ កិច្ចប្រជុំ 60 នាទីបកប្រែសម្រាប់ 60,000 តួអក្សរ; សំបុត្រសំឡេង3នាទីគឺឥតគិតថ្លៃ។ ចំណាំ MP3 ជាក់លាក់៖ ប្រសិនបើឯកសាររបស់អ្នកជាញឹកញាប់ស្ងាត់ (ឧទាហរណ៍ការផ្អាកយូរនៅក្នុងការថតសន្និសីទ) អនុញ្ញាតឱ្យការរកឃើញសកម្មភាពសំឡេងដើម្បីរំលងភាពស្ងាត់និងបង់តែសម្រាប់ផ្នែកនៃការនិយាយ។

បាទ. បានផ្ទុកឡើង MP3 ឯកសារត្រូវបានដំណើរការនៅលើម៉ាស៊ីនបម្រើ GPU របស់យើងនិងលុបដោយស្វ័យប្រវត្តិក្នុងរយៈពេល2ថ្ងៃ. យើងមិនដែលរក្សាទុកអូឌីយ៉ូរយៈពេលវែង, ម៉ូដែលរថភ្លើងលើទិន្នន័យអ្នកប្រើឬចែករំលែកជាមួយភាគីទីបី. សំបុត្រនេះនៅសល់នៅក្នុងគណនីរបស់អ្នកសម្រាប់រយៈពេលដែលអ្នកចង់វា.

បាទ / ចាស. POST ឯកសារ MP3 របស់អ្នកទៅ / api / v1 / transcribe / ជាទិន្នន័យសំណុំបែបបទច្រើនផ្នែកជាមួយឯកសារអូឌីយ៉ូនៅក្នុងវាល `file` ។ ការឆ្លើយតបរួមមាន transcript, កាលបរិច្ឆេទផ្នែក, កាលបរិច្ឆេទកម្រិតពាក្យជាជម្រើសនិង UUID ការងារដែលអ្នកអាចបោះឆ្នោតសម្រាប់ URL នាំចេញ SRT / VTT ។ មាននៅលើផែនការបង់ប្រាក់ទាំងអស់។
5.0/5 (1)

តើ​យើង​អាច​ធ្វើ​អ្វី​បាន​ប្រសើរ​ឡើង & # 160;? មតិ​យោបល់​របស់​អ្នក​ជួយ​យើង​ជួសជុល​បញ្ហា & # 160; ។

បម្លែង​អូឌីយ៉ូ និង​វីដេអូ​ជាមួយ AI

ទទួលបានការបកប្រែត្រឹមត្រូវនៅក្នុង 99 ភាសា. ចុះឈ្មោះដោយឥតគិតថ្លៃនិងទទួលបាន 15,000 តួអក្សរដើម្បីចាប់ផ្តើម.