Convert AVI to Text

Convert AVI video files to text with AI. Transcribe legacy video recordings to accurate text. Free online AVI transcription.

យើង​មិន​មាន​សំឡេង TTS ក្នុង​ភាសា​របស់​អ្នក​នៅ​ឡើយ​ទេ & # 160; ។ ជួយ​យើង​បន្ថែម​របស់​អ្នក & # 160;! លក់​សំឡេង​របស់​អ្នក

ផ្ទុក​អូឌីយ៉ូ ឬ​វីដេអូ​ឡើង

អូស និង​ទម្លាក់​ឯកសារ​របស់​អ្នក​នៅ​ទីនេះ ឬ រកមើល

គាំទ្រ MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV ។ ឥតគិតថ្លៃរហូតដល់ 500 មេកាបៃ · ពេញចិត្តរហូតដល់2ជីកាបៃ។

ឯកសារ.mp3

0 MB
— ឬ​ថត​ពី​មីក្រូហ្វូន​របស់​អ្នក —
00:00

ការ​កំណត់​រចនាសម្ព័ន្ធ​

1,000/min តួអក្សរ ចុះឈ្មោះ ប្រើ​ការ​ត្រួតពិនិត្យ​ការ​ប្រើ

ចម្លង​តួ

ផ្ទុក​ឯកសារ​អូឌីយ៉ូ ឬ​វីដេអូ​ឡើង ហើយ​ចុច​បម្លែង​ដើម្បី​ចាប់ផ្ដើម

កំពុង​បម្លែង... វា​អាច​ចំណាយ​ពេល​បន្តិច & # 160; ។

បាន​រក​ឃើញ:

របៀប​ដែល​វា​ធ្វើការ

1. ផ្ទុកឡើងអូឌីយ៉ូឬវីដេអូ

ផ្ទុកឡើងឯកសារអូឌីយ៉ូឬវីដេអូរបស់អ្នក. យើងគាំទ្រ MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, និង MKV ទ្រង់ទ្រាយរហូតដល់ទៅ 100MB.

2. AI សរសេរ

ម៉ូដែល AI របស់យើងដំណើរការអូឌីយ៉ូរបស់អ្នក រកឃើញភាសា កំណត់អត្តសញ្ញាណអ្នកនិយាយ និងបង្កើតអត្ថបទត្រឹមត្រូវជាមួយ timestamps ។

3. ទទួលបានការផ្ទេររបស់អ្នក

ចម្លង​អត្ថបទ​បកប្រែ​របស់​អ្នក ឬ​ទាញយក​វា​ជា​ទ្រង់ទ្រាយ​ចំណង​ជើង​រង TXT ឬ SRT & # 160; ។ កែសម្រួល និង​កែលម្អ​តាម​ដែល​ចាំបាច់ & # 160; ។

ករណី​ប្រើ

ការ​បកប្រែ​អូឌីយ៉ូ​សម្រាប់​ឧស្សាហកម្ម និង​លំហូរ​ការងារ​ទាំងអស់

កិច្ចប្រជុំ និង​សន្និសីទ

សរសេរជាអក្សរដោយស្វ័យប្រវត្តិ Zoom, ក្រុម និង Google Meet ការថត។ កុំភ្លេចធាតុសកម្មភាពម្តងទៀត។ នាំចេញជាចំណាំកិច្ចប្រជុំឬចំណងជើងរង។

បទសម្ភាសន៍ & សារព័ត៌មាន

សរសេរ​បទសម្ភាសន៍​សម្រាប់​អត្ថបទ ឯកសារ​ស្រាវជ្រាវ និង​ឯកសារ​ឯកសារ ។ កម្មវិធី​សរសេរ​កំណត់​អត្តសញ្ញាណ​អ្នក​និយាយ​ដែល​បាន​និយាយ​អ្វី​សម្រាប់​ការ​ផ្ទេរ​ភាព​ងាយស្រួល ។

ផតខាស់ និង​មេឌៀ

បង្កើត​អត្ថបទ​បកប្រែ និង​បង្ហាញ​ចំណាំ​សម្រាប់​ផតខាស់​ភាគ ។ បង្កើត​ប័ណ្ណសារ​ដែល​អាច​ស្វែងរក​បាន​នៃ​មាតិកា​អូឌីយ៉ូ​របស់​អ្នក ។ បន្ថែម​ចំណង​ជើង​រង​ទៅ​ផតខាស់​វីដេអូ ។

វគ្គ​បង្រៀន និង​អប់រំ

បម្លែង​ការ​បង្រៀន​ដែល​បាន​ថត​ទៅ​ជា​ចំណាំ​សិក្សា ។ ធ្វើ​មាតិកា​អប់រំ​ដែល​អាច​ចូល​ដំណើរការ​បាន​ជាមួយ​ចំណង​ជើង​ត្រឹមត្រូវ ។ គាំទ្រ​សិស្ស​ដែល​មាន​ការ​ពិបាក​ស្ដាប់ ។

ប្រព័ន្ធ​ផ្សព្វផ្សាយ​សង្គម

បង្កើតចំណងជើងរងនិងចំណងជើងបិទសម្រាប់វីដេអូ YouTube, TikToks និងមាតិកាប្រព័ន្ធផ្សព្វផ្សាយសង្គម។ បង្កើនភាពងាយស្រួលនិង SEO ជាមួយការបកប្រែត្រឹមត្រូវ។

ច្បាប់ និង​វេជ្ជសាស្ត្រ

សរសេរ​ការ​ដាក់​ពាក្យ​បណ្តឹង ការ​សួរ​ដេញដោល ការ​ពិគ្រោះ​យោបល់ និង​ការ​និយាយ​បញ្ជា ។ សម្គាល់​ពេលវេលា​ត្រឹមត្រូវ​សម្រាប់​យោង ។ នាំចេញ​ជា​ទ្រង់ទ្រាយ​ដែល​សមរម្យ​សម្រាប់​ឯកសារ ។

ទ្រង់ទ្រាយ​ដែល​បាន​គាំទ្រ

បម្លែង​ឯកសារ​អូឌីយ៉ូ ឬ​វីដេអូ​ណាមួយ​ទៅ​ជា​អត្ថបទ​ដោយ​ស្វ័យប្រវត្តិ

ទ្រង់ទ្រាយ​អូឌីយ៉ូ

MP3 WAV FLAC OGG M4A AAC WMA OPUS

ទ្រង់ទ្រាយ​វីដេអូ

MP4 WebM AVI MOV MKV WMV FLV M4V

អូឌីយ៉ូ​ត្រូវ​បាន​ស្រង់​ចេញ​ដោយ​ស្វ័យ​ប្រវត្តិ​ពី​ឯកសារ​វីដេអូ​សម្រាប់​បម្លែង & # 160; ។

ម៉ូដែល​បម្លែង​ជា​សំឡេង

Whisper

ម៉ូដែល​ការ​ទទួល​ស្គាល់​ការ​និយាយ​រឹងមាំ​របស់ OpenAI ដែល​គាំទ្រ ៩៩ ភាសា ។

  • 99 ភាសា
  • ការ​បកប្រែ
  • ត្រា​ពេលវេលា
  • រឹងមាំ​ចំពោះ​សំឡេង​រំខាន
OpenAI

Faster Whisper

4x រហ័សជាង Whisper ជាមួយការបង្កើនប្រសិទ្ធិភាព CTranslate2, ភាពត្រឹមត្រូវដូចគ្នា.

  • ឆាប់​ជាង ៤ ដង
  • សតិ​ទាប
  • ទំហំ​ម៉ូដែល​ទាំងអស់
  • ការ​ដំណើរការ​បាច់
  • ការ​ត្រង VAD
SYSTRAN

SenseVoice

ម៉ូដែល​ការ​យល់​ដឹង​នៃ​ការ​និយាយ​ជាមួយ​ការ​រក​ឃើញ​អារម្មណ៍ 50+ ភាសា ។

  • 50+ ភាសា
  • ការ​រក​ឃើញ​អារម្មណ៍
  • ព្រឹត្តិការណ៍​អូឌីយ៉ូ
  • ការ​វិភាគ​អ្នក​និយាយ
  • ទិន្នន័យ​មេតា​សម្បូរបែប
Alibaba (FunAudioLLM)

សំណួរ​ដែល​សួរ​ញឹកញាប់

ផ្ទុក​ឯកសារ AVI របស់អ្នក​ឡើង ។ កម្មវិធី​សរសេរ​ឡើងវិញ​របស់​យើង​ស្រង់​បទ​អូឌីយ៉ូ​ចេញ​ពី​ធុង​ផ្ទុក a wide range of codecs (DivX, XviD, MJPEG, uncompressed) in a Microsoft AVI container ផ្ញើ​វា​ទៅ​កាន់ Faster Whisper នៅលើ GPU ហើយ​ត្រឡប់​ការ​សរសេរ​ឡើងវិញ​ដែល​មាន​ត្រា​ពេលវេលា​រួម​ជាមួយ​នឹង​ការ​នាំចេញ​ចំណង​ជើង​រង SRT និង VTT ជម្រើស ។ អ្នក​មិន​ចាំបាច់​ធ្វើ​ការ​ដក​ចេញ​ឬ​ស្រង់​អូឌីយ៉ូ​ដោយ​ខ្លួន​ឯង​ទេ — ដែល​កើតឡើង​នៅ​ខាង​ម៉ាស៊ីន​បម្រើ ។

AVI គឺ a wide range of codecs (DivX, XviD, MJPEG, uncompressed) in a Microsoft AVI container ។ វាត្រូវបានផលិតជាទូទៅបំផុតដោយ older Windows recordings, camcorder exports, and legacy video archives ។

AVI គឺ​មាន​ការ​បាត់បង់ (a wide range of codecs (DivX, XviD, MJPEG, uncompressed) in a Microsoft AVI container) ប៉ុន្តែ​ការ​បាត់បង់​កើតឡើង​ក្នុង​ជួរ​អូឌីយ៉ូ​ដែល​មិន​មាន​ព័ត៌មាន​និយាយ​ច្រើន​។ Faster Whisper សរសេរ​ជា​សំឡេង AVI នៅ highly variable — depends on the embedded codec ក្នុង​ចំណោម ~ 1% នៃ​ភាព​ត្រឹមត្រូវ WAV លើ​ការ​ថត​ប្រភព​ដូចគ្នា ។ កម្រាល​ភាព​ត្រឹមត្រូវ​ពិត​ប្រាកដ​គឺ​ជា​គុណភាព​ថត​ដើម (មីក្រូហ្វូន បន្ទប់ ភាព​ច្បាស់​របស់​អ្នក​និយាយ) មិនមែន​ជា​កូឌិក AVI ទេ ។

AVI ឯកសារជាទូទៅគឺ 20-100 MB/min depending on codec ដូច្នេះការផ្ទុកឡើងភាគច្រើនគឺស្ថិតនៅក្រោមកម្ពស់ 500 MB របស់យើង។ គណនីឥតគិតថ្លៃអាចចម្លងរហូតដល់ទៅ5នាទីក្នុងមួយការផ្ទុកឡើង។ ផែនការដែលបានបង់ប្រាក់ឡើងទៅ2ម៉ោង។ ប្រសិនបើអ្នកកំពុងបុកកម្ពស់លើឯកសារវែងសូមមើលឧបករណ៍សៀវភៅអូឌីយ៉ូ / ទម្រង់វែងដែលគ្រប់គ្រងចម្លងច្រើនម៉ោង។

បាទ — Faster Whisper គាំទ្រ 99 ភាសា និង​រក​ឃើញ​ដោយ​ស្វ័យ​ប្រវត្តិ​ភាសា​ដែល​បាន​និយាយ​ក្នុង​ឯកសារ AVI របស់​អ្នក & # 160; ។ អ្នក​ក៏​អាច​បង្ខំ​ឲ្យ​ប្រើ​ភាសា​ប្រភព​ជាក់លាក់​តាម​រយៈ​ការ​កំណត់​កម្រិត​ខ្ពស់​បើ​ការ​រក​ឃើញ​ដោយ​ស្វ័យ​ប្រវត្តិ​ជ្រើស​យក​មួយ​ខុស (ទូទៅ​ជាមួយ​ភាសា​អង់គ្លេស​ដែល​បាន​ដាក់​ចំណង​ជើង​ខុស​ជា​ភាសា​ម្តាយ​របស់​អ្នក​ស្តាប់ ឬ​ជាមួយ​នឹង​វីដេអូ​ខ្លី​ណាស់) & # 160; ។

យើង​ត្រឡប់​ឯកសារ​ចំណង​ជើង​រង SRT និង VTT ជាមួយ​នឹង​អត្ថបទ​ធម្មតា​ដែល​បាន​សរសេរ​ជា​លាយ​លក្ខណ៍​អក្សរ ។ ដើម្បី​បង្កប់​ពួក​វា​នៅ​ក្នុង​ឯកសារ AVI របស់​អ្នក ប្រើ​ឧបករណ៍​ដូច​ជា ffmpeg ឬ HandBrake ដើម្បី​បញ្ចូល​ចំណង​ជើង​រង​ស្រាល​ទៅ​ក្នុង​ឯកសារ SRT / VTT ។ យើង​មិន​អ៊ិនកូដ​វីដេអូ​ឡើងវិញ​ទេ — ដែល​នឹង​បាត់បង់ ។

បាទ. អនុញ្ញាត​ឲ្យ​អ្នក​និយាយ​ធ្វើ​ការ​កំណត់​ជា​មុន​ហើយ​បំពង់​របស់យើង​រត់ pyannote.audio នៅ​លើ​កំពូល​របស់ Whisper ដើម្បី​ដាក់​ស្លាក​អ្នក​និយាយ​នីមួយៗ ។ សម្រាប់​លទ្ធផល​ល្អ​បំផុត​លើ AVI ផ្តល់​ឲ្យ​យើង​យ៉ាង​ហោច​ណាស់ 30 វិនាទី​នៃ​អូឌីយ៉ូ ដូច្នេះ​អ្នក​ធ្វើ​ការ​កំណត់​ជា​មុន​មាន​គំរូ​គ្រប់គ្រាន់​ដើម្បី​បោះពុម្ព​សំឡេង​ជា​ក្រុម ។ ការ​ថត​អ្នក​និយាយ​ពីរ​នាក់​ទទួលបាន​ការ​ដាក់​ស្លាក​ដែល​ត្រឹមត្រូវ​បំផុត ។

ទេ. កម្មវិធី សរសេរ សំឡេង របស់ យើង គ្រប់គ្រង AVI ដោយ ផ្ទាល់ — ការ បម្លែង ទៅ MP4 ដំបូង នឹង បន្ថែម វិធានការ អ៊ិនកូដ ឡើងវិញ (មាន ឱកាស បាត់បង់) និង ចំណាយ ពេល របស់អ្នក. លើក លែងតែ មួយ គឺ ប្រសិន បើ ឯកសារ AVI របស់ អ្នក ប្រើ កូឌិក ខុស ធម្មតា របស់យើង កម្មវិធី បំលែង កូដ មិន ទទួល ស្គាល់ (កម្រ); យើង នឹង ប្រាប់ អ្នក ថា លើ ការ ផ្ទុក ឡើង ហើយ អ្នក អាច បម្លែង តាមរយៈ ការ បម្លែង អូឌីយ៉ូ ដោយ ឥត គិត ថ្លៃ របស់ យើង.

បាទ, ដែល ជា លំនាំ ផ្ទុក ឡើង ទូទៅ បំផុត សម្រាប់ AVI. Faster Whisper គ្រប់គ្រង ការ ថត ស្អាត, មួយ ៗ រំខាន និង ការ និយាយ accented - អ្នក មិន ចាំបាច់ សម្អាត ឡើង អូឌីយ៉ូ ដំបូង. ប្រសិនបើ ភាព ត្រឹមត្រូវ គឺ មិន មែន អ្វីដែល អ្នក រំពឹង ទុក, រត់ ឯកសារ តាមរយៈ អូឌីយ៉ូ បង្កើន របស់យើង (ដោយ ឥត គិត ថ្លៃ សម្រាប់ មួយ ឆ្លងកាត់) ដើម្បី យក ចេញ សំឡេង ផ្ទៃខាងក្រោយ, បន្ទាប់មក ព្យាយាម សរសេរ ឡើងវិញ.

ការបកប្រែគឺឥតគិតថ្លៃសម្រាប់ឯកសារក្រោម5នាទី។ ផែនការដែលបានបង់ប្រាក់ប្រើ ~ 1,000 តួអក្សរក្នុងមួយនាទីនៃ AVI អូឌីយ៉ូ។ កិច្ចប្រជុំ 60 នាទីបកប្រែសម្រាប់ 60,000 តួអក្សរ; សំបុត្រសំឡេង3នាទីគឺឥតគិតថ្លៃ។ ចំណាំ AVI ជាក់លាក់៖ ប្រសិនបើឯកសាររបស់អ្នកជាញឹកញាប់ស្ងាត់ (ឧទាហរណ៍ការផ្អាកយូរនៅក្នុងការថតសន្និសីទ) អនុញ្ញាតឱ្យការរកឃើញសកម្មភាពសំឡេងដើម្បីរំលងភាពស្ងាត់និងបង់តែសម្រាប់ផ្នែកនៃការនិយាយ។

បាទ. បានផ្ទុកឡើង AVI ឯកសារត្រូវបានដំណើរការនៅលើម៉ាស៊ីនបម្រើ GPU របស់យើងនិងលុបដោយស្វ័យប្រវត្តិក្នុងរយៈពេល2ថ្ងៃ. យើងមិនដែលរក្សាទុកអូឌីយ៉ូរយៈពេលវែង, ម៉ូដែលរថភ្លើងលើទិន្នន័យអ្នកប្រើឬចែករំលែកជាមួយភាគីទីបី. សំបុត្រនេះនៅសល់នៅក្នុងគណនីរបស់អ្នកសម្រាប់រយៈពេលដែលអ្នកចង់វា.

បាទ/ ចាស ។ ដាក់​ឯកសារ AVI របស់​អ្នក​ទៅ /api/v1/transcribe/ ជា​ទិន្នន័យ​សំណុំបែបបទ​ច្រើន​ផ្នែក ។ ចំណុច​បញ្ចប់​ទទួល​យក​វីដេអូ​ដោយ​ផ្ទាល់ — មិន​ចាំបាច់​ស្រង់​អូឌីយ៉ូ​ចេញ​ដំបូង​ឡើយ​។ ffmpeg គ្រប់គ្រង​ផ្នែក​ម៉ាស៊ីន​បម្រើ demux ។ ការ​ឆ្លើយតប​រួម​មាន​ការ​ច្រៀង​ឡើងវិញ កាលបរិច្ឆេទ និង UUID ការងារ​ដែល​អ្នក​អាច​បោះឆ្នោត​សម្រាប់ URL នាំចេញ SRT / VTT ។
5.0/5 (1)

តើ​យើង​អាច​ធ្វើ​អ្វី​បាន​ប្រសើរ​ឡើង & # 160;? មតិ​យោបល់​របស់​អ្នក​ជួយ​យើង​ជួសជុល​បញ្ហា & # 160; ។

បម្លែង​អូឌីយ៉ូ និង​វីដេអូ​ជាមួយ AI

ទទួលបានការបកប្រែត្រឹមត្រូវនៅក្នុង 99 ភាសា. ចុះឈ្មោះដោយឥតគិតថ្លៃនិងទទួលបាន 15,000 តួអក្សរដើម្បីចាប់ផ្តើម.