Convert OGG to Text

Convert OGG/Opus audio files to text with AI. Transcribe voice messages and audio recordings. Free online OGG to text tool.

យើង​មិន​មាន​សំឡេង TTS ក្នុង​ភាសា​របស់​អ្នក​នៅ​ឡើយ​ទេ & # 160; ។ ជួយ​យើង​បន្ថែម​របស់​អ្នក & # 160;! លក់​សំឡេង​របស់​អ្នក

ផ្ទុក​អូឌីយ៉ូ ឬ​វីដេអូ​ឡើង

អូស និង​ទម្លាក់​ឯកសារ​របស់​អ្នក​នៅ​ទីនេះ ឬ រកមើល

គាំទ្រ MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV ។ ឥតគិតថ្លៃរហូតដល់ 500 មេកាបៃ · ពេញចិត្តរហូតដល់2ជីកាបៃ។

ឯកសារ.mp3

0 MB
— ឬ​ថត​ពី​មីក្រូហ្វូន​របស់​អ្នក —
00:00

ការ​កំណត់​រចនាសម្ព័ន្ធ​

1,000/min តួអក្សរ ចុះឈ្មោះ ប្រើ​ការ​ត្រួតពិនិត្យ​ការ​ប្រើ

ចម្លង​តួ

ផ្ទុក​ឯកសារ​អូឌីយ៉ូ ឬ​វីដេអូ​ឡើង ហើយ​ចុច​បម្លែង​ដើម្បី​ចាប់ផ្ដើម

កំពុង​បម្លែង... វា​អាច​ចំណាយ​ពេល​បន្តិច & # 160; ។

បាន​រក​ឃើញ:

របៀប​ដែល​វា​ធ្វើការ

1. ផ្ទុកឡើងអូឌីយ៉ូឬវីដេអូ

ផ្ទុកឡើងឯកសារអូឌីយ៉ូឬវីដេអូរបស់អ្នក. យើងគាំទ្រ MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, និង MKV ទ្រង់ទ្រាយរហូតដល់ទៅ 100MB.

2. AI សរសេរ

ម៉ូដែល AI របស់យើងដំណើរការអូឌីយ៉ូរបស់អ្នក រកឃើញភាសា កំណត់អត្តសញ្ញាណអ្នកនិយាយ និងបង្កើតអត្ថបទត្រឹមត្រូវជាមួយ timestamps ។

3. ទទួលបានការផ្ទេររបស់អ្នក

ចម្លង​អត្ថបទ​បកប្រែ​របស់​អ្នក ឬ​ទាញយក​វា​ជា​ទ្រង់ទ្រាយ​ចំណង​ជើង​រង TXT ឬ SRT & # 160; ។ កែសម្រួល និង​កែលម្អ​តាម​ដែល​ចាំបាច់ & # 160; ។

ករណី​ប្រើ

ការ​បកប្រែ​អូឌីយ៉ូ​សម្រាប់​ឧស្សាហកម្ម និង​លំហូរ​ការងារ​ទាំងអស់

កិច្ចប្រជុំ និង​សន្និសីទ

សរសេរជាអក្សរដោយស្វ័យប្រវត្តិ Zoom, ក្រុម និង Google Meet ការថត។ កុំភ្លេចធាតុសកម្មភាពម្តងទៀត។ នាំចេញជាចំណាំកិច្ចប្រជុំឬចំណងជើងរង។

បទសម្ភាសន៍ & សារព័ត៌មាន

សរសេរ​បទសម្ភាសន៍​សម្រាប់​អត្ថបទ ឯកសារ​ស្រាវជ្រាវ និង​ឯកសារ​ឯកសារ ។ កម្មវិធី​សរសេរ​កំណត់​អត្តសញ្ញាណ​អ្នក​និយាយ​ដែល​បាន​និយាយ​អ្វី​សម្រាប់​ការ​ផ្ទេរ​ភាព​ងាយស្រួល ។

ផតខាស់ និង​មេឌៀ

បង្កើត​អត្ថបទ​បកប្រែ និង​បង្ហាញ​ចំណាំ​សម្រាប់​ផតខាស់​ភាគ ។ បង្កើត​ប័ណ្ណសារ​ដែល​អាច​ស្វែងរក​បាន​នៃ​មាតិកា​អូឌីយ៉ូ​របស់​អ្នក ។ បន្ថែម​ចំណង​ជើង​រង​ទៅ​ផតខាស់​វីដេអូ ។

វគ្គ​បង្រៀន និង​អប់រំ

បម្លែង​ការ​បង្រៀន​ដែល​បាន​ថត​ទៅ​ជា​ចំណាំ​សិក្សា ។ ធ្វើ​មាតិកា​អប់រំ​ដែល​អាច​ចូល​ដំណើរការ​បាន​ជាមួយ​ចំណង​ជើង​ត្រឹមត្រូវ ។ គាំទ្រ​សិស្ស​ដែល​មាន​ការ​ពិបាក​ស្ដាប់ ។

ប្រព័ន្ធ​ផ្សព្វផ្សាយ​សង្គម

បង្កើតចំណងជើងរងនិងចំណងជើងបិទសម្រាប់វីដេអូ YouTube, TikToks និងមាតិកាប្រព័ន្ធផ្សព្វផ្សាយសង្គម។ បង្កើនភាពងាយស្រួលនិង SEO ជាមួយការបកប្រែត្រឹមត្រូវ។

ច្បាប់ និង​វេជ្ជសាស្ត្រ

សរសេរ​ការ​ដាក់​ពាក្យ​បណ្តឹង ការ​សួរ​ដេញដោល ការ​ពិគ្រោះ​យោបល់ និង​ការ​និយាយ​បញ្ជា ។ សម្គាល់​ពេលវេលា​ត្រឹមត្រូវ​សម្រាប់​យោង ។ នាំចេញ​ជា​ទ្រង់ទ្រាយ​ដែល​សមរម្យ​សម្រាប់​ឯកសារ ។

ទ្រង់ទ្រាយ​ដែល​បាន​គាំទ្រ

បម្លែង​ឯកសារ​អូឌីយ៉ូ ឬ​វីដេអូ​ណាមួយ​ទៅ​ជា​អត្ថបទ​ដោយ​ស្វ័យប្រវត្តិ

ទ្រង់ទ្រាយ​អូឌីយ៉ូ

MP3 WAV FLAC OGG M4A AAC WMA OPUS

ទ្រង់ទ្រាយ​វីដេអូ

MP4 WebM AVI MOV MKV WMV FLV M4V

អូឌីយ៉ូ​ត្រូវ​បាន​ស្រង់​ចេញ​ដោយ​ស្វ័យ​ប្រវត្តិ​ពី​ឯកសារ​វីដេអូ​សម្រាប់​បម្លែង & # 160; ។

ម៉ូដែល​បម្លែង​ជា​សំឡេង

Whisper

ម៉ូដែល​ការ​ទទួល​ស្គាល់​ការ​និយាយ​រឹងមាំ​របស់ OpenAI ដែល​គាំទ្រ ៩៩ ភាសា ។

  • 99 ភាសា
  • ការ​បកប្រែ
  • ត្រា​ពេលវេលា
  • រឹងមាំ​ចំពោះ​សំឡេង​រំខាន
OpenAI

Faster Whisper

4x រហ័សជាង Whisper ជាមួយការបង្កើនប្រសិទ្ធិភាព CTranslate2, ភាពត្រឹមត្រូវដូចគ្នា.

  • ឆាប់​ជាង ៤ ដង
  • សតិ​ទាប
  • ទំហំ​ម៉ូដែល​ទាំងអស់
  • ការ​ដំណើរការ​បាច់
  • ការ​ត្រង VAD
SYSTRAN

SenseVoice

ម៉ូដែល​ការ​យល់​ដឹង​នៃ​ការ​និយាយ​ជាមួយ​ការ​រក​ឃើញ​អារម្មណ៍ 50+ ភាសា ។

  • 50+ ភាសា
  • ការ​រក​ឃើញ​អារម្មណ៍
  • ព្រឹត្តិការណ៍​អូឌីយ៉ូ
  • ការ​វិភាគ​អ្នក​និយាយ
  • ទិន្នន័យ​មេតា​សម្បូរបែប
Alibaba (FunAudioLLM)

សំណួរ​ដែល​សួរ​ញឹកញាប់

ផ្ទុកឡើងឯកសារ OGG របស់អ្នកដោយផ្ទាល់ - គ្មានការបម្លែងចាំបាច់។ កម្មវិធីសរសេរឡើងវិញរបស់យើងឌិកូដស្ទ្រីម Vorbis (open-source patent-free) ផ្ញើវាទៅ Faster Whisper នៅលើ GPU ហើយត្រឡប់មកវិញនូវការសរសេរឡើងវិញដែលមានកាលបរិច្ឆេទរួមជាមួយការនាំចេញចំណងជើងរង SRT និង VTT ជម្រើស។

OGG គឺ Vorbis (open-source patent-free) ។ វាត្រូវបានផលិតជាទូទៅបំផុតដោយ open-source applications, game engines, Wikipedia audio, and Linux-recorded files ។

OGG គឺ​មាន​ការ​បាត់បង់ (Vorbis (open-source patent-free)) ប៉ុន្តែ​ការ​បាត់បង់​កើតឡើង​ក្នុង​ជួរ​អូឌីយ៉ូ​ដែល​មិន​មាន​ព័ត៌មាន​និយាយ​ច្រើន​។ Faster Whisper សរសេរ​ជា​សំឡេង OGG នៅ 96-256 kbps Vorbis ក្នុង​ចំណោម ~ 1% នៃ​ភាព​ត្រឹមត្រូវ WAV លើ​ការ​ថត​ប្រភព​ដូចគ្នា ។ កម្រាល​ភាព​ត្រឹមត្រូវ​ពិត​ប្រាកដ​គឺ​ជា​គុណភាព​ថត​ដើម (មីក្រូហ្វូន បន្ទប់ ភាព​ច្បាស់​របស់​អ្នក​និយាយ) មិនមែន​ជា​កូឌិក OGG ទេ ។

OGG ឯកសារជាទូទៅគឺ 1 MB/min at 128 kbps Vorbis ដូច្នេះការផ្ទុកឡើងភាគច្រើនគឺស្ថិតនៅក្រោមកម្ពស់ 500 MB របស់យើង។ គណនីឥតគិតថ្លៃអាចចម្លងរហូតដល់ទៅ5នាទីក្នុងមួយការផ្ទុកឡើង។ ផែនការដែលបានបង់ប្រាក់ឡើងទៅ2ម៉ោង។ ប្រសិនបើអ្នកកំពុងបុកកម្ពស់លើឯកសារវែងសូមមើលឧបករណ៍សៀវភៅអូឌីយ៉ូ / ទម្រង់វែងដែលគ្រប់គ្រងចម្លងច្រើនម៉ោង។

បាទ — Faster Whisper គាំទ្រ 99 ភាសា និង​រក​ឃើញ​ដោយ​ស្វ័យ​ប្រវត្តិ​ភាសា​ដែល​បាន​និយាយ​ក្នុង​ឯកសារ OGG របស់​អ្នក & # 160; ។ អ្នក​ក៏​អាច​បង្ខំ​ឲ្យ​ប្រើ​ភាសា​ប្រភព​ជាក់លាក់​តាម​រយៈ​ការ​កំណត់​កម្រិត​ខ្ពស់​បើ​ការ​រក​ឃើញ​ដោយ​ស្វ័យ​ប្រវត្តិ​ជ្រើស​យក​មួយ​ខុស (ទូទៅ​ជាមួយ​ភាសា​អង់គ្លេស​ដែល​បាន​ដាក់​ចំណង​ជើង​ខុស​ជា​ភាសា​ម្តាយ​របស់​អ្នក​ស្តាប់ ឬ​ជាមួយ​នឹង​វីដេអូ​ខ្លី​ណាស់) & # 160; ។

បាទ - អត្ថបទ​មាន​រួម​បញ្ចូល​ការ​បោះពុម្ព​កាលបរិច្ឆេទ​ផ្នែក និង​ការ​បោះពុម្ព​កាលបរិច្ឆេទ​កម្រិត​ពាក្យ​ដែល​បាន​នាំចេញ​ជា SRT ឬ VTT ជាមួយ​នឹង​កំណែ​អត្ថបទ​ធម្មតា ។ ភ្ជាប់​ SRT ជាមួយ​នឹង OGG ដើម (ឬ​ MP4 ដែល​បាន​បម្លែង) ហើយ​អ្នក​មាន​វីដេអូ​ចំណង​ជើង​រង​រួចរាល់​ដើម្បី​បោះពុម្ព ។

បាទ. អនុញ្ញាត​ឲ្យ​អ្នក​និយាយ​ធ្វើ​ការ​កំណត់​ជា​មុន​ហើយ​បំពង់​របស់យើង​រត់ pyannote.audio នៅ​លើ​កំពូល​របស់ Whisper ដើម្បី​ដាក់​ស្លាក​អ្នក​និយាយ​នីមួយៗ ។ សម្រាប់​លទ្ធផល​ល្អ​បំផុត​លើ OGG ផ្តល់​ឲ្យ​យើង​យ៉ាង​ហោច​ណាស់ 30 វិនាទី​នៃ​អូឌីយ៉ូ ដូច្នេះ​អ្នក​ធ្វើ​ការ​កំណត់​ជា​មុន​មាន​គំរូ​គ្រប់គ្រាន់​ដើម្បី​បោះពុម្ព​សំឡេង​ជា​ក្រុម ។ ការ​ថត​អ្នក​និយាយ​ពីរ​នាក់​ទទួលបាន​ការ​ដាក់​ស្លាក​ដែល​ត្រឹមត្រូវ​បំផុត ។

ទេ. កម្មវិធី សរសេរ សំឡេង របស់ យើង គ្រប់គ្រង OGG ដោយ ផ្ទាល់ — ការ បម្លែង ទៅ MP3 ដំបូង នឹង បន្ថែម វិធានការ អ៊ិនកូដ ឡើងវិញ (មាន ឱកាស បាត់បង់) និង ចំណាយ ពេល របស់អ្នក. លើក លែងតែ មួយ គឺ ប្រសិន បើ ឯកសារ OGG របស់ អ្នក ប្រើ កូឌិក ខុស ធម្មតា របស់យើង កម្មវិធី បំលែង កូដ មិន ទទួល ស្គាល់ (កម្រ); យើង នឹង ប្រាប់ អ្នក ថា លើ ការ ផ្ទុក ឡើង ហើយ អ្នក អាច បម្លែង តាមរយៈ ការ បម្លែង អូឌីយ៉ូ ដោយ ឥត គិត ថ្លៃ របស់ យើង.

បាទ, ដែល ជា លំនាំ ផ្ទុក ឡើង ទូទៅ បំផុត សម្រាប់ OGG. Faster Whisper គ្រប់គ្រង ការ ថត ស្អាត, មួយ ៗ រំខាន និង ការ និយាយ accented - អ្នក មិន ចាំបាច់ សម្អាត ឡើង អូឌីយ៉ូ ដំបូង. ប្រសិនបើ ភាព ត្រឹមត្រូវ គឺ មិន មែន អ្វីដែល អ្នក រំពឹង ទុក, រត់ ឯកសារ តាមរយៈ អូឌីយ៉ូ បង្កើន របស់យើង (ដោយ ឥត គិត ថ្លៃ សម្រាប់ មួយ ឆ្លងកាត់) ដើម្បី យក ចេញ សំឡេង ផ្ទៃខាងក្រោយ, បន្ទាប់មក ព្យាយាម សរសេរ ឡើងវិញ.

ការបកប្រែគឺឥតគិតថ្លៃសម្រាប់ឯកសារក្រោម5នាទី។ ផែនការដែលបានបង់ប្រាក់ប្រើ ~ 1,000 តួអក្សរក្នុងមួយនាទីនៃ OGG អូឌីយ៉ូ។ កិច្ចប្រជុំ 60 នាទីបកប្រែសម្រាប់ 60,000 តួអក្សរ; សំបុត្រសំឡេង3នាទីគឺឥតគិតថ្លៃ។ ចំណាំ OGG ជាក់លាក់៖ ប្រសិនបើឯកសាររបស់អ្នកជាញឹកញាប់ស្ងាត់ (ឧទាហរណ៍ការផ្អាកយូរនៅក្នុងការថតសន្និសីទ) អនុញ្ញាតឱ្យការរកឃើញសកម្មភាពសំឡេងដើម្បីរំលងភាពស្ងាត់និងបង់តែសម្រាប់ផ្នែកនៃការនិយាយ។

បាទ. បានផ្ទុកឡើង OGG ឯកសារត្រូវបានដំណើរការនៅលើម៉ាស៊ីនបម្រើ GPU របស់យើងនិងលុបដោយស្វ័យប្រវត្តិក្នុងរយៈពេល2ថ្ងៃ. យើងមិនដែលរក្សាទុកអូឌីយ៉ូរយៈពេលវែង, ម៉ូដែលរថភ្លើងលើទិន្នន័យអ្នកប្រើឬចែករំលែកជាមួយភាគីទីបី. សំបុត្រនេះនៅសល់នៅក្នុងគណនីរបស់អ្នកសម្រាប់រយៈពេលដែលអ្នកចង់វា.

បាទ / ចាស. POST ឯកសារ OGG របស់អ្នកទៅ / api / v1 / transcribe / ជាទិន្នន័យសំណុំបែបបទច្រើនផ្នែកជាមួយឯកសារអូឌីយ៉ូនៅក្នុងវាល `file` ។ ការឆ្លើយតបរួមមាន transcript, កាលបរិច្ឆេទផ្នែក, កាលបរិច្ឆេទកម្រិតពាក្យជាជម្រើសនិង UUID ការងារដែលអ្នកអាចបោះឆ្នោតសម្រាប់ URL នាំចេញ SRT / VTT ។ មាននៅលើផែនការបង់ប្រាក់ទាំងអស់។
5.0/5 (1)

តើ​យើង​អាច​ធ្វើ​អ្វី​បាន​ប្រសើរ​ឡើង & # 160;? មតិ​យោបល់​របស់​អ្នក​ជួយ​យើង​ជួសជុល​បញ្ហា & # 160; ។

បម្លែង​អូឌីយ៉ូ និង​វីដេអូ​ជាមួយ AI

ទទួលបានការបកប្រែត្រឹមត្រូវនៅក្នុង 99 ភាសា. ចុះឈ្មោះដោយឥតគិតថ្លៃនិងទទួលបាន 15,000 តួអក្សរដើម្បីចាប់ផ្តើម.