សេវា​បម្លែង​ជា​សំឡេង AI

បម្លែងការនិយាយទៅជាអត្ថបទជាមួយនឹងភាពត្រឹមត្រូវដែលឈានមុខគេនៅក្នុងឧស្សាហកម្ម។ សរសេរកិច្ចប្រជុំការសម្ភាសន៍ការបង្រៀនផតខាស់ការបញ្ជាវេជ្ជសាស្ត្រនិងនីតិវិធីច្បាប់ក្នុងភាសា 99 ។ ដំណើរការដោយ Faster Whisper (4x រហ័សជាង OpenAI Whisper) និង SenseVoice ជាមួយនឹងការរកឃើញអារម្មណ៍។

កិច្ចប្រជុំ បទសម្ភាសន៍ វេជ្ជសាស្ត្រ ច្បាប់ ភាសា

ព្យាយាម​បម្លែង​ជា​សំឡេង

អូស និង​ទម្លាក់​ឯកសារ​របស់​អ្នក​នៅ​ទីនេះ ឬ រកមើល

MP3, WAV, FLAC, OGG, M4A, MP4. Max 50MB.

file.mp3

0 MB
កំពុង​បម្លែង​ជា​សំឡេង...

កំពុង​បម្លែង​អូឌីយ៉ូ...

បាន​បម្លែង​ជា​សំឡេង

លក្ខណៈ​ពិសេស​បម្លែង AI

ការ​និយាយ​ទៅ​អត្ថបទ​ដែល​ត្រឹមត្រូវ រហ័ស និង​មាន​តម្លៃ​សមរម្យ​សម្រាប់​ករណី​ប្រើ​នីមួយៗ

ការ​គាំទ្រ​ភាសា 99

បកប្រែ​អូឌីយ៉ូ​ក្នុង​ភាសា ៩៩ ជាមួយ Whisper និង Faster Whisper ។ ការ​បកប្រែ​ទៅ​ជា​ភាសា​អង់គ្លេស​រួម​បញ្ចូល​សម្រាប់​លំហូរ​ការងារ​ភាសា​ចម្រុះ ។

ដំណើរការ​លឿន​ជាង​មុន ៤ ដង

Faster Whisper ផ្ដល់​ភាព​ត្រឹមត្រូវ​ដូចគ្នា​នឹង OpenAI Whisper នៅ​ល្បឿន 4x និង​ការ​ប្រើ​សតិ​ទាប ។

ត្រា​ពេលវេលា និង​ចម្រៀក

ត្រា​ពេលវេលា​កម្រិត​ពាក្យ និង​កម្រិត​ចម្រៀក​សម្រាប់​សេចក្ដី​យោង​ជាក់លាក់ & # 160; ។ នាំចេញ​អត្ថបទ​ដែល​មាន​ត្រា​ពេលវេលា​សម្រាប់​ចំណង​ជើង​រង​វីដេអូ & # 160; ។

ការ​រក​ឃើញ​អារម្មណ៍

SenseVoice រក​ឃើញ​អារម្មណ៍​អ្នក​និយាយ ព្រឹត្តិការណ៍​អូឌីយ៉ូ និង​អារម្មណ៍​នៅ​ក្បែរ​ការ​បកប្រែ​សម្រាប់​ទិន្នន័យ​មេតា​សម្បូរ​បែប ។

ការ​កំណត់​អត្តសញ្ញាណ​អ្នក​និយាយ

ស្លាក​ការ​សរសេរ​កំណត់ហេតុ​របស់​អ្នក​និយាយ​ដែល​បាន​និយាយ​អ្វី​ខ្លះ​ក្នុង​ការ​ថត​អ្នក​ចូលរួម​ច្រើន​ដូច​ជា​កិច្ច​ប្រជុំ និង​ការ​សម្ភាសន៍ & # 160; ។

ទ្រង់ទ្រាយ​នាំចេញ​ច្រើន

នាំចេញ​ជា​អត្ថបទ​ធម្មតា ចំណង​ជើង​រង SRT ចំណង​ជើង VTT ឬ JSON ជាមួយ​ទិន្នន័យ​មេតា​ពេញលេញ & # 160; ។ រួចរាល់​សម្រាប់​វេទិកា​ណាមួយ & # 160; ។

ម៉ូដែល​និយាយ​ទៅ​អត្ថបទ

ម៉ាស៊ីន​បម្លែង​ដែល​នាំមុខ​ឧស្សាហកម្ម

Faster WhisperFaster Whisper

4x faster than Whisper with CTranslate2 optimization, same accuracy.

/5

ល្អបំផុត​សម្រាប់ & # 160; ៖ ល្អបំផុតទាំងមូល - 4x រហ័សជាង Whisper, ភាពត្រឹមត្រូវដូចគ្នា, ផ្ដល់អនុសាសន៍សម្រាប់ករណីប្រើភាគច្រើន

ព្យាយាម Faster Whisper

WhisperWhisper

OpenAI's robust speech recognition model supporting 99 languages.

/5

ល្អបំផុត​សម្រាប់ & # 160; ៖ ម៉ូដែល​យោង​ដោយ OpenAI ជាមួយ​ការ​គាំទ្រ​ភាសា 99 ដ៏​រឹងមាំ និង​ការ​បកប្រែ

ព្យាយាម Whisper

SenseVoiceSenseVoice

Speech understanding model with emotion detection, 50+ languages.

/5

ល្អបំផុត​សម្រាប់ & # 160; ៖ ការ​រក​ឃើញ​អារម្មណ៍ និង​ការ​វិភាគ​ព្រឹត្តិការណ៍​អូឌីយ៉ូ​នៅ​ក្បែរ​ការ​បកប្រែ

ព្យាយាម SenseVoice

របៀប​បម្លែង​អូឌីយ៉ូ​ជាមួយ AI

ផ្ទុក​ឡើង បម្លែង និង​នាំចេញ​ក្នុង​មួយ​វិនាទី

1

ផ្ទុក​អូឌីយ៉ូ ឬ​វីដេអូ​ឡើង

ផ្ទុកឡើង MP3, WAV, M4A, OGG, FLAC ឬឯកសារវីដេអូរហូតដល់ 50MB ។ គាំទ្រទ្រង់ទ្រាយទូទៅទាំងអស់ ។

2

ជ្រើស​ម៉ូដែល និង​ភាសា

ជ្រើស Faster Whisper សម្រាប់​ល្បឿន Whisper សម្រាប់​ការ​បកប្រែ ឬ SenseVoice សម្រាប់​ការ​រក​ឃើញ​អារម្មណ៍ & # 160; ។ ជ្រើស​ភាសា​ប្រភព & # 160; ។

3

បម្លែង​ជា​សំឡេង

ការ​ដំណើរការ​ចំណាយ​ពេល​ពី​វិនាទី​ទៅ​នាទី​អាស្រ័យ​លើ​ប្រវែង​ឯកសារ & # 160; ។ ការ​ធ្វើ​ឲ្យ​ទាន់​សម័យ​វឌ្ឍនភាព​ពេលវេលា​ពិត & # 160; ។

4

ពិនិត្យ​ឡើងវិញ និង​នាំចេញ

ពិនិត្យ​មើល​ការ​បកប្រែ​ កែសម្រួល​បើ​ចាំបាច់ និង​នាំចេញ​ជា​អត្ថបទ SRT VTT ឬ JSON ជាមួយ​នឹង​ត្រា​ពេលវេលា ។

ការ​បកប្រែ​សម្រាប់​ឧស្សាហកម្ម​នីមួយៗ

លំហូរ​ការងារ​ដែល​បាន​បង្កើត​សម្រាប់​អ្នក​ជំនាញ

កិច្ចប្រជុំ​អាជីវកម្មName

ថតចម្លងការថត Zoom, ក្រុមនិង Google Meet ដោយស្វ័យប្រវត្តិ។ ទទួលបានចំណាំសន្និសីទត្រឹមត្រូវជាមួយនឹងការកំណត់អត្តសញ្ញាណអ្នកនិយាយ, ត្រាពេលវេលានិងធាតុសកម្មភាព។ ដំណើរការថតពីវេទិកាសន្និសីទណាមួយ - គ្រាន់តែផ្ទុកឡើងឯកសារអូឌីយ៉ូឬវីដេអូ។

  • ការ​កំណត់​អត្តសញ្ញាណ​អ្នក​និយាយ​សម្រាប់​ការ​ហៅ​អ្នក​ចូលរួម​ច្រើន
  • ចំណាំ​ត្រា​ពេលវេលា​សម្រាប់​យោង
  • គាំទ្រ​ទ្រង់ទ្រាយ​ថត​កិច្ចប្រជុំ​ទាំងអស់
  • ការ​ដំណើរការ​ជា​ច្រើន​សម្រាប់​ប័ណ្ណសារ​កិច្ចប្រជុំ

កាសែត និង បទសម្ភាសន៍

ចម្លងសម្ភាសន៍, សន្និសីទកាសែតនិងការថតចម្លងជាមួយ 95% + ភាពត្រឹមត្រូវ។ Faster Whisper ដោះស្រាយបរិស្ថានដែលមានសំឡេងរំខាននិងអ្នកនិយាយច្រើន។ ទទួលបាន timestamps កម្រិតពាក្យសម្រាប់ការផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវនិងការផ្ទៀងផ្ទាត់ការពិត។

  • ត្រា​ពេលវេលា​កម្រិត​ពាក្យ​សម្រាប់​ដកស្រង់
  • បម្លែង​សំឡេង​រំខាន​រឹងមាំ
  • ការគាំទ្រ 99 ភាសាសម្រាប់របាយការណ៍អន្តរជាតិ
  • ការ​បកប្រែ​ទៅ​ជា​ភាសា​អង់គ្លេស​រួម​បញ្ចូល

ការ​បកប្រែ​វេជ្ជសាស្ត្រ

សរសេរ​ពាក្យ​បញ្ជា​វេជ្ជសាស្ត្រ ការ​ពិគ្រោះ​យោបល់​ជាមួយ​អ្នក​ជំងឺ និង​ចំណាំ​វេជ្ជសាស្ត្រ ។ គ្រប់គ្រង​ពាក្យ​វេជ្ជសាស្ត្រ​ដោយ​មាន​ភាព​ត្រឹមត្រូវ​ខ្ពស់​តាម​រយៈ​ម៉ូដែល​ដែល​មាន​មូលដ្ឋាន​លើ​ការ​ស្រែក ។ ដំណើរការ​ចំណាំ SOAP របាយការណ៍​វះកាត់ និង​ការ​រៀបរាប់​ប្រវត្តិ​របស់​អ្នក​ជំងឺ​ពី​ការ​ថត​សំឡេង ។

  • ការ​ដោះស្រាយ​ពាក្យ​វេជ្ជសាស្ត្រ
  • ការ​ធ្វើ​ទ្រង់ទ្រាយ​ចំណាំ SOAP
  • ការ​ដំណើរការ​ដែល​ដឹង​ពី HIPAA
  • លំហូ​ការងារ​ការ​និយាយ​ទៅ​អត្ថបទ

ការ​បកប្រែ​ច្បាប់

ចម្លងបទសម្ភាសន៍, នីតិវិធីតុលាការ, កិច្ចប្រជុំអតិថិជននិងការ dictation ច្បាប់. ទទួលបានចម្លងត្រឹមត្រូវជាមួយនឹងស្លាកអធិបតីនិង timestamps សម្រាប់ឯកសារករណី. ម៉ូដែលរបស់យើងគ្រប់គ្រងពាក្យគន្លឹះច្បាប់និងលំនាំភាសាផ្លូវការ.

  • អត្ថបទ​ដែល​មាន​ស្លាក​អ្នក​និយាយ
  • ភាព​ត្រឹមត្រូវ​នៃ​ពាក្យ​ច្បាប់
  • សម្គាល់​ពេលវេលា​សម្រាប់​យោង
  • ដំណើរការ​ដាក់​ធុង​ធំ

វិទ្យាសាស្ត្រ និង​ការ​ស្រាវជ្រាវ

បង្កើតប័ណ្ណសារដែលអាចស្វែងរកបាននៃមាតិកាអប់រំ។ SenseVoice បន្ថែមការរកឃើញអារម្មណ៍និងអារម្មណ៍សម្រាប់ការវិភាគស្រាវជ្រាវគុណភាព។

  • ការ​បកប្រែ​ការ​បង្រៀន និង​សិក្ខាសាលា
  • ដំណើរការ​សម្ភាសន៍​ស្រាវជ្រាវ
  • ការ​រក​ឃើញ​អារម្មណ៍​សម្រាប់​ការ​ស្រាវជ្រាវ​គុណភាព
  • មាតិកា​អប់រំ​ជា​ច្រើន​ភាសា

មេឌៀ និង​មាតិកា

បង្កើត​ចំណង​ជើង​រង និង​ចំណង​ជើង​សម្រាប់​វីដេអូ បម្លែង​រឿង​ផតខាស់​សម្រាប់​បង្ហាញ​ចំណាំ និង​បង្កើត​អត្ថបទ​ដែល​អាច​ស្វែងរក​បាន​ពី​ប័ណ្ណសារ​អូឌីយ៉ូ ។ នាំចេញ​ជា SRT VTT ឬ​ទ្រង់ទ្រាយ​អត្ថបទ​ធម្មតា​សម្រាប់​វេទិកា​ណាមួយ ។

  • នាំចេញ​ចំណង​ជើង​រង SRT/ VTT
  • ការ​បង្កើត​ចំណាំ​បង្ហាញ​ផតខាស់
  • ចំណងជើងវីដេអូសម្រាប់ YouTube / TikTok
  • ការ​ឌីជីថល​ប័ណ្ណសារ​អូឌីយ៉ូ

ការ​ប្រៀបធៀប​ម៉ាស៊ីន​បម្លែង​ជា​អក្សរ

ជ្រើស​ម៉ូដែល​ត្រឹមត្រូវ​សម្រាប់​តម្រូវការ​របស់​អ្នក

ម៉ូដែល ល្បឿន ភាសា លក្ខណៈ​ពិសេស​ពិសេស ល្អបំផុត​សម្រាប់
Faster Whisper រហ័ស​ជាង ៤x 99 ការ​ត្រង VAD ការ​ដំណើរការ​បាច់ ករណី​ប្រើ​ច្រើន​បំផុត (បាន​ផ្ដល់​អនុសាសន៍)
Whisper លំនាំដើម 99 ការ​បកប្រែ​ទៅ​ជា​ភាសា​អង់គ្លេស សម័យ ភារកិច្ច​បកប្រែ ភាព​ត្រឹមត្រូវ​យោង
SenseVoice ថេរ 50+ ការ​រក​ឃើញ​អារម្មណ៍ ព្រឹត្តិការណ៍​អូឌីយ៉ូ ការ​វិភាគ​អ្នក​និយាយ ការ​ស្រាវជ្រាវ ការ​វិភាគ​អារម្មណ៍

ភាព​ត្រឹមត្រូវ និង​ការ​ប្រតិបត្តិ​ការ​បកប្រែ

95%+

ភាព​ត្រឹមត្រូវ​ភាសា​អង់គ្លេស

99

ភាសា​ដែល​គាំទ្រ

4x

រហ័ស​ជាង​សម្លេង​ខ្សឹប

2hr

ប្រវែង​អូឌីយ៉ូ​អតិបរមា

API បកប្រែ

បញ្ចូល​ការ​បកប្រែ​ទៅ​ក្នុង​កម្មវិធី​របស់​អ្នក

Python (បម្លែង​ឯកសារ​អូឌីយ៉ូ) REST API
import requests

with open("meeting_recording.mp3", "rb") as f:
    response = requests.post("https://api.tts.ai/v1/stt", files={
        "audio": f
    }, data={
        "model": "faster-whisper",
        "language": "en",
        "timestamps": "true"
    }, headers={"Authorization": "Bearer YOUR_API_KEY"})

result = response.json()
print(result["text"])       # Full transcription
print(result["segments"])   # Timestamped segments

សំណួរ​ដែល​សួរ​ញឹកញាប់

សំណួរ​ទូទៅ​អំពី​ការ​បម្លែង AI

ម៉ូដែលរបស់យើងសម្រេចបាន 95% + ភាពត្រឹមត្រូវលើការនិយាយភាសាអង់គ្លេសច្បាស់លាស់. ភាពត្រឹមត្រូវប្រែប្រួលដោយភាសា, គុណភាពអូឌីយ៉ូ, និងសំឡេងរំខានផ្ទៃខាងក្រោយ. Faster Whisper និង Whisper ត្រូវបានបណ្តុះបណ្តាលលើ 680,000 ម៉ោងនៃទិន្នន័យនិងជិតស្និទ្ធភាពកម្រិតមនុស្សលើការថតសម្អាត.

អ្នកប្រើឥតគិតថ្លៃអាចបម្លែងរហូតដល់5នាទី។ ផែនការដែលបានបង់ប្រាក់គាំទ្ររហូតដល់2ម៉ោងក្នុងមួយឯកសារ។ សម្រាប់ការថតចម្លងយូរ API គាំទ្រការដំណើរការបាច់ដែលអ្នកអាចបំបែកនិងដំណើរការឯកសារដោយកម្មវិធី។

បាទ/ ចាស & # 160; ។ ការ​កំណត់​អត្តសញ្ញាណ​អ្នក​និយាយ និង​ដាក់​ស្លាក​អ្នក​និយាយ​ផ្សេង​គ្នា​ក្នុង​អត្ថបទ​សំឡេង & # 160; ។ វា​ដំណើរការ​ល្អ​បំផុត​ជាមួយ​អូឌីយ៉ូ​ច្បាស់​ដែល​អ្នក​និយាយ​ធ្វើ​ការ​ផ្លាស់ប្ដូរ & # 160; ។ ការ​និយាយ​ដែល​ស្រប​គ្នា​អាច​កាត់​បន្ថយ​ភាព​ត្រឹមត្រូវ & # 160; ។

Whisper-based models handle specialized terminology well because they are trained on diverse data. For critical medical or legal transcription, we recommend reviewing the output for accuracy as no automated system is 100% accurate with specialized terms.

បាទ/ ចាស & # 160; ។ នាំចេញ​ការ​បកប្រែ​ជា​ឯកសារ​ចំណង​ជើង​រង SRT ឬ VTT ដែល​មាន​ត្រា​ពេលវេលា​ត្រឹមត្រូវ & # 160; ។ ឯកសារ​ទាំងនេះ​អាច​ត្រូវ​បាន​ផ្ទុក​ឡើង​ដោយ​ផ្ទាល់​ទៅ​កាន់ YouTube Vimeo ឬ​វេទិកា​វីដេអូ​ណាមួយ​ដែល​គាំទ្រ​ទ្រង់ទ្រាយ​ចំណង​ជើង​រង​ស្តង់ដារ & # 160; ។

បាទ / ចាស. REST API របស់យើងគាំទ្រការបកប្រែ batch, ស្ទ្រីមពេលវេលាពិតប្រាកដ, និងការជូនដំណឹង webhook. ផ្ញើឯកសារអូឌីយ៉ូទៅ / v1 / stt ចំណុចបញ្ចប់និងទទួលអត្ថបទបកប្រែជាមួយ timestamps. សូមមើលឯកសារ API សម្រាប់ឧទាហរណ៍នៅក្នុង Python, JavaScript, និង cURL.

SenseVoice ដោយ Alibaba លើសពីការបកប្រែ - វារកឃើញអារម្មណ៍របស់អ្នកនិយាយ (សប្បាយរីករាយ, សោកស្តាយ, ខឹង), ព្រឹត្តិការណ៍អូឌីយ៉ូ (ខឹង, សំឡេងរំជួលចិត្ត, តន្ត្រី) និងផ្តល់ទិន្នន័យមេតាសម្បូរបែបអំពីមាតិកាអូឌីយ៉ូ. វាគាំទ្រ 50 + ភាសា. ប្រើវានៅពេលអ្នកត្រូវការច្រើនជាងគ្រាន់តែអត្ថបទ.

ម៉ូដែល​ដែល​មាន​មូលដ្ឋាន​លើ​សម្លេង​ខ្សឹប​ត្រូវ​បាន​ហ្វឹកហាត់​លើ​លក្ខខណ្ឌ​អូឌីយ៉ូ​ផ្សេងៗ​គ្នា និង​ដោះស្រាយ​សំឡេង​រំខាន​ផ្ទៃ​ខាងក្រោយ​មធ្យម​បាន​យ៉ាង​ល្អ & # 160; ។ សម្រាប់​លទ្ធផល​ល្អ​បំផុត ប្រើ​ទំហំ​ម៉ូដែល​ធំ និង​ពិចារណា​រត់​អូឌីយ៉ូ​តាមរយៈ​ឧបករណ៍​បង្កើន​សំឡេង​របស់​យើង​ដំបូង​ដើម្បី​កាត់បន្ថយ​សំឡេង​រំខាន​មុន​ពេល​បម្លែង & # 160; ។

API គាំទ្រ​ការ​បម្លែង​ស្ទ្រីម​សម្រាប់​ករណី​ប្រើ​ពេល​វេលា​ពិត​ប្រាកដ​ជិត​បំផុត & # 160; ។ ផ្ញើ​អាល់ប៊ុម​អូឌីយ៉ូ​ដែល​ពួក​វា​ត្រូវ​បាន​ថត និង​ទទួល​លទ្ធផល​បម្លែង​ជា​លំដាប់ & # 160; ។ វា​ដំណើរការ​ល្អ​សម្រាប់​ចំណង​ជើង​ផ្ទាល់ ចំណាំ​កិច្ចប្រជុំ និង​កម្មវិធី​មធ្យោបាយ​ងាយស្រួល & # 160; ។

បាទ/ ចាស & # 160; ។ Whisper និង Faster Whisper រួម​បញ្ចូល​របៀប​បកប្រែ​ដែល​បាន​បង្កប់​ដែល​បម្លែង​អូឌីយ៉ូ​ក្នុង​ភាសា​ដែល​បាន​គាំទ្រ​ចំនួន 99 និង​បង្ហាញ​អត្ថបទ​ជា​ភាសា​អង់គ្លេស & # 160; ។ នេះ​មាន​ប្រយោជន៍​សម្រាប់​យល់​ពី​មាតិកា​ភាសា​បរទេស​ដោយ​គ្មាន​ជំហាន​បកប្រែ​ដាច់​ដោយ​ឡែក & # 160; ។

ប្រើ​ទំហំ​ម៉ូដែល​ធំ​បំផុត​ដែល​អាច​ប្រើ​បាន​សម្រាប់​ភាព​ត្រឹមត្រូវ​ល្អ​បំផុត & # 160; ។ ផ្ដល់​នូវ​អូឌីយ៉ូ​មាន​គុណភាព​ខ្ពស់ និង​ស្អាត​គ្រប់​ពេល​ដែល​អាច​ធ្វើ​ទៅ​បាន & # 160; ។ សម្រាប់​លក្ខខណ្ឌ​ពិសេស​ដែល​កើតឡើង​ដដែលៗ អ្នក​អាច​ដំណើរការ​ក្រោយ​ការ​បកប្រែ​ដោយ​ប្រើ​ការ​ស្វែងរក និង​ជំនួស​ដើម្បី​កែ​ការ​ទទួល​ស្គាល់​ខុស​ដែន​ជាក់លាក់​ទូទៅ & # 160; ។

អ្នក​អាច​ផ្ទុក​ឡើង​ឯកសារ​វីដេអូ MP4, MOV, AVI, MKV និង WebM & # 160; ។ ប្រព័ន្ធ​ស្រង់​បទ​អូឌីយ៉ូ​ចេញ​ដោយ​ស្វ័យ​ប្រវត្តិ​សម្រាប់​ការ​បកប្រែ & # 160; ។ នេះ​ធ្វើ​ឲ្យ​វា​ងាយស្រួល​ក្នុងការ​បង្កើត​ចំណង​ជើង​រង ឬ​ការ​បកប្រែ​ដោយ​ផ្ទាល់​ពី​មាតិកា​វីដេអូ​ដោយ​គ្មាន​ការ​ស្រង់​អូឌីយ៉ូ​ដោយ​ដៃ & # 160; ។
5.0/5 (1)

តើ​យើង​អាច​ធ្វើ​អ្វី​បាន​ប្រសើរ​ឡើង & # 160;? មតិ​យោបល់​របស់​អ្នក​ជួយ​យើង​ជួសជុល​បញ្ហា & # 160; ។

រួចរាល់​ហើយ​ដើម្បី​បម្លែង​ជា​សំឡេង & # 160;?

ចាប់ផ្តើមបកប្រែដោយឥតគិតថ្លៃ. 99 ភាសា, 95% + ភាពត្រឹមត្រូវ, លទ្ធផលភ្លាមៗ. គ្មានកាតឥណទានចាំបាច់.