Report Bug / Feature Request

និយាយ​ទៅ​អត្ថបទ

បម្លែង​អូឌីយ៉ូ និង​វីដេអូ​ទៅ​ជា​អត្ថបទ​ជាមួយ AI ។ គាំទ្រ 99 ភាសា កាលបរិច្ឆេទ និង​ការ​រក​ឃើញ​អ្នក​និយាយ ។

យើង​មិន​មាន​សំឡេង TTS ក្នុង​ភាសា​របស់​អ្នក​នៅ​ឡើយ​ទេ & # 160; ។ ជួយ​យើង​បន្ថែម​របស់​អ្នក & # 160;! លក់​សំឡេង​របស់​អ្នក

ផ្ទុក​អូឌីយ៉ូ ឬ​វីដេអូ​ឡើង

អូស និង​ទម្លាក់​ឯកសារ​របស់​អ្នក​នៅ​ទីនេះ ឬ រកមើល

គាំទ្រ MP3, WAV, FLAC, OGG, M4A, MP4, WebM ។ អតិបរមា 100MB ។

file.mp3

0 MB
— ឬ​ថត​ពី​មីក្រូហ្វូន​របស់​អ្នក —
00:00

ការ​កំណត់​រចនាសម្ព័ន្ធ​

1,000/min តួអក្សរ ចុះឈ្មោះ ប្រើ​ការ​ត្រួតពិនិត្យ​ការ​ប្រើ

បម្លែង​ជា​សំឡេង

ផ្ទុក​ឯកសារ​អូឌីយ៉ូ​ឡើង ហើយ​ចុច បម្លែង​ដើម្បី​ចាប់ផ្ដើម

កំពុង​បម្លែង​អូឌីយ៉ូ... វា​អាច​ចំណាយ​ពេល​បន្តិច & # 160; ។

បាន​រក​ឃើញ:

របៀប​ដែល​វា​ធ្វើការ

១. ផ្ទុក​អូឌីយ៉ូ​ឡើង

ផ្ទុកឡើងឯកសារអូឌីយ៉ូឬវីដេអូរបស់អ្នក. យើងគាំទ្រ MP3, WAV, FLAC, OGG, M4A, MP4, និងទ្រង់ទ្រាយ WebM រហូតដល់ 100MB.

2. AI បម្លែង

ម៉ូដែល AI របស់យើងដំណើរការអូឌីយ៉ូរបស់អ្នក រកឃើញភាសា កំណត់អត្តសញ្ញាណអ្នកនិយាយ និងបង្កើតអត្ថបទត្រឹមត្រូវជាមួយ timestamps ។

3. យក​អត្ថបទ​របស់អ្នក

ចម្លង​ការ​បកប្រែ​របស់​អ្នក ឬ​ទាញយក​វា​ជា​ទ្រង់ទ្រាយ​ចំណង​ជើង​រង TXT ឬ SRT & # 160; ។ កែសម្រួល និង​កែលម្អ​តាម​ដែល​ចាំបាច់ & # 160; ។

ករណី​ប្រើ

និយាយ​ទៅ​អត្ថបទ​សម្រាប់​ឧស្សាហកម្ម និង​លំហូរ​ការងារ​ទាំងអស់

កិច្ចប្រជុំ និង​សន្និសីទ

សរសេរជាអក្សរដោយស្វ័យប្រវត្តិ Zoom, ក្រុម និង Google Meet ការថត។ កុំភ្លេចធាតុសកម្មភាពម្តងទៀត។ នាំចេញជាចំណាំកិច្ចប្រជុំឬចំណងជើងរង។

បទសម្ភាសន៍ & សារព័ត៌មាន

សរសេរ​បទសម្ភាសន៍​សម្រាប់​អត្ថបទ ឯកសារ​ស្រាវជ្រាវ និង​ឯកសារ​ឯកសារ ។ កម្មវិធី​សរសេរ​កំណត់​អត្តសញ្ញាណ​អ្នក​និយាយ​ដែល​បាន​និយាយ​អ្វី​សម្រាប់​ការ​ផ្ទេរ​ភាព​ងាយស្រួល ។

ផតខាស់ និង​មេឌៀ

បង្កើត​អត្ថបទ​បកប្រែ និង​បង្ហាញ​ចំណាំ​សម្រាប់​ផតខាស់​ភាគ ។ បង្កើត​ប័ណ្ណសារ​ដែល​អាច​ស្វែងរក​បាន​នៃ​មាតិកា​អូឌីយ៉ូ​របស់​អ្នក ។ បន្ថែម​ចំណង​ជើង​រង​ទៅ​ផតខាស់​វីដេអូ ។

វគ្គ​បង្រៀន និង​អប់រំ

បម្លែង​ការ​បង្រៀន​ដែល​បាន​ថត​ទៅ​ជា​ចំណាំ​សិក្សា & # 160; ។ ធ្វើ​មាតិកា​អប់រំ​ដែល​អាច​ចូល​ដំណើរការ​បាន​ជាមួយ​ចំណង​ជើង​ត្រឹមត្រូវ & # 160; ។ គាំទ្រ​សិស្ស​ដែល​មាន​បញ្ហា​ស្ដាប់ & # 160; ។

ការ​និយាយ​វេជ្ជសាស្ត្រ

សរសេរសំបុត្រវេជ្ជបណ្ឌិត-អ្នកជំងឺ, ចំណាំវេជ្ជសាស្ត្រនិងវេជ្ជបញ្ជាវេជ្ជសាស្ត្រ. រក្សាទុកម៉ោងនៃឯកសារដោយដៃជាមួយនឹងភាពត្រឹមត្រូវ AI-powered.

នីតិវិធី​ច្បាប់

សរសេរ​ការ​ដាក់​ពាក្យ​បណ្តឹង​, ការ​សួរ​ដេញដោល និង​កិច្ច​ប្រជុំ​អតិថិជន ។ សម្គាល់​ពេលវេលា​ត្រឹមត្រូវ​សម្រាប់​សេចក្ដី​យោង​ច្បាប់ ។ នាំចេញ​ក្នុង​ទ្រង់ទ្រាយ​សមរម្យ​សម្រាប់​ឯកសារ​តុលាការ ។

ការ​ប្រៀបធៀប​ម៉ូដែល STT

Whisper

ម៉ូដែល​ការ​ទទួល​ស្គាល់​ការ​និយាយ​រឹងមាំ​របស់ OpenAI ដែល​គាំទ្រ ៩៩ ភាសា ។

  • 99 ភាសា
  • ការ​បកប្រែ
  • ត្រា​ពេលវេលា
  • រឹងមាំ​ចំពោះ​សំឡេង​រំខាន
OpenAI

Faster Whisper

4x រហ័សជាង Whisper ជាមួយការបង្កើនប្រសិទ្ធិភាព CTranslate2, ភាពត្រឹមត្រូវដូចគ្នា.

  • ឆាប់​ជាង ៤ ដង
  • សតិ​ទាប
  • ទំហំ​ម៉ូដែល​ទាំងអស់
  • ការ​ដំណើរការ​បាច់
  • ការ​ត្រង VAD
SYSTRAN

SenseVoice

ម៉ូដែល​ការ​យល់​ដឹង​នៃ​ការ​និយាយ​ជាមួយ​ការ​រក​ឃើញ​អារម្មណ៍ 50+ ភាសា ។

  • 50+ ភាសា
  • ការ​រក​ឃើញ​អារម្មណ៍
  • ព្រឹត្តិការណ៍​អូឌីយ៉ូ
  • ការ​វិភាគ​អ្នក​និយាយ
  • ទិន្នន័យ​មេតា​សម្បូរបែប
Alibaba (FunAudioLLM)

ផែនការ​និយាយ​ទៅ​អត្ថបទ

ចាប់ផ្តើម​ដោយ​ឥតគិតថ្លៃ ធ្វើ​ឲ្យ​ប្រសើរ​ឡើង​នៅពេល​អ្នក​ត្រូវការ​បន្ថែម

ឥត​គិត​ថ្លៃ
  • ដែន​កំណត់​អូឌីយ៉ូ ១ នាទី
  • ម៉ូដែល Whisper រហ័ស​ជាង
  • បម្លែង​ជា​សំឡេង​មូលដ្ឋាន
  • 100+ ភាសា
ពេញនិយម​បំផុត
គណនី​ឥតគិតថ្លៃ
  • អូឌីយ៉ូ 30 នាទី + 15,000 តួអក្សរ
  • ម៉ូដែល STT ទាំងអស់
  • ត្រា​ពេលវេលា​កម្រិត​ពាក្យ
  • នាំចេញ​ចំណង​ជើង​រង SRT និង VTT
  • ការ​កំណត់​អត្តសញ្ញាណ​អ្នក​និយាយ
ចុះឈ្មោះដោយឥតគិតថ្លៃ
ជំនាញ
  • ឯកសារ​អូឌីយ៉ូ ២ ម៉ោង
  • បម្លែង​ជា​សំឡេង​ជា​បាច់
  • ដំណើរការ​អាទិភាព
  • ការ​ចូលដំណើរការ API
  • វចនានុក្រម​ផ្ទាល់ខ្លួន
ធ្វើ​ឲ្យ​ប្រសើរ

សំណួរ​ដែល​សួរ​ញឹកញាប់

និយាយទៅអត្ថបទ (STT) ដែលត្រូវបានគេហៅថាការទទួលស្គាល់ការនិយាយដោយស្វ័យប្រវត្តិ (ASR) បម្លែងភាសានិយាយទៅជាអត្ថបទសរសេរ។ ម៉ូដែលរបស់យើងប្រើ AI ដើម្បីបកប្រែអូឌីយ៉ូពីកិច្ចប្រជុំការសម្ភាសន៍ផតខាស់ការបង្រៀននិងច្រើនទៀត។

Faster Whisper ត្រូវ​បាន​ផ្ដល់​អនុសាសន៍​សម្រាប់​ករណី​ប្រើ​ច្រើន​បំផុត - វា​គឺ 4x រហ័ស​ជាង Whisper ដើម ខណៈ​ពេល​ដែល​រក្សា​ភាព​ត្រឹមត្រូវ​ដូចគ្នា ។ ប្រើ SenseVoice ប្រសិន​បើ​អ្នក​ត្រូវការ​ការ​រក​ឃើញ​អារម្មណ៍ ឬ​ការ​រក​ឃើញ​ព្រឹត្តិការណ៍​អូឌីយ៉ូ​នៅ​ក្បែរ​ការ​បកប្រែ ។

យើងគាំទ្រ MP3, WAV, M4A, OGG, FLAC, WEBM, និងទ្រង់ទ្រាយអូឌីយ៉ូ / វីដេអូទូទៅបំផុត. ទំហំឯកសារអតិបរមាគឺ 50MB. សម្រាប់ឯកសារធំជាងនេះ, ពិចារណាចែកអូឌីយ៉ូដំបូង.

អ្នកប្រើឥតគិតថ្លៃអាចបម្លែងរហូតដល់ទៅ5នាទីនៃអូឌីយ៉ូ. ផែនការដែលបានបង់គាំទ្រឯកសារអូឌីយ៉ូរហូតដល់ទៅ2ម៉ោង. សម្រាប់ការថតយូរ, ប្រើ API របស់យើងជាមួយនឹងការដំណើរការ batch.

ម៉ូដែលរបស់យើងសម្រេចបាន 95% + ភាពត្រឹមត្រូវលើការនិយាយភាសាអង់គ្លេសច្បាស់លាស់. ភាពត្រឹមត្រូវប្រែប្រួលដោយភាសា, គុណភាពអូឌីយ៉ូ, និងសំឡេងរំខានផ្ទៃខាងក្រោយ. សម្លេងលាន់លឺលឿនជាងមុននិងសម្លេងលាន់លឺគាំទ្រ 99 ភាសាជាមួយនឹងកម្រិតភាពត្រឹមត្រូវខុសគ្នា.

បាទ, របៀបបកប្រែកម្រិតខ្ពស់របស់យើងអាចកំណត់អត្តសញ្ញាណនិងដាក់ស្លាកអ្នកនិយាយផ្សេងគ្នានៅក្នុងអូឌីយ៉ូ។ ការបកប្រែអ្នកនិយាយគឺមានប្រយោជន៍ជាពិសេសសម្រាប់ការបកប្រែសន្និសីទការសម្ភាសន៍និងផតខាស់មនុស្សច្រើនកន្លែងដែលអ្នកត្រូវការដឹងថានរណាបាននិយាយអ្វី។

ការបកប្រែស្ទ្រីមពេលវេលាពិតប្រាកដគឺអាចរកបានតាមរយៈ API របស់យើងដោយប្រើ Faster Whisper ។ អូឌីយ៉ូត្រូវបានដំណើរការក្នុង chunks ខណៈពេលដែលវាមកដល់ ការផ្គត់ផ្គង់ការបកប្រែផ្នែកមួយជាមួយ latency ទាប ។ នេះគឺល្អឥតខ្ចោះសម្រាប់ចំណងជើងផ្ទាល់និងពេលវេលាពិតប្រាកដការយកចំណាំ។

បាទ / ចាស, លទ្ធផលនៃការបកប្រែរបស់យើងរួមបញ្ចូលទាំងសញ្ញាពេលវេលាកម្រិតពាក្យដែលអាចត្រូវបាននាំចេញជា SRT, VTT, ឬឯកសារចំណងជើងរង ASS. នេះគឺល្អឥតខ្ចោះសម្រាប់បន្ថែមចំណងជើងទៅវីដេអូ YouTube, វគ្គសិក្សាលើបណ្តាញ, និងមាតិកាប្រព័ន្ធផ្សព្វផ្សាយសង្គម.

បាទ/ ចាស លទ្ធផល​បម្លែង​ទាំងអស់​រួម​បញ្ចូល​ត្រា​ពេលវេលា​កម្រិត​ចម្រៀក​តាម​លំនាំដើម & # 160; ។ ត្រា​ពេលវេលា​កម្រិត​ពាក្យ​ក៏​អាច​ប្រើ​បាន​ដែរ បង្ហាញ​ពេលវេលា​ចាប់ផ្ដើម និង​បញ្ចប់​ជាក់លាក់​សម្រាប់​ពាក្យ​នីមួយៗ​ក្នុង​អូឌីយ៉ូ & # 160; ។

Faster Whisper ត្រូវ​បាន​ហ្វឹកហាត់​លើ​អូឌីយ៉ូ​ចម្រុះ និង​ដោះស្រាយ​សំឡេង​ផ្ទៃ​ខាង​ក្រោយ​មធ្យម​យ៉ាង​ល្អ & # 160; ។ សម្រាប់​ការ​ថត​សំឡេង​ខ្លាំង​ណាស់ យើង​ផ្ដល់​អនុសាសន៍​ឲ្យ​រត់​អូឌីយ៉ូ​តាម​រយៈ​កម្មវិធី​បង្កើន​សំឡេង​របស់​យើង​ដំបូង​ដើម្បី​បង្កើន​ភាព​ច្បាស់​មុន​ពេល​បម្លែង & # 160; ។

បាទ/ ចាស ឯកសារ​អូឌីយ៉ូ​ដែល​បាន​ផ្ទុក​ឡើង​ត្រូវ​បាន​ដំណើរការ​លើ​ម៉ាស៊ីន​បម្រើ GPU ដែល​មាន​សុវត្ថិភាព​របស់​យើង ហើយ​ត្រូវ​បាន​លុប​ដោយ​ស្វ័យ​ប្រវត្តិ​បន្ទាប់​ពី​ការ​បកប្រែ​បាន​បញ្ចប់ & # 160; ។ យើង​មិន​រក្សា​ទុក ចែក​រំលែក ឬ​ប្រើ​អូឌីយ៉ូ​របស់​អ្នក​សម្រាប់​គោលបំណង​បង្ហាត់ & # 160; ។ ការ​ផ្ទេរ​ទាំងអស់​ត្រូវ​បាន​អ៊ិនគ្រីប & # 160; ។

អ្នកប្រើឥតគិតថ្លៃអាចសរសេរឡើងទៅ5នាទីនៃអូឌីយ៉ូដោយគ្មានការចំណាយ. ផែនការដែលបានបង់ប្រើតួអក្សរផ្អែកលើរយៈពេលអូឌីយ៉ូ: ប្រហែល 1,000 តួអក្សរក្នុងមួយនាទីនៃអូឌីយ៉ូ. ពិនិត្យមើលទំព័រតម្លៃរបស់យើងសម្រាប់ព័ត៌មានលម្អិតផែនការនិងកញ្ចប់តួអក្សរ.
5.0/5 (1)

តើ​យើង​អាច​ធ្វើ​អ្វី​បាន​ប្រសើរ​ឡើង & # 160;? មតិ​យោបល់​របស់​អ្នក​ជួយ​យើង​ជួសជុល​បញ្ហា & # 160; ។

បម្លែង​អូឌីយ៉ូ​ជាមួយ AI

ទទួលបានការបកប្រែត្រឹមត្រូវនៅក្នុង 99 ភាសា. ចុះឈ្មោះដោយឥតគិតថ្លៃនិងទទួលបាន 15,000 តួអក្សរដើម្បីចាប់ផ្តើម.