Report Bug / Feature Request

ភ្នាក់ងារ​សំឡេង AI - ស្ថាបនា​អ្នក​ជំនួយការ​ AI និយាយ

ស្ថាបនាភ្នាក់ងារសំឡេងឆ្លាតវៃជាមួយ persona ផ្ទាល់ខ្លួន។ ដំឡើងសម្រាប់ការគាំទ្រអតិថិជនការទទួលការបង្រៀននិងច្រើនទៀត។

យើង​មិន​មាន​សំឡេង TTS ក្នុង​ភាសា​របស់​អ្នក​នៅ​ឡើយ​ទេ & # 160; ។ ជួយ​យើង​បន្ថែម​របស់​អ្នក & # 160;! លក់​សំឡេង​របស់​អ្នក

កម្មវិធី​បង្កើត​ភ្នាក់ងារ

ពិពណ៌នា​តួនាទី​របស់​ភ្នាក់ងារ បុគ្គលិកលក្ខណៈ ដែន​ចំណេះដឹង និង​ច្បាប់​ការ​សន្ទនា & # 160; ។

ការ​កំណត់​រចនាសម្ព័ន្ធ​

របៀប​ដែល​ភ្នាក់ងារ​សំឡេង​ធ្វើការ

1. អ្នកនិយាយ

និយាយ​ទៅ​ភ្នាក់ងារ​របស់​អ្នក​ដោយ​ធម្មជាតិ & # 160; ។ ការ​និយាយ​របស់​អ្នក​ត្រូវ​បាន​ចាប់​យក និង​ស្ទ្រីម​ក្នុង​ពេល​ពិត & # 160; ។

2. STT បកប្រែ

Whisper បម្លែង​ការ​និយាយ​របស់​អ្នក​ទៅ​អត្ថបទ​យ៉ាង​ត្រឹមត្រូវ​តាម​រយៈ 99 ភាសា ។

3. ដំណើរការ LLM

ភ្នាក់ងារ​ LLM ខួរក្បាល​ដំណើរការ​បញ្ចូល​របស់អ្នក​ដោយប្រើ​ persona និង​ប្រព័ន្ធ​របស់​វា​ ។

4. ឆ្លើយតប TTS

ការ​ឆ្លើយតប​ត្រូវ​បាន​បម្លែង​ទៅ​ជា​ការ​និយាយ​ធម្មតា​ដោយ​ប្រើ​សំឡេង និង​ម៉ូដែល​ដែល​បាន​ជ្រើស​របស់​អ្នក & # 160; ។

ប្រភេទ​ភ្នាក់ងារ

ពុម្ព​ភ្នាក់ងារ​ដែល​បាន​សាងសង់​ជាមុន​សម្រាប់​ឧស្សាហកម្ម​នីមួយៗ និង​ករណី​ប្រើ

មុខ​អតិថិជន

ការ​អប់រំ និង​ការ​បណ្តុះបណ្តាល

ភាព​ច្នៃប្រឌិត និង​កម្សាន្ត

អាជីវកម្ម និង​ខាង​ក្នុង

ផ្ទាល់ខ្លួន

ហេតុអ្វី​បាន​ជា​ភ្នាក់ងារ​សំឡេង?

ភ្នាក់ងារ​សំឡេង​ដែល​មាន​ថាមពល AI ដែល​ធ្វើ​មាត្រដ្ឋាន​តាម​តម្រូវការ​របស់​អ្នក

24/7 ភាពអាចរកបាន

ភ្នាក់ងារ​សំឡេង​មិន​ដែល​គេង​ឡើយ ។ ដោះស្រាយ​ការ​ហៅ និង​ការ​សន្ទនា​ជុំវិញ​នាឡិកា​ដោយ​គ្មាន​បុគ្គលិក​លើស​ពី​ក្បាល ។

ភាសា​ច្រើន

គាំទ្រអតិថិជននៅក្នុង 30 + ភាសាជាមួយនឹងសំឡេងធម្មជាតិ. គ្មានតម្រូវការសម្រាប់បុគ្គលិកភាសាច្រើន.

ផ្ទាល់ខ្លួន

កំណត់បុគ្គលិកលក្ខណៈរបស់ភ្នាក់ងាររបស់អ្នក, សំឡេង, និងជំនាញ. ភ្នាក់ងារនីមួយៗមានអារម្មណ៍ថាមានតែមួយគត់និងនៅលើម៉ាក.

ពន្យារ​ទាប

ពេលវេលាឆ្លើយតបក្រោមវិនាទីត្រូវបានផ្គត់ផ្គង់ដោយបំពង់ STT, LLM និង TTS ដែលបានធ្វើបច្ចុប្បន្នភាពលើ GPUs ដែលបានបម្រុងទុក។

សំណួរ​ដែល​សួរ​ញឹកញាប់

ភ្នាក់ងារសំឡេង AI គឺជាប្រព័ន្ធ AI នៃការសន្ទនាដែលរួមបញ្ចូលគ្នានៃការទទួលស្គាល់ការនិយាយ (STT), គំរូភាសា (LLM) និងអត្ថបទទៅការនិយាយ (TTS) ដើម្បីរៀបចំការសន្ទនាសំឡេងធម្មជាតិ។ ពួកគេអាចឆ្លើយសំណួរតាមការណែនាំនិងបំពេញភារកិច្ចដោយស្វ័យប្រវត្តិ - ដូចជាភ្នាក់ងារទទួលភ្ញៀវនិម្មិតឬភ្នាក់ងារគាំទ្រ។

ការជជែកជាសំឡេងគឺជាគោលបំណងទូទៅ 1: 1 ការសន្ទនាជាមួយ AI. ភ្នាក់ងារត្រូវបានបង្កើតឡើងសម្រាប់គោលបំណងជាក់លាក់សម្រាប់ភារកិច្ច - ពួកគេមាន persona កំណត់, មូលដ្ឋានចំណេះដឹងនិងលំហូរការងារ. ភ្នាក់ងារមួយអាចជា bot សេវាអតិថិជនដែលតាមសំណួរញឹកញាប់របស់អ្នក, ខណៈពេលដែលការជជែកជាសំឡេងគឺជាការសន្ទនាបើកចំហ.

សេវាកម្មអតិថិជន bots, ប្រព័ន្ធទូរស័ព្ទ IVR, ភ្ញៀវទទួលនិម្មិត, ជំនួយការបង្រៀន, លក់សមត្ថភាព bots, ការកំណត់ពេលវេលាការណាត់ជួប, storytellers អន្តរកម្ម, មិត្តភក្តិព្យាបាល, ដៃគូអនុវត្តភាសា, និងច្រើនទៀត.

សម្រាប់​ភ្នាក់ងារ​ការ​សន្ទនា​ដែល​មាន​ភាព​យឺត​ទាប Kokoro គឺ​ជា​ជម្រើស​ដ៏​ល្អ​បំផុត — វា​បង្កើត​ការ​និយាយ​ដែល​មាន​ល្បឿន​ជិត 100x ជាង​ពេល​វេលា​ពិត ។ សម្រាប់​ប្រអប់​ធម្មជាតិ​ច្រើន​ជាង​នេះ Dia TTS គាំទ្រ​ការ​សន្ទនា​អ្នក​និយាយ​ច្រើន ។ សម្រាប់​ការ​ចម្លង​សំឡេង (ផ្គូផ្គង​សំឡេង​ម៉ាក) ប្រើ Chatterbox ឬ GPT-SoVITS ។

បាទ / ចាស។ បំពង់ STT (Faster Whisper) គាំទ្រ 99 ភាសាសម្រាប់យល់ដឹងនិងម៉ូដែល TTS ដូចជា CosyVoice2និង GPT-SoVITS គាំទ្រ 8+ ភាសាសម្រាប់ឆ្លើយតប។ អ្នកអាចបង្កើតភ្នាក់ងារច្រើនភាសាដែលរកឃើញនិងឆ្លើយតបក្នុងភាសាអ្នកហៅ។

ចុងបញ្ចប់ទៅចុងបញ្ចប់ latency (ការនិយាយនៅក្នុង → ការនិយាយចេញ) ជាធម្មតាគឺ 1-3 វិនាទីដោយប្រើ Kokoro សម្រាប់ TTS និង Faster Whisper សម្រាប់ STT ។ នេះរួមបញ្ចូលទាំងការបកប្រែ STT (~ 200ms), ការឆ្លើយតប LLM (~ 500ms-1s), និង TTS សំយោគ (~ 200ms) ។

បាទ/ ចាស ។ ភ្នាក់ងារ​នីមួយៗ​មាន​ប្រព័ន្ធ​ជូនដំណឹង​ដែល​កំណត់​បុគ្គលិកលក្ខណៈ​របស់​វា ចំណេះដឹង សំឡេង និង​ច្បាប់​ឥរិយាបថ ។ អ្នក​អាច​ធ្វើ​ឲ្យ​វា​ជា​ផ្លូវការ ឬ​ធម្មតា កំណត់​ព្រំដែន​ប្រធានបទ កំណត់​ច្បាប់​កើនឡើង និង​ត្រួតពិនិត្យ​របៀប​ដែល​វា​ដោះស្រាយ​សំណួរ​ដែល​មិន​ស្គាល់ ។

បាទ។ ប្រើ STT API របស់យើងសម្រាប់ការទទួលស្គាល់ការនិយាយ LLM API ណាមួយសម្រាប់ព័ត៌មានវិទ្យានិង TTS API របស់យើងសម្រាប់លទ្ធផលសំឡេង។ ចំណុចបញ្ចប់ដែលឆបគ្នាជាមួយ OpenAI របស់យើងធ្វើឱ្យការរួមបញ្ចូលគ្នាងាយស្រួល។ ផែនការ Pro និង Enterprise រួមបញ្ចូលការចូលដំណើរការ API ។

បាទ។ ភ្ជាប់ភ្នាក់ងារសំឡេង API របស់យើងទៅវេទិកាទូរគមនាគមន៍ដូចជា Twilio, Vonage, ឬ Plivo ដើម្បីបង្កើតប្រព័ន្ធ IVR ផ្អែកលើទូរស័ព្ទ, ទូរស័ព្ទចេញ bots, និងអ្នកទទួលនិម្មិតដែលគ្រប់គ្រងការហៅ 24/7 ។

ថ្លៃសេវាភ្នាក់ងារអាស្រ័យលើម៉ូដែលដែលប្រើ។ ម៉ូដែលឥតគិតថ្លៃ (Kokoro, Piper) ចំណាយ0តួអក្សរសម្រាប់ TTS ។ STT គឺ 1,000 តួអក្សរក្នុងមួយនាទី។ ថ្លៃសេវា LLM អាស្រ័យលើក្រុមហ៊ុនផ្តល់សេវារបស់អ្នក។ ផែនការចាប់ផ្តើម ($9 / mo) រួមបញ្ចូល 500,000 តួអក្សរ, គ្រប់គ្រាន់សម្រាប់រាប់រយនៃអន្តរកម្មភ្នាក់ងារ។

បាទ. ប្រើលក្ខណៈពិសេសចម្លងសំឡេងរបស់យើងដើម្បីបង្កើតសំឡេងផ្ទាល់ខ្លួនពីឧទាហរណ៍អូឌីយ៉ូខ្លី (តិចជាង5វិនាទី) ។ ម៉ូដែលដូចជា Chatterbox និង GPT-SoVITS អាចចម្លងសំឡេងរបស់អ្នកឬសំឡេងម៉ាកណាមួយសម្រាប់បទពិសោធន៍ភ្នាក់ងារដែលមិនប្រែប្រួល។

បាទ / ចាស. ដំណើរការទាំងអស់កើតឡើងនៅលើម៉ាស៊ីនបម្រើ GPU ដែលបានបម្រុងទុករបស់យើង. យើងមិនរក្សាទុកការបកប្រែការសន្ទនាឬអូឌីយ៉ូបន្ទាប់ពីដំណើរការ. គ្មានទិន្នន័យត្រូវបានចែករំលែកជាមួយភាគីទីបីឬប្រើសម្រាប់បណ្តុះបណ្តាល. ផែនការសហគ្រាសផ្តល់ជូនជម្រើសចម្រុះទិន្នន័យបន្ថែមទៀត.
5.0/5 (1)

តើ​យើង​អាច​ធ្វើ​អ្វី​បាន​ប្រសើរ​ឡើង & # 160;? មតិ​យោបល់​របស់​អ្នក​ជួយ​យើង​ជួសជុល​បញ្ហា & # 160; ។

ស្ថាបនា​ភ្នាក់ងារ​សំឡេង​ដំបូង​របស់​អ្នក

បង្កើតភ្នាក់ងារសំឡេងឆ្លាតនៅក្នុងនាទី. ចុះឈ្មោះដោយឥតគិតថ្លៃនិងទទួលបាន 50 ក្រេឌីតដើម្បីចាប់ផ្តើមសាងសង់.