និយាយ​ទៅ​និយាយ

បម្លែង​អូឌីយ៉ូ​ដែល​និយាយ - ផ្លាស់ប្ដូរ​សំឡេង អារម្មណ៍ ភាសា និង​រចនាប័ទ្ម​ខណៈ​ពេល​រក្សា​មាតិកា​ដើម & # 160; ។

យើង​មិន​មាន​សំឡេង TTS ក្នុង​ភាសា​របស់​អ្នក​នៅ​ឡើយ​ទេ & # 160; ។ ជួយ​យើង​បន្ថែម​របស់​អ្នក & # 160;! លក់​សំឡេង​របស់​អ្នក

អូឌីយ៉ូ​ប្រភព

អូស និង​ទម្លាក់​ឯកសារ​របស់​អ្នក​នៅ​ទីនេះ ឬ រកមើល

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

file.mp3

0 MB
— ឬ​ថត​សំឡេង​របស់​អ្នក —
00:00

ការ​កំណត់​បម្លែង

អូស និង​ទម្លាក់​ឯកសារ​របស់​អ្នក​នៅ​ទីនេះ ឬ រកមើល

Upload a reference of the target voice. 10-30 sec recommended.

file.mp3

0 MB

លទ្ធផល

ផ្ទុក​អូឌីយ៉ូ​និយាយ​ឡើង ជ្រើស​ការ​បម្លែង​របស់​អ្នក ហើយ​ចុច បម្លែង ដើម្បី​ចាប់ផ្ដើម

កំពុង​បម្លែង​ការ​និយាយ... វា​អាច​ចំណាយ​ពេល​បន្តិច & # 160; ។

ដើម

បាន​បម្លែង

របៀប​ដែល​វា​ធ្វើការ

១. ផ្ទុក​ការ​និយាយ​ឡើង

ថត ឬ​ផ្ទុក​អូឌីយ៉ូ​ដែល​អ្នក​ចង់​បម្លែង​ឡើង​វិញ

២. ជ្រើស​បម្លែង

ជ្រើស​ការ​ផ្លាស់ប្ដូរ​សំឡេង ការ​ផ្ទេរ​រចនាប័ទ្ម ឬ​ការ​បម្លែង​ភាសា

3. AI ផ្លាស់ប្តូរ

AI ដំណើរការ​អូឌីយ៉ូ​ពី​ចុង​ទៅ​ចុង​ដោយ​រក្សា​មាតិកា​និយាយ

៤. ទាញយក

ស្តាប់​លទ្ធផល និង​ទាញយក​អូឌីយ៉ូ​ដែល​បាន​បម្លែង​របស់​អ្នក

ករណី​ប្រើ

និយាយ​ទៅ​និយាយ​សម្រាប់​មាតិកា មធ្យោបាយ​ងាយស្រួល និង​គម្រោង​ច្នៃប្រឌិត

ការ​បកប្រែ​វីដេអូ

ច្រៀង​វីដេអូ​ទៅ​ជា​ភាសា​ផ្សេង​ទៀត​ក្នុង​ពេល​ដែល​រក្សា​លក្ខណៈ​ពិសេស​សំឡេង​របស់​អ្នក​និយាយ​ដើម ។

ការ​លៃតម្រូវ​អារម្មណ៍

ផ្លាស់ប្ដូរ​សំឡេង​អារម្មណ៍​នៃ​ការ​ថត — ធ្វើ​ឲ្យ​ការ​និយាយ​ស្ងប់ស្ងាត់​រំភើប ឬ​ការ​និយាយ​អព្យាក្រឹត​ក្តៅ និង​ជា​មិត្ត​ភក្តិ & # 160; ។

ការ​ផលិត​សំឡេង​

បម្លែង​ការ​ថត​សំឡេង​ដែល​មិន​បាន​កែ​លម្អ​ទៅ​ជា​ការ​និយាយ​ដោយ​ប្រើ​សំឡេង និង​រចនាប័ទ្ម​ផ្សេង​គ្នា ។

ការ​ធ្វើ​ឲ្យ​អនាមិក​សំឡេង

លាក់​អត្តសញ្ញាណ​អ្នក​និយាយ​ខណៈ​ពេល​រក្សា​ពាក្យ​នីមួយៗ​សម្រាប់​ការ​រាយការណ៍​ឬ​ការ​ការពារ​ភាព​ឯកជន & # 160; ។

ម៉ូដែល​និយាយ​ទៅ​និយាយName

OpenVoice

ការ​បម្លែង​សំឡេង​រហ័ស​ជាមួយ​នឹង​ការ​ត្រួតពិនិត្យ​រចនាប័ទ្ម​ក្រឡាចត្រង្គ ។ ផ្លាស់ប្ដូរ​អត្តសញ្ញាណ​សំឡេង ល្បឿន និង​អារម្មណ៍​ក្នុង​មួយ​វិនាទី ។

  • ដំណើរការ​លឿន
  • ការ​ផ្ទេរ​រចនាប័ទ្ម
  • ភាសា​ចម្រុះ

Chatterbox

ការ​ក្លូន​សំឡេង Zero-shot ជាមួយ​ការ​ត្រួតពិនិត្យ​អារម្មណ៍​ល្អិតល្អន់​ពី Resemble AI ។

  • ការ​ត្រួតពិនិត្យ​អារម្មណ៍
  • ការ​ក្លូន Zero- Shot
  • ភាព​ត្រឹមត្រូវ​ខ្ពស់

CosyVoice 2

ការ​ក្លូន​សំឡេង​ភាសា​ចម្រុះ​តាម​រយៈ​ភាសា ៨ ជាមួយ​នឹង​ការ​គាំទ្រ prosody និង​ស្ទ្រីម​ធម្មជាតិ & # 160; ។

  • 8 ភាសា
  • ការ​ក្លូន​សំឡេង
  • ស្ទ្រីម

សំណួរ​ដែល​សួរ​ញឹកញាប់

និយាយទៅនិយាយ (STS) AI ផ្លាស់ប្តូរការថតអូឌីយ៉ូនិយាយមួយទៅជាលទ្ធផលនិយាយផ្សេងគ្នា - ផ្លាស់ប្តូរសំឡេង, រចនាប័ទ្ម, អារម្មណ៍ឬភាសាខណៈពេលដែលរក្សាទុកពាក្យដើមនិងពេលវេលា។ វារួមបញ្ចូលការទទួលស្គាល់ការនិយាយ, ការដំណើរការនិងការសំយោគទៅក្នុងបំពង់តែមួយ។

អត្ថបទ​ទៅ​ការ​និយាយ​បម្លែង​អត្ថបទ​ដែល​បាន​សរសេរ​ទៅ​ជា​អូឌីយ៉ូ & # 160; ។ ការ​និយាយ​ទៅ​ការ​និយាយ​យក​អូឌីយ៉ូ​ដែល​មាន​ស្រាប់​ជា​ព័ត៌មាន​បញ្ចូល ហើយ​បម្លែង​វា​ដោយ​ផ្ទាល់​ទៅ​ជា​អូឌីយ៉ូ​ថ្មី - រក្សា​តន្ត្រី​ធម្មជាតិ ផ្អាក ការ​សង្កត់​ធ្ងន់ និង​អារម្មណ៍​នៃ​ការ​ថត​ដើម​ជំនួស​ឲ្យ​ការ​បង្កើត​ការ​និយាយ​ពី​អត្ថបទ​ធម្មតា & # 160; ។

ការ​ប្រើ​ធម្មតា​រួម​មាន​ការ​បកប្រែ​វីដេអូ​ទៅ​ជា​ភាសា​ផ្សេង​ទៀត ការ​ផ្លាស់ប្ដូរ​សំឡេង​អ្នក​និយាយ​ក្នុង​ការ​ថត ការ​លៃតម្រូវ​អារម្មណ៍ ឬ​សំឡេង​នៃ​អូឌីយ៉ូ​ដែល​មាន​ស្រាប់ ការ​បង្កើត​ការ​និយាយ​ពី​ការ​ថត​ដែល​មិន​ច្បាស់ និង​ការ​ថត​សំឡេង​ដែល​មិន​ស្គាល់​ខណៈ​ពេល​រក្សា​មាតិកា & # 160; ។

ម៉ូដែល​បម្លែង​សំឡេង​ដូចជា OpenVoice និង RVC គ្រប់គ្រង​ការ​បម្លែង​សំឡេង​ទៅ​សំឡេង & # 160; ។ សម្រាប់​ការ​និយាយ​ភាសា​ចម្រុះ​ទៅ​ការ​និយាយ CosyVoice2និង GPT- SoVITS អាច​ក្លូន និង​បង្កើត​ឡើងវិញ​ក្នុង​ភាសា​ផ្សេង​ទៀត & # 160; ។ Chatterbox ក៏​គាំទ្រ​ការ​បង្កើត​សំឡេង​ដែល​មាន​មូលដ្ឋាន​លើ​ការ​យោង & # 160; ។

បាទ/ ចាស ។ ដោយ​ប្រើ​ម៉ូដែល​ក្លូន​សំឡេង អ្នក​អាច​បម្លែង​ការ​និយាយ​របស់​អ្នក​ទៅ​ជា​ភាសា​ផ្សេង​ទៀត​ក្នុង​ពេល​ដែល​រក្សា​លក្ខណៈ​ពិសេស​សំឡេង​របស់​អ្នក​ផ្ទាល់ ។ AI ដក​អត្តសញ្ញាណ​សំឡេង​របស់​អ្នក​ចេញ ហើយ​សំយោគ​អូឌីយ៉ូ​ឡើងវិញ​ក្នុង​ភាសា ឬ​រចនាប័ទ្ម​គោលដៅ ។

បំពង់​ដំបូង​សរសេរ​ការ​និយាយ​របស់​អ្នក​បកប្រែ​អត្ថបទ​ទៅ​ជា​ភាសា​គោលដៅ​បន្ទាប់​មក​ប្រើ​ក្លូន​សំឡេង​ដើម្បី​សំយោគ​អត្ថបទ​ដែល​បាន​បកប្រែ​ក្នុង​សំឡេង​ដើម​របស់​អ្នក & # 160; ។ ម៉ូដែល​ដូច​ជា CosyVoice2គាំទ្រ​ភាសា ៨ សម្រាប់​ការ​សំយោគ​ភាសា​ឆ្លង & # 160; ។

សម្រាប់​លទ្ធផល​ល្អ​បំផុត ផ្ទុក​អូឌីយ៉ូ​ស្អាត​ជាមួយ​នឹង​សំឡេង​ផ្ទៃ​ខាង​ក្រោយ​អប្បបរមា & # 160; ។ WAV ឬ FLAC នៅ 16kHz ឬ​ខ្ពស់​ជាង​នេះ​ធ្វើការ​ល្អ​បំផុត & # 160; ។ MP3, OGG, M4A និង WEBM ក៏​ត្រូវ​បាន​ទទួល​ស្គាល់​ផងដែរ & # 160; ។ ការ​និយាយ​ច្បាស់​បង្កើត​ការ​បម្លែង​ដែល​ត្រឹមត្រូវ​បំផុត & # 160; ។

ដំណើរការពេលពិតប្រាកដគឺមានតាមរយៈ API របស់យើងដោយប្រើម៉ូដែលលឿនដូចជា Kokoro សម្រាប់សំយោគនិង Faster Whisper សម្រាប់ទទួលស្គាល់។ ភាពយឺតយ៉ាវអាស្រ័យលើម៉ូដែលនិងប្រវែងអូឌីយ៉ូប៉ុន្តែការត្រឡប់មកវិញក្រោម3វិនាទីអាចសម្រេចបានសម្រាប់ពាក្យខ្លី។

បាទ / ចាស ។ ម៉ូដែលដូចជា Chatterbox, Spark TTS និង IndexTTS-2 គាំទ្រការត្រួតពិនិត្យអារម្មណ៍និងរចនាប័ទ្ម។ អ្នកអាចបម្លែងការនិយាយស្ងប់ស្ងាត់ទៅជារំភើប សោកសៅទៅជាសប្បាយចិត្ត ឬអព្យាក្រឹតទៅជារឿងកំប្លែងខណៈពេលដែលរក្សាពាក្យនិងអត្តសញ្ញាណអ្នកនិយាយដូចគ្នា។

ការ​និយាយ​ទៅ​ការ​និយាយ​រួម​បញ្ចូល​គ្នា​ការ​ទទួល​ស្គាល់​និង​សន្សំ​ពិន្ទុ​។ ការ​បម្លែង​ធម្មតា​មួយ​នាទី​ប្រើ 3- 8 ពិន្ទុ​អាស្រ័យ​លើ​ម៉ូដែល​ដែល​បាន​ជ្រើស ។ ម៉ូដែល​កម្រិត​ឥត​គិត​ថ្លៃ​ដូចជា Kokoro អាច​ត្រូវ​បាន​ប្រើ​សម្រាប់​ជំហាន​សន្សំ​ពិន្ទុ​ក្នុង​តម្លៃ​សូន្យ ។

អ្នកប្រើឥតគិតថ្លៃអាចដំណើរការអូឌីយ៉ូរហូតដល់ទៅ 1 នាទី។ ផែនការដែលបានបង់ប្រាក់គាំទ្រឯកសាររហូតដល់ទៅ 10 នាទី។ សម្រាប់ការថតចម្លងយូរអង្វែងចែកអូឌីយ៉ូទៅជាផ្នែកឬប្រើ API របស់យើងសម្រាប់ដំណើរការបាច់ដោយគ្មានដែនកំណត់ប្រវែង។

បាទ, អូឌីយ៉ូទាំងអស់ដែលបានផ្ទុកឡើងត្រូវបានដំណើរការនៅលើម៉ាស៊ីនបម្រើ GPU សុវត្ថិភាពរបស់យើងហើយលុបដោយស្វ័យប្រវត្តិក្នុងរយៈពេល 24 ម៉ោង. យើងមិនដែលប្រើអូឌីយ៉ូរបស់អ្នកដើម្បីបណ្តុះបណ្តាលម៉ូដែល. ការផ្ទេរទាំងអស់ប្រើការតភ្ជាប់ដែលបានអ៊ិនគ្រីបនិងទំនាក់ទំនងម៉ាស៊ីនបម្រើទៅម៉ាស៊ីនបម្រើត្រូវបានផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវ.
5.0/5 (1)

តើ​យើង​អាច​ធ្វើ​អ្វី​បាន​ប្រសើរ​ឡើង & # 160;? មតិ​យោបល់​របស់​អ្នក​ជួយ​យើង​ជួសជុល​បញ្ហា & # 160; ។

បម្លែង​ការ​និយាយ​ណាមួយ​ជាមួយ AI

ផ្លាស់ប្តូរសំឡេង, អារម្មណ៍, ភាសា, និងរចនាប័ទ្ម. ចុះឈ្មោះដោយឥតគិតថ្លៃនិងទទួលបាន 50 ពិន្ទុដើម្បីចាប់ផ្តើម.