និយាយទៅនិយាយ

បម្លែងអូឌីយ៉ូដែលនិយាយ - ផ្លាស់ប្ដូរសំឡេង អារម្មណ៍ ភាសា និងរចនាប័ទ្មខណៈពេលរក្សាមាតិកាដើម & # 160; ។

ចុះឈ្មោះដោយឥតគិតថ្លៃ

យើងមិនមានសំឡេង TTS ក្នុងភាសារបស់អ្នកនៅឡើយទេ & # 160; ។ ជួយយើងបន្ថែមរបស់អ្នក & # 160;! លក់សំឡេងរបស់អ្នក

អូឌីយ៉ូប្រភព

អូស និងទម្លាក់ឯកសាររបស់អ្នកនៅទីនេះ ឬ រកមើល

Upload your speech recording. MP3, WAV, FLAC, OGG. Max 50MB.

— ឬថតសំឡេងរបស់អ្នក —

00:00

ការកំណត់បម្លែង

ប្រភេទបម្លែង

ម៉ូដែល

សំឡេងគោលដៅ

លទ្ធផល

ផ្ទុកអូឌីយ៉ូនិយាយឡើង ជ្រើសការបម្លែងរបស់អ្នក ហើយចុច បម្លែង ដើម្បីចាប់ផ្ដើម

របៀបដែលវាធ្វើការ

១. ផ្ទុកការនិយាយឡើង

ថត ឬផ្ទុកអូឌីយ៉ូដែលអ្នកចង់បម្លែងឡើងវិញ

២. ជ្រើសបម្លែង

ជ្រើសការផ្លាស់ប្ដូរសំឡេង ការផ្ទេររចនាប័ទ្ម ឬការបម្លែងភាសា

3. AI ផ្លាស់ប្តូរ

AI ដំណើរការអូឌីយ៉ូពីចុងទៅចុងដោយរក្សាមាតិកានិយាយ

៤. ទាញយក

ស្តាប់លទ្ធផល និងទាញយកអូឌីយ៉ូដែលបានបម្លែងរបស់អ្នក

ករណីប្រើ

និយាយទៅនិយាយសម្រាប់មាតិកា មធ្យោបាយងាយស្រួល និងគម្រោងច្នៃប្រឌិត

ការបកប្រែវីដេអូ

ច្រៀងវីដេអូទៅជាភាសាផ្សេងទៀតក្នុងពេលដែលរក្សាលក្ខណៈពិសេសសំឡេងរបស់អ្នកនិយាយដើម ។

ការលៃតម្រូវអារម្មណ៍

ផ្លាស់ប្ដូរសំឡេងអារម្មណ៍នៃការថត — ធ្វើឲ្យការនិយាយស្ងប់ស្ងាត់រំភើប ឬការនិយាយអព្យាក្រឹតក្តៅ និងជាមិត្តភក្តិ & # 160; ។

ការផលិតសំឡេង

បម្លែងការថតសំឡេងដែលមិនបានកែលម្អទៅជាការនិយាយដោយប្រើសំឡេង និងរចនាប័ទ្មផ្សេងគ្នា ។

ការធ្វើឲ្យអនាមិកសំឡេង

លាក់អត្តសញ្ញាណអ្នកនិយាយខណៈពេលរក្សាពាក្យនីមួយៗសម្រាប់ការរាយការណ៍ឬការការពារភាពឯកជន & # 160; ។

ម៉ូដែលនិយាយទៅនិយាយName

OpenVoice

ការបម្លែងសំឡេងរហ័សជាមួយនឹងការត្រួតពិនិត្យរចនាប័ទ្មក្រឡាចត្រង្គ ។ ផ្លាស់ប្ដូរអត្តសញ្ញាណសំឡេង ល្បឿន និងអារម្មណ៍ក្នុងមួយវិនាទី ។

ដំណើរការលឿន
ការផ្ទេររចនាប័ទ្ម
ភាសាចម្រុះ

Chatterbox

ការក្លូនសំឡេង Zero-shot ជាមួយការត្រួតពិនិត្យអារម្មណ៍ល្អិតល្អន់ពី Resemble AI ។

ការត្រួតពិនិត្យអារម្មណ៍
ការក្លូន Zero- Shot
ភាពត្រឹមត្រូវខ្ពស់

CosyVoice 2

ការក្លូនសំឡេងភាសាចម្រុះតាមរយៈភាសា ៨ ជាមួយនឹងការគាំទ្រ prosody និងស្ទ្រីមធម្មជាតិ & # 160; ។

8 ភាសា
ការក្លូនសំឡេង
ស្ទ្រីម

សំណួរដែលសួរញឹកញាប់

និយាយទៅនិយាយ (STS) AI ផ្លាស់ប្តូរការថតអូឌីយ៉ូនិយាយមួយទៅជាលទ្ធផលនិយាយផ្សេងគ្នា - ផ្លាស់ប្តូរសំឡេង, រចនាប័ទ្ម, អារម្មណ៍ឬភាសាខណៈពេលដែលរក្សាទុកពាក្យដើមនិងពេលវេលា។ វារួមបញ្ចូលការទទួលស្គាល់ការនិយាយ, ការដំណើរការនិងការសំយោគទៅក្នុងបំពង់តែមួយ។

អត្ថបទទៅការនិយាយបម្លែងអត្ថបទដែលបានសរសេរទៅជាអូឌីយ៉ូ & # 160; ។ ការនិយាយទៅការនិយាយយកអូឌីយ៉ូដែលមានស្រាប់ជាព័ត៌មានបញ្ចូល ហើយបម្លែងវាដោយផ្ទាល់ទៅជាអូឌីយ៉ូថ្មី - រក្សាតន្ត្រីធម្មជាតិ ផ្អាក ការសង្កត់ធ្ងន់ និងអារម្មណ៍នៃការថតដើមជំនួសឲ្យការបង្កើតការនិយាយពីអត្ថបទធម្មតា & # 160; ។

ការប្រើធម្មតារួមមានការបកប្រែវីដេអូទៅជាភាសាផ្សេងទៀត ការផ្លាស់ប្ដូរសំឡេងអ្នកនិយាយក្នុងការថត ការលៃតម្រូវអារម្មណ៍ ឬសំឡេងនៃអូឌីយ៉ូដែលមានស្រាប់ ការបង្កើតការនិយាយពីការថតដែលមិនច្បាស់ និងការថតសំឡេងដែលមិនស្គាល់ខណៈពេលរក្សាមាតិកា & # 160; ។

ម៉ូដែលបម្លែងសំឡេងដូចជា OpenVoice និង RVC គ្រប់គ្រងការបម្លែងសំឡេងទៅសំឡេង & # 160; ។ សម្រាប់ការនិយាយភាសាចម្រុះទៅការនិយាយ CosyVoice2និង GPT- SoVITS អាចក្លូន និងបង្កើតឡើងវិញក្នុងភាសាផ្សេងទៀត & # 160; ។ Chatterbox ក៏គាំទ្រការបង្កើតសំឡេងដែលមានមូលដ្ឋានលើការយោង & # 160; ។

បាទ/ ចាស ។ ដោយប្រើម៉ូដែលក្លូនសំឡេង អ្នកអាចបម្លែងការនិយាយរបស់អ្នកទៅជាភាសាផ្សេងទៀតក្នុងពេលដែលរក្សាលក្ខណៈពិសេសសំឡេងរបស់អ្នកផ្ទាល់ ។ AI ដកអត្តសញ្ញាណសំឡេងរបស់អ្នកចេញ ហើយសំយោគអូឌីយ៉ូឡើងវិញក្នុងភាសា ឬរចនាប័ទ្មគោលដៅ ។

បំពង់ដំបូងសរសេរការនិយាយរបស់អ្នកបកប្រែអត្ថបទទៅជាភាសាគោលដៅបន្ទាប់មកប្រើក្លូនសំឡេងដើម្បីសំយោគអត្ថបទដែលបានបកប្រែក្នុងសំឡេងដើមរបស់អ្នក & # 160; ។ ម៉ូដែលដូចជា CosyVoice2គាំទ្រភាសា ៨ សម្រាប់ការសំយោគភាសាឆ្លង & # 160; ។

សម្រាប់លទ្ធផលល្អបំផុត ផ្ទុកអូឌីយ៉ូស្អាតជាមួយនឹងសំឡេងផ្ទៃខាងក្រោយអប្បបរមា & # 160; ។ WAV ឬ FLAC នៅ 16kHz ឬខ្ពស់ជាងនេះធ្វើការល្អបំផុត & # 160; ។ MP3, OGG, M4A និង WEBM ក៏ត្រូវបានទទួលស្គាល់ផងដែរ & # 160; ។ ការនិយាយច្បាស់បង្កើតការបម្លែងដែលត្រឹមត្រូវបំផុត & # 160; ។

ដំណើរការពេលពិតប្រាកដគឺមានតាមរយៈ API របស់យើងដោយប្រើម៉ូដែលលឿនដូចជា Kokoro សម្រាប់សំយោគនិង Faster Whisper សម្រាប់ទទួលស្គាល់។ ភាពយឺតយ៉ាវអាស្រ័យលើម៉ូដែលនិងប្រវែងអូឌីយ៉ូប៉ុន្តែការត្រឡប់មកវិញក្រោម3វិនាទីអាចសម្រេចបានសម្រាប់ពាក្យខ្លី។

បាទ / ចាស ។ ម៉ូដែលដូចជា Chatterbox, Spark TTS និង IndexTTS-2 គាំទ្រការត្រួតពិនិត្យអារម្មណ៍និងរចនាប័ទ្ម។ អ្នកអាចបម្លែងការនិយាយស្ងប់ស្ងាត់ទៅជារំភើប សោកសៅទៅជាសប្បាយចិត្ត ឬអព្យាក្រឹតទៅជារឿងកំប្លែងខណៈពេលដែលរក្សាពាក្យនិងអត្តសញ្ញាណអ្នកនិយាយដូចគ្នា។

ការនិយាយទៅការនិយាយរួមបញ្ចូលគ្នាការទទួលស្គាល់និងសន្សំពិន្ទុ។ ការបម្លែងធម្មតាមួយនាទីប្រើ 3- 8 ពិន្ទុអាស្រ័យលើម៉ូដែលដែលបានជ្រើស ។ ម៉ូដែលកម្រិតឥតគិតថ្លៃដូចជា Kokoro អាចត្រូវបានប្រើសម្រាប់ជំហានសន្សំពិន្ទុក្នុងតម្លៃសូន្យ ។

អ្នកប្រើឥតគិតថ្លៃអាចដំណើរការអូឌីយ៉ូរហូតដល់ទៅ 1 នាទី។ ផែនការដែលបានបង់ប្រាក់គាំទ្រឯកសាររហូតដល់ទៅ 10 នាទី។ សម្រាប់ការថតចម្លងយូរអង្វែងចែកអូឌីយ៉ូទៅជាផ្នែកឬប្រើ API របស់យើងសម្រាប់ដំណើរការបាច់ដោយគ្មានដែនកំណត់ប្រវែង។

បាទ, អូឌីយ៉ូទាំងអស់ដែលបានផ្ទុកឡើងត្រូវបានដំណើរការនៅលើម៉ាស៊ីនបម្រើ GPU សុវត្ថិភាពរបស់យើងហើយលុបដោយស្វ័យប្រវត្តិក្នុងរយៈពេល 24 ម៉ោង. យើងមិនដែលប្រើអូឌីយ៉ូរបស់អ្នកដើម្បីបណ្តុះបណ្តាលម៉ូដែល. ការផ្ទេរទាំងអស់ប្រើការតភ្ជាប់ដែលបានអ៊ិនគ្រីបនិងទំនាក់ទំនងម៉ាស៊ីនបម្រើទៅម៉ាស៊ីនបម្រើត្រូវបានផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវ.

5.0/5 (1)

បម្លែងការនិយាយណាមួយជាមួយ AI

ផ្លាស់ប្តូរសំឡេង, អារម្មណ៍, ភាសា, និងរចនាប័ទ្ម. ចុះឈ្មោះដោយឥតគិតថ្លៃនិងទទួលបាន 50 ពិន្ទុដើម្បីចាប់ផ្តើម.

ចុះឈ្មោះដោយឥតគិតថ្លៃ មើលតម្លៃ

និយាយ​ទៅ​និយាយ

អូឌីយ៉ូ​ប្រភព

ការ​កំណត់​បម្លែង

លទ្ធផល

ដើម

បាន​បម្លែង

របៀប​ដែល​វា​ធ្វើការ

១. ផ្ទុក​ការ​និយាយ​ឡើង

២. ជ្រើស​បម្លែង

3. AI ផ្លាស់ប្តូរ

៤. ទាញយក

ករណី​ប្រើ

ការ​បកប្រែ​វីដេអូ

ការ​លៃតម្រូវ​អារម្មណ៍

ការ​ផលិត​សំឡេង​

ការ​ធ្វើ​ឲ្យ​អនាមិក​សំឡេង

ម៉ូដែល​និយាយ​ទៅ​និយាយName

OpenVoice

Chatterbox

CosyVoice 2

សំណួរ​ដែល​សួរ​ញឹកញាប់

តើ​អ្វី​ជា​ការ​និយាយ​ទៅ​ការ​និយាយ AI?

តើ​ការ​និយាយ​ទៅ​និយាយ​ខុស​គ្នា​ពី​អត្ថបទ​ទៅ​និយាយ​យ៉ាង​ដូចម្តេច & # 160;?

តើ​ខ្ញុំ​អាច​ប្រើ​ការ​និយាយ​ទៅ​និយាយ​សម្រាប់​អ្វី​បាន​ដែរ​ឬទេ & # 160;?

ម៉ូដែល​ណា​ដែល​គាំទ្រ​ការ​និយាយ​ទៅ​និយាយ & # 160;?

តើ​ការ​និយាយ​ទៅ​និយាយ​អាច​រក្សា​សំឡេង​ដើម​របស់​ខ្ញុំ​បាន​ទេ & # 160;?

តើ​ការ​និយាយ​ភាសា​ផ្សេង​គ្នា​ទៅ​ការ​និយាយ​ធ្វើការ​យ៉ាង​ដូចម្តេច & # 160;?

តើ​ខ្ញុំ​គួរ​ផ្ទុក​ឡើង​គុណភាព​អូឌីយ៉ូ​អ្វី​ខ្លះ & # 160;?

តើ​ការ​និយាយ​ពេល​វេលា​ពិត​ទៅ​ការ​និយាយ​អាច​ធ្វើ​ទៅ​បាន​ទេ & # 160;?

តើ​ខ្ញុំ​អាច​ផ្លាស់ប្ដូរ​អារម្មណ៍ ឬ​រចនាប័ទ្ម​នៃ​ការ​និយាយ​បាន​ទេ & # 160;?

តើ​ការ​និយាយ​ទៅ​និយាយ​មាន​តម្លៃ​ប៉ុន្មាន?

តើ​ប្រវែង​អូឌីយ៉ូ​អតិបរមា​គឺ​អ្វី & # 160;?

តើ​អូឌីយ៉ូ​របស់​ខ្ញុំ​ត្រូវ​បាន​រក្សា​ទុក​ជា​ឯកជន​ឬ & # 160;?

បម្លែង​ការ​និយាយ​ណាមួយ​ជាមួយ AI