TTS ពេលវេលាពិត
អត្ថបទទៅការនិយាយស្ទ្រីមជាមួយការពន្យារអូឌីយ៉ូដំបូងរងវិនាទី ។ ស្ថាបនាសម្រាប់ភ្នាក់ងារសំឡេង និងកម្មវិធីបន្តផ្ទាល់ ។
អត្ថបទ
ស្ទ្រីមការកំណត់សំឡេង
របៀបដែលការស្ទ្រីម TTS ធ្វើការ
១. ផ្ញើអត្ថបទ
អត្ថបទ POST ទៅ / v1 / tts / stream / ជាសំណើព្រឹត្តិការណ៍ដែលបានផ្ញើដោយម៉ាស៊ីនបម្រើ។
2. ម៉ូដែលបង្កើត
Kokoro បំបែកអត្ថបទ និងបង្កើតឧទាហរណ៍អូឌីយ៉ូតាមឧទាហរណ៍នៅលើ GPU ។
3. ស្ទ្រីមចង្កឹះ
ផ្នែកដែលបានអ៊ិនកូដជា Base64 WAV ចូលមកលើ SSE ហើយចាប់ផ្ដើមចាក់ភ្លាមៗ ។
4. ស្តាប់ផ្ទាល់
អ្នកប្រើឮការចាប់ផ្ដើមរបស់ឃ្លាក្នុងរយៈពេលតិចជាងមួយវិនាទី ទោះបីជាលើការបញ្ចូលវែងក៏ដោយ ។
ករណីប្រើ
កន្លែងដែលការពន្យារពេលរងវិនាទីបើកបទពិសោធន៍ថ្មី ។
ភ្នាក់ងារសំឡេង
មនុស្សយន្តនិយាយដែលឆ្លើយតបយ៉ាងលឿនដូចមនុស្សនឹងធ្វើដែរ ។
ការបកប្រែផ្ទាល់
បកប្រែ និងច្រៀងស្ទ្រីមក្នុងពេលពិតដោយគ្មានការផ្អាកសតិបណ្ដោះអាសន្ន ។
ល្បែងName
ប្រអប់ NPC ដែលមានប្រតិកម្មទៅនឹងជម្រើសរបស់អ្នកលេងភ្លាមៗ គ្មាន VO ដែលបានបង្ហាញជាមុនទេ ។
មធ្យោបាយងាយស្រួល
កម្មវិធីអានអេក្រង់ និងឧបករណ៍ជំនួយដែលចាប់ផ្ដើមនិយាយពេលអ្នកប្រើចុច ។
ផែនការ TTS ពេលវេលាពិត
ចាប់ផ្តើមដោយឥតគិតថ្លៃ ធ្វើឲ្យប្រសើរឡើងនៅពេលអ្នកត្រូវការបន្ថែម
- Kokoro ស្ទ្រីម (ម៉ូដែលឥតគិតថ្លៃ)
- ៥០០ តួអក្សរក្នុងមួយជំនាន់
- 10 ស្ទ្រីមឥតគិតថ្លៃ / ថ្ងៃក្នុងមួយអ្នកប្រើអនាមិក
- ភាពយឺតអូឌីយ៉ូដំបូងរងវិនាទី
- ស្ទ្រីម SSE លើ HTTPS
- 15,000 តួអក្សរនៅពេលចុះឈ្មោះ
- ៥, ០០០ តួអក្សរក្នុងមួយស្ទ្រីម
- កូនសោ API សម្រាប់ចូលដំណើរការកម្មវិធី
- ប្រវត្តិបង្កើត
- គ្មានដែនកំណត់ស្ទ្រីមប្រចាំថ្ងៃ
- MOSS- TTS- Realtime (ពេលនៅរស់)
- ១០០, ០០០ តួអក្សរក្នុងមួយស្ទ្រីម
- ជួរ GPU ដែលមានអាទិភាព
- ភ្នាក់ងារសំឡេង + ការរួមបញ្ចូល Twilio
- ដែនកំណត់អត្រាខ្ពស់
សំណួរដែលសួរញឹកញាប់
តើយើងអាចធ្វើអ្វីបានប្រសើរឡើង ? មតិយោបល់របស់អ្នកជួយយើងជួសជុលបញ្ហា ។
ស្ទ្រីមការនិយាយក្នុងពេលពិតName
ឥតគិតថ្លៃសម្រាប់ 10 ជំនាន់ដំបូងមួយថ្ងៃ. ចុះឈ្មោះដើម្បីបើកការអនុញ្ញាតតួអក្សរពេញលេញនិងចូលដំណើរការ API.