អត្ថបទទៅការនិយាយជាមួយសញ្ញាអារម្មណ៍Name
បង្កើតការនិយាយជាមួយនឹងការសម្ដែងអារម្មណ៍ពិតប្រាកដ - សប្បាយរីករាយ, សោកស្តាយ, ខឹង, រំភើប, សំឡេងស្រែក, និងច្រើនទៀត. ម៉ូដែល AI របស់យើងទៅលើសពីការរៀបរាប់រាបស្មើដើម្បីផ្គត់ផ្គង់ការនិយាយដែលបញ្ជូនអារម្មណ៍ពិតប្រាកដ. ល្អឥតខ្ចោះសម្រាប់រឿងរ៉ាវ, ការជជែកកំសាន្តហ្គេម, មាតិកាទីផ្សារ, និងគម្រោងណាមួយដែល tone matters as much as words.
សាកល្បងវាឥឡូវ
លក្ខណៈពិសេស Emotional TTS
សំឡេង AI ដែលបង្ហាញពីអារម្មណ៍ពិត និងកម្រិតពណ៌
សញ្ញាអារម្មណ៍ច្រើន
បង្កើតការនិយាយដោយប្រើសំឡេងអារម្មណ៍ខុសៗគ្នា - សប្បាយរីករាយ សោកសៅ ខឹង ខ្លាច ភ្ញាក់ផ្អើល ស្អប់ និងអព្យាក្រឹត ។ អារម្មណ៍នីមួយៗផ្លាស់ប្ដូរកម្រិតសំឡេង ល្បឿន និងសំឡេង ។
ត្រួតពិនិត្យអាំងតង់ស៊ីតេ
លៃតម្រូវអាំងតង់ស៊ីតេអារម្មណ៍ពីតូចទៅធំ & # 160; ។ ស្នាមញញឹមតូចមួយក្នុងសំឡេងឬភាពរីករាយពេញលេញ & # 160; — កែសម្រួលការបង្ហាញអារម្មណ៍ដើម្បីផ្គូផ្គងមាតិការបស់អ្នក & # 160; ។
វណ្ណយុត្តធម្មជាតិ
អារម្មណ៍មានឥទ្ធិពលលើលំនាំការនិយាយទាំងមូល មិនមែនតែសំឡេងប៉ុណ្ណោះទេ & # 160; ។ ការនិយាយដែលសោកសៅគឺយឺតជាងជាមួយនឹងការធ្លាក់ចុះនៃសម្លេង & # 160; ។ ការនិយាយដែលរំភើបគឺលឿនជាងជាមួយនឹងការកើនឡើងនៃកម្រិតសំឡេង & # 160; ។ ទំនុកតម្កើងមានអារម្មណ៍ជាធម្មតា & # 160; ។
សំឡេងស្រែក និងស្រែក
លើសពីអារម្មណ៍ស្តង់ដារ បង្កើតការនិយាយខ្សឹបខ្សៀវសម្រាប់មាតិកាស្និទ្ធស្នាលឬ ASMR និងការដឹកជញ្ជូនយ៉ាងម៉ឺងម៉ាត់សម្រាប់ពេលវេលានិងសេចក្តីប្រកាសដ៏គួរឱ្យចាប់អារម្មណ៍។
កន្សោមដែលដឹងបរិបទ
ម៉ូដែលខ្លះរកឃើញបរិបទអារម្មណ៍ដោយស្វ័យប្រវត្តិពីអត្ថបទ & # 160; ។ សំណួរទទួលបានការលើកឡើងនៃការនិយាយពាក្យអង្វរទទួលបានការសង្កត់ធ្ងន់ និងបញ្ជីទទួលបានការធ្វើដំណើរដោយស្មើគ្នា & # 160; ។
វត្ថុបញ្ជាក្រឡាចត្រង្គល្អិត
ប៉ារ៉ាម៉ែត្រកម្រិតខ្ពស់អនុញ្ញាតឲ្យអ្នកត្រួតពិនិត្យជួរ pitch អត្រានិយាយ កម្រិតថាមពល និង breathiness ដោយឯករាជ្យសម្រាប់ទម្រង់អារម្មណ៍ផ្ទាល់ខ្លួនដែលលើសពីការកំណត់ជាមុន & # 160; ។
ម៉ូដែលល្អបំផុតសម្រាប់ការនិយាយដែលមានអារម្មណ៍
ម៉ូដែលដែលល្អបំផុតក្នុងការបង្ហាញអារម្មណ៍ និងការបង្ហាញ
Chatterbox
Premium
State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.
ល្អបំផុតសម្រាប់ & # 160; ៖ ការត្រួតពិនិត្យអារម្មណ៍ល្អបំផុត - ភាពខ្លាំងនៃអារម្មណ៍ដែលអាចលៃតម្រូវបានជាមួយការក្លូនសំឡេង
ព្យាយាម Chatterbox
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
ល្អបំផុតសម្រាប់ & # 160; ៖ ការញញឹមធម្មជាតិ ការស្រែកយំ និងសំឡេងអារម្មណ៍ដែលមិននិយាយ
ព្យាយាម Bark
Orpheus
Standard
Human-level emotional TTS model trained on 100K hours of speech data.
ល្អបំផុតសម្រាប់ & # 160; ៖ ជួរអារម្មណ៍កម្រិតមនុស្សត្រូវបានបណ្តុះបណ្តាលលើម៉ោង 100K នៃការនិយាយប្រកបដោយប្រសិទ្ធភាព
ព្យាយាម Orpheus
Dia TTS
Standard
Multi-speaker dialog generation model that creates natural conversations between speakers.
ល្អបំផុតសម្រាប់ & # 160; ៖ ប្រអប់អារម្មណ៍រវាងតួអក្សរដែលមានការផ្លាស់ប្ដូរជាធម្មតា
ព្យាយាម Dia TTS
Parler TTS
Standard
Describe the voice you want in natural language and Parler generates matching speech.
ល្អបំផុតសម្រាប់ & # 160; ៖ ពិពណ៌នាការផ្ដល់អារម្មណ៍ក្នុងភាសាអង់គ្លេសធម្មតាសម្រាប់ការត្រួតពិនិត្យដោយស្វ័យប្រវត្តិ
ព្យាយាម Parler TTS
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ល្អបំផុតសម្រាប់ & # 160; ៖ ត្រួតពិនិត្យអារម្មណ៍ដែលមានគ្រាប់ល្អជាមួយការស្ទ្រីមសម្រាប់កម្មវិធីពេលវេលាពិត
ព្យាយាម CosyVoice 2របៀបបង្កើតការនិយាយដែលមានអារម្មណ៍
បន្ថែមអារម្មណ៍ទៅការនិយាយ AI ក្នុងមួយវិនាទី
សរសេរអត្ថបទរបស់អ្នក
បញ្ចូលអត្ថបទដែលអ្នកចង់និយាយដោយអារម្មណ៍ & # 160; ។ មាតិកាដោយខ្លួនវាឯងអាចមានឥទ្ធិពលលើការចែកចាយដោយអារម្មណ៍ - សំឡេងអរគុណ សំណួរ និងអត្ថបទកំប្លែងដែលជាការបង្ហាញផ្លូវដោយធម្មជាតិ & # 160; ។
ជ្រើសអារម្មណ៍
ជ្រើសពីសប្បាយ, សោកសៅ, ខឹង, ភ័យខ្លាច, រំភើប, ស្រែក, ឬអព្យាក្រឹត & # 160; ។ ម៉ូដែលមួយចំនួនផ្តល់ជូននូវអារម្មណ៍បន្ថែមដូចជា sarcastic, tender, or authoritative & # 160; ។
លៃតម្រូវអាំងតង់ស៊ីតេ
កំណត់កម្រិតអារម្មណ៍ឲ្យបានល្អិតល្អន់ & # 160; ។ អាំងតង់ស៊ីតេទាបបន្ថែមពណ៌លម្អិត & # 160; ។ អាំងតង់ស៊ីតេខ្ពស់ផលិតការផ្ដល់អារម្មណ៍ដែលមិនអាចបំភ្លេចបានយ៉ាងអស្ចារ្យ & # 160; ។
បង្កើត និងកែសម្រួល
បង្កើតការនិយាយ និងស្តាប់ ។ លៃតម្រូវប្រភេទអារម្មណ៍ អាំងតង់ស៊ីតេ ឬម៉ូដែលរហូតដល់ការផ្ដល់ផ្គូផ្គងទស្សនៈរបស់អ្នក ។ ទាញយកអូឌីយ៉ូចុងក្រោយក្នុង MP3 ឬ WAV ។
សមត្ថភាពម៉ូដែល TTS អារម្មណ៍
របៀបដែលម៉ូដែលផ្សេងគ្នាគ្រប់គ្រងការបង្ហាញអារម្មណ៍
Bark — បែបផែនសំឡេងដែលបង្ហាញ
Bark មានសមត្ថភាពពិសេសក្នុងការបង្កើតសំឡេងដែលមិនមែនជាការនិយាយនៅជាប់នឹងការនិយាយ & # 160; ។ ប្រើការជូនដំណឹងអត្ថបទដូចជា [laughs], [sighs], [gasps] ឬ [clears throat] ដោយផ្ទាល់ក្នុងអត្ថបទរបស់អ្នកដើម្បីកេះប្រតិកម្មអារម្មណ៍ & # 160; ។ Bark ក៏អាចច្រៀង ច្រៀង និងផលិតការនិយាយដែលមានការផ្លាស់ប្ដូរអារម្មណ៍ខ្លាំង & # 160; ។
- Laughter: "Ha ha! That was hilarious! [laughs]"
- ទុក្ខសោក & # 160; ៖ \
- ភ្ញាក់ផ្អើល & # 160; ៖ \
- ការច្រៀង & # 160; ៖ សំឡេងតន្ត្រី និងបទភ្លេង
Orpheus - ស្លាកអារម្មណ៍
Orpheus (បានសាងសង់លើ Llama 3.2) គាំទ្រការត្រួតពិនិត្យអារម្មណ៍ដោយផ្ទាល់តាមរយៈស្លាក & # 160; ។ វាយអត្ថបទក្នុងសញ្ញាសម្គាល់អារម្មណ៍ដើម្បីត្រួតពិនិត្យការផ្ដល់ & # 160; ៖ < happy >, < sad >, < angry >, < surprised >, < disgusted > & # 160; ។ លាយអារម្មណ៍ក្នុងជំនាន់តែមួយសម្រាប់ថាមវន្ត ផ្លាស់ប្ដូរសំឡេង & # 160; ។
- < happy > សម្រាប់ការចែកចាយរីករាយនិងរីករាយ
- < sad > សម្រាប់ភាពសោកសៅ សំឡេងក្រៀមក្រំ
- < angry > សម្រាប់ការនិយាយខ្លាំងក្លា
- < surprised > សម្រាប់ការភ្ញាក់ផ្អើល និងការឆ្លើយតបដែលភ្ញាក់ផ្អើល
Dia - ប្រអប់អ្នកនិយាយច្រើន
Dia ជំនាញក្នុងការនិយាយការសន្ទនាជាមួយនឹងអ្នកនិយាយពីរនាក់ & # 160; ។ វាជាធម្មតាគ្រប់គ្រងការផ្លាស់ប្ដូរការផ្អាក និងថាមពលអារម្មណ៍នៃការសន្ទនាពិតប្រាកដ & # 160; ។ អស្ចារ្យសម្រាប់ការបង្កើតឆាកការសន្ទនា ការសម្ភាសន៍ ឬមាតិការចនាប័ទ្មផតខាស់នៅកន្លែងដែលការតភ្ជាប់អារម្មណ៍សំខាន់ & # 160; ។
- ថាមវន្តការសន្ទនាធម្មជាតិ
- ប្រអប់ធុងបាសពីរជាមួយនឹងសំឡេងខុសៗគ្នា
- ឥរិយាបថផ្លូវចិត្តរវាងអ្នកនិយាយ
- សំឡេងដែលមិននិយាយ (ញញឹម ស្ទាក់ស្ទើរ)
Sesame CSM - បរិបទការនិយាយ
Sesame CSM (Conversational Speech Model) ត្រូវ បាន រចនា ឡើង ដើម្បី ផលិត សំឡេង និយាយ ដែល ឮ ដូច ការ និយាយ ធម្មតា, មិន អាន ឡើង ខ្លាំង. វា ដោះស្រាយ អារម្មណ៍ ជ្រៅ ជ្រះ នៃ សំឡេង ពិត - ផ្អាក សម្រាប់ គំនិត, ការ ផ្តោត លើ ពាក្យ សំខាន់, ឡើង intonation សម្រាប់ សំណួរ, និង ភាព ក្តៅ ក្រហាយ ក្នុង បរិបទ មិត្តភាព.
- ការផ្គត់ផ្គង់អារម្មណ៍ដែលដឹងបរិបទ
- ចង្វាក់ការសន្ទនាធម្មជាតិ
- ការសង្កត់ធ្ងន់ និងការធ្វើចលនាសមរម្យ
- ក្ដៅ គុណភាពដូចមនុស្ស
នៅពេលដែលអារម្មណ៍សំខាន់
ប្រើករណីដែលអារម្មណ៍ TTS ធ្វើឲ្យមានភាពខុសគ្នាពិតប្រាកដ
ប្រអប់ល្បែង
NPC ដែលមានសំឡេងពិតប្រាកដខ្លាច, ខ្មោចដែលមានការគំរាមកំហែងពិតប្រាកដ, ដៃគូដែលមានភាពកក់ក្តៅ. TTS អារម្មណ៍ធ្វើឱ្យតួអក្សរល្បែងគួរឱ្យជឿ និង immersive.
ការនិយាយសៀវភៅអូឌីយ៉ូ
អ្នកនិយាយដែលស្រែកកំឡុងពេលមានអារម្មណ៍តានតឹងស្រែកកំឡុងពេលសកម្មភាព និងនិយាយយ៉ាងទន់ភ្លន់កំឡុងពេលមានឆាកស្នេហា & # 160; ។ ជួរអារម្មណ៍ប្ដូរអត្ថបទទៅជារឿងអូឌីយ៉ូដែលទាក់ទាញ & # 160; ។
ការផ្សព្វផ្សាយពាណិជ្ជកម្ម
សំឡេងរំភើបសម្រាប់ការចាប់ផ្តើមផលិតផល, សំឡេងក្តៅសម្រាប់មតិយោបល់, សំឡេងបន្ទាន់សម្រាប់ផ្តល់ជូនពេលវេលាកំណត់. អារម្មណ៍ត្រឹមត្រូវជំរុញការចូលរួមនិងការបម្លែង.
ការនិយាយដែលមានអារម្មណ៍តាមរយៈ APIName
បង្កើតការនិយាយដោយប្រើការត្រួតពិនិត្យអារម្មណ៍ជាក់លាក់
import requests
# Bark supports inline emotion cues
emotions = {
"happy": "This is absolutely wonderful! [laughs] I love it!",
"sad": "[sighs] I wish things could have been different...",
"angry": "I told you not to do that! This is unacceptable!",
"whisper": "[whispers] Can you keep a secret?",
"excited": "Oh my gosh! [gasps] We won! We actually won!"
}
for emotion, text in emotions.items():
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": text,
"model": "bark",
"voice": "v2/en_speaker_6",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open(f"emotion_{emotion}.wav", "wb") as f:
f.write(response.content)
សំឡេងអារម្មណ៍នៅកម្រិតនីមួយៗ
ទោះបីជាម៉ូដែលឥតគិតថ្លៃដូចជា Kokoro ផ្ដល់នូវភាពខុសគ្នានៃអារម្មណ៍ធម្មជាតិពីការដាក់វណ្ណយុត្ត និងបរិបទក៏ដោយ។
កម្រិតទំនេរ
$0
15,000 តួអក្សរនៅលើចុះឈ្មោះ
- អារម្មណ៍ដែលដឹងបរិបទរបស់ Kokoro
- ទំនុកតម្កើងធម្មជាតិពីវណ្ណយុត្ត
- ការដោះស្រាយសំណួរ និងសញ្ញាអរគុណ
កម្មវិធីចាប់ផ្ដើម
$9
500 ក្រេឌីត / ខែ
- Bark ជាមួយបែបផែនសំឡេង និងការយំ
- ស្លាកអារម្មណ៍ Orpheus
- គ្មានអារម្មណ៍ការសន្ទនា
ជំនាញ
$29
2000 ក្រេឌីត / ខែ
- ការសន្ទនា Sesame CSM
- ម៉ូដែលកន្សោមទាំងអស់
- ការក្លូនសំឡេងជាមួយអារម្មណ៍
សំណួរដែលសួរញឹកញាប់
សំណួរទូទៅអំពីអត្ថបទអារម្មណ៍ទៅការនិយាយ
តើយើងអាចធ្វើអ្វីបានប្រសើរឡើង & # 160;? មតិយោបល់របស់អ្នកជួយយើងជួសជុលបញ្ហា & # 160; ។
ផ្ដល់អារម្មណ៍ពិតនៃសំឡេង AI របស់អ្នក
សប្បាយរីករាយ, សោកសៅ, ខឹង, whispering - បង្កើតការនិយាយដែលពិតជាផ្ដល់អារម្មណ៍. ព្យាយាមម៉ូដែល TTS អារម្មណ៍ដោយឥតគិតថ្លៃ.