ຂໍ້ຄວາມເປັນການເວົ້າດ້ວຍອາລົມName
ສ້າງຄໍາເວົ້າທີ່ມີການສະແດງອາລົມທີ່ແທ້ຈິງ - ມີຄວາມສຸກ, ເສົ້າໃຈ, ໂກດແຄ້ນ, ກະຕືລືລົ້ນ, ຮ້ອງໄຫ້, ແລະອື່ນໆ. ແບບຈໍາລອງ AI ຂອງພວກເຮົາໄປນອກເໜືອຈາກການເລົ່າເລື່ອງເພື່ອນໍາສະເຫນີຄໍາເວົ້າທີ່ນໍາສະເຫນີຄວາມຮູ້ສຶກທີ່ແທ້ຈິງ. ສົມບູນແບບສໍາລັບການເລົ່າເລື່ອງ, ການສົນທະນາເກມ, ເນື້ອໃນການຕະຫຼາດ, ແລະໂຄງການໃດກໍ່ຕາມບ່ອນທີ່ສຽງມີຄວາມສໍາຄັນຫຼາຍເທົ່າກັບຄໍາເວົ້າ.
ທົດລອງໃຊ້ມັນດຽວນີ້
ຄຸນສົມບັດ Emotional TTS
ສຽງ AI ທີ່ສະແດງໃຫ້ເຫັນອາລົມ ແລະ ຄວາມຮູ້ສຶກທີ່ແທ້ຈິງ
ສັນຍາລັກອາລົມຫຼາຍຢ່າງ
ສ້າງການເວົ້າດ້ວຍສຽງອາລົມທີ່ແຕກຕ່າງກັນ - ມີຄວາມສຸກ, ເສົ້າ, ໂກດແຄ້ນ, ຢ້ານ, ແປກໃຈ, ບໍ່ພໍໃຈ ແລະ ບໍ່ມີອາລົມ. ທຸກໆອາລົມປ່ຽນຄວາມສູງ, ຄວາມໄວ ແລະ ສຽງຂອງສຽງຂອງມັນ.
ຄວບຄຸມຄວາມເຂັ້ມ
ປັບຄວາມແຮງຂອງອາລົມຈາກເລັກນ້ອຍໄປຫາໃຫຍ່. ສຽງຍິ້ມເລັກນ້ອຍຫຼືຄວາມກະຕືລືລົ້ນທີ່ເຕັມໄປດ້ວຍຄວາມສຸກ - ປັບຄວາມຮູ້ສຶກໃຫ້ເໝາະສົມກັບເນື້ອຫາຂອງທ່ານ.
ສຽງທຳມະຊາດ
ສະພາບອາລົມມີຜົນຕໍ່ແບບຟອມການເວົ້າທັງໝົດ, ບໍ່ແມ່ນພຽງແຕ່ສຽງເທົ່ານັ້ນ. ການເວົ້າທີ່ເສົ້າໃຈຈະຊ້າລົງເມື່ອສຽງຫຼຸດລົງ. ການເວົ້າທີ່ຕື່ນເຕັ້ນຈະໄວຂຶ້ນເມື່ອສຽງຂຶ້ນ. ສຽງທີ່ເວົ້າອອກມາເບິ່ງຄືເປັນທຳມະຊາດຫຼາຍ.
ຮ້ອງໄຫ້ ແລະ ຮ້ອງໄຫ້
ນອກເໜືອຈາກຄວາມຮູ້ສຶກທີ່ປົກກະຕິແລ້ວ, ສ້າງການເວົ້າທີ່ອ່ອນໂຍນ ສຳ ລັບເນື້ອຫາທີ່ໃກ້ຊິດຫຼື ASMR, ແລະ ການສົ່ງຂໍ້ຄວາມທີ່ເນັ້ນ ໜັກ ສໍາລັບຊ່ວງເວລາທີ່ ໜ້າຕື່ນເຕັ້ນແລະການປະກາດ.
ຕົວອັກສອນທີ່ຮູ້ສະພາບແວດລ້ອມ
ບາງແບບຈໍາລອງກວດພົບສະພາບແວດລ້ອມຂອງອາລົມຈາກຂໍ້ຄວາມໂດຍອັດຕະໂນມັດ. ຄໍາຖາມໄດ້ຮັບຄວາມສູງຂຶ້ນຂອງສຽງ, ຄໍາຮ້ອງຂໍໄດ້ຮັບຄວາມສໍາຄັນ, ແລະລາຍຊື່ໄດ້ຮັບເຖິງແມ່ນວ່າຈະກ້າວ.
ຕົວຄວບຄຸມທີ່ມີຮອຍຫ່ຽວລະອຽດ
ພາລາມິເຕີລະດັບສູງອະນຸຍາດໃຫ້ທ່ານຄວບຄຸມລະດັບສຽງ, ອັດຕາການເວົ້າ, ລະດັບພະລັງງານ, ແລະ breathiness ຢ່າງເປັນເອກະລາດສຳລັບໂປຼໄຟລ໌ອາລົມທີ່ໄດ້ກຳນົດໄວ້ລ່ວງໜ້າ.
ແບບຢ່າງທີ່ດີທີ່ສຸດ ສຳ ລັບ ຄຳ ເວົ້າທີ່ເຕັມໄປດ້ວຍອາລົມ
ແບບທີ່ດີທີ່ສຸດໃນການສົ່ງຄວາມຮູ້ສຶກ ແລະ ການສະແດງອອກ
Chatterbox
Premium
State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.
ດີທີ່ສຸດ ສຳ ລັບ: ການຄວບຄຸມອາລົມທີ່ດີທີ່ສຸດ - ປັບຄວາມແຮງຂອງອາລົມດ້ວຍການກັ່ນຕອງສຽງ
ພະຍາຍາມ Chatterbox
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
ດີທີ່ສຸດ ສຳ ລັບ: ສຽງຫົວ, ຮ້ອງ, ຮ້ອງໄຫ້ ແລະ ສຽງອາລົມທີ່ບໍ່ເວົ້າ
ພະຍາຍາມ Bark
Orpheus
Standard
Human-level emotional TTS model trained on 100K hours of speech data.
ດີທີ່ສຸດ ສຳ ລັບ: ລະດັບຄວາມຮູ້ສຶກຂອງຄົນໄດ້ຮັບການຝຶກອົບຮົມໃນເວລາ 100K ຊົ່ວໂມງຂອງການເວົ້າທີ່ສະແດງອອກ
ພະຍາຍາມ Orpheus
Dia TTS
Standard
Multi-speaker dialog generation model that creates natural conversations between speakers.
ດີທີ່ສຸດ ສຳ ລັບ: ການສົນທະນາທີ່ມີອາລົມລະຫວ່າງຕົວລະຄອນດ້ວຍການປ່ຽນລຳດັບແບບທຳມະຊາດ
ພະຍາຍາມ Dia TTS
Parler TTS
Standard
Describe the voice you want in natural language and Parler generates matching speech.
ດີທີ່ສຸດ ສຳ ລັບ: ອະທິບາຍການສົ່ງອອກຄວາມຮູ້ສຶກໃນພາສາອັງກິດງ່າຍໆ ສຳ ລັບການຄວບຄຸມແບບງ່າຍດາຍ
ພະຍາຍາມ Parler TTS
CosyVoice 2
Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
ດີທີ່ສຸດ ສຳ ລັບ: ການຄວບຄຸມຄວາມຮູ້ສຶກທີ່ມີເນື້ອໃນດີພ້ອມກັບການຖ່າຍທອດສຳລັບໂປແກຼມເວລາຈິງ
ພະຍາຍາມ CosyVoice 2ວິທີການສ້າງການເວົ້າທີ່ມີອາລົມ
ເພີ່ມອາລົມເຂົ້າໃນການເວົ້າຂອງ AI ພາຍໃນສອງວິນາທີ
សរសេរຂໍ້ຄວາມຂອງທ່ານ
ໃສ່ຂໍ້ຄວາມທີ່ທ່ານຢາກໃຫ້ເວົ້າດ້ວຍອາລົມໃຈ & # 160; ។ ເນື້ອໃນເອງສາມາດມີອິດທິພົນຕໍ່ການສົ່ງຂໍ້ຄວາມດ້ວຍອາລົມໃຈ - ຄໍາອະທິບາຍ, ຄໍາຖາມ ແລະ ຂໍ້ຄວາມທີ່ດຶງດູດໃຈຈະນໍາພາການສະແດງອອກຕາມທໍາມະຊາດ & # 160; ។
ເລືອກອາລົມ
ເລືອກຈາກຄວາມສຸກ, ຄວາມໂສກເສົ້າ, ຄວາມໂກດແຄ້ນ, ຄວາມຢ້ານກົວ, ຄວາມຕື່ນເຕັ້ນ, ການຊັກຊວນ, ຫຼື ຄວາມສະເໝີພາບ. ຕົວແບບບາງຢ່າງສະເໜີໃຫ້ມີອາລົມເພີ່ມເຕີມເຊັ່ນ: ຄວາມໂກດແຄ້ນ, ຄວາມອ່ອນໂຍນ, ຫຼື ຄວາມມີອຳນາດ.
ປັບຄວາມເຂັ້ມ
ປັບຄວາມເຂັ້ມແຂງຂອງອາລົມໃຫ້ເໝາະສົມກັບຄວາມຕ້ອງການຂອງທ່ານ. ຄວາມເຂັ້ມຕ່ຳເພີ່ມສີທີ່ລະອຽດອ່ອນຂຶ້ນ. ຄວາມເຂັ້ມສູງສ້າງຄວາມຮູ້ສຶກທີ່ມີຄວາມໝາຍຫຼາຍຂຶ້ນ ແລະ ລະອຽດຂຶ້ນ.
ສ້າງ ແລະ ປັບປຸງ
ສ້າງການເວົ້າ ແລະ ຟັງ. ປັບຄວາມເຂັ້ມແຂງ ຫຼື ແບບຈົນກວ່າການສົ່ງອອກຈະເໝາະສົມກັບຄວາມຄິດຂອງທ່ານ. ດາວໂຫລດສຽງສຸດທ້າຍເປັນ MP3 ຫຼື WAV.
ຄວາມສາມາດຂອງແບບ ຈຳ ລອງ TTS ທີ່ມີອາລົມ
ວິທີທີ່ໂມເດວຕ່າງໆຈັດການກັບການສະແດງອາລົມ
Bark - ຜົນສະທ້ອນສຽງ ແລະ ການສະແດງອອກ
Bark ມີຄວາມສາມາດທີ່ເປັນເອກະລັກໃນການສ້າງສຽງທີ່ບໍ່ເປັນການເວົ້າຮ່ວມກັບການເວົ້າ. ໃຊ້ຂໍ້ຄວາມແນະນຳເຊັ່ນ [ຍິ້ມ], [ຍິ້ມ], [ຍິ້ມ], ຫຼື [ປິດປາກ] ໂດຍກົງໃນຂໍ້ຄວາມຂອງທ່ານເພື່ອກະຕຸ້ນການຕອບໂຕ້ທາງອາລົມ. Bark ຍັງສາມາດຮ້ອງເພງ, ຮ້ອງໄຫ້, ແລະ ສ້າງການເວົ້າດ້ວຍການປ່ຽນຄວາມຮູ້ສຶກທີ່ແຂງແຮງໄດ້ອີກດ້ວຍ.
- ຫົວຍິ້ມ:
- Sadness: "[sighs] I never thought it would end like this."
- ແປກໃຈ: \
- ການຮ້ອງເພງ: ສຽງດົນຕີ ແລະ ດົນຕີ
ແທັກອາລົມ
Orpheus (ສ້າງຂຶ້ນໃນ Llama 3.2) ສະໜັບສະໜູນການຄວບຄຸມອາລົມຢ່າງຊັດເຈນຜ່ານການວາງស្លាກໄວ້ໃນຕົວເລກທີ່ມີອາລົມເພື່ອຄວບຄຸມການສົ່ງອອກ: < happy >, < sad >, < angry >, < surprised >, < disgusted >. ລວມອາລົມເຂົ້າກັນໃນການສ້າງແບບດຽວກັນເພື່ອໃຫ້ມີແຮງດັນແຮງດັນປ່ຽນໄປຕາມສຽງທີ່ປ່ຽນໄປ.
ສຳ ລັບການສົ່ງທີ່ມີຄວາມສຸກ, ມີຄວາມຫວັງສູງ - < sad > ສຳ ລັບສຽງທີ່ຊົ່ວຮ້າຍ, ມືດມົວ
ສຳ ລັບການເວົ້າທີ່ແຮງກ້າ ແລະ ແຮງກ້າ ສຳ ລັບການຕອບໂຕ້ທີ່ຕົກໃຈ, ຕົກໃຈ
Dia - ພາລາມິເຕີຫຼາຍໂຕ
Dia ມີຄວາມຊ່ຽວຊານໃນການເວົ້າສົນທະນາກັບຜູ້ເວົ້າສອງຄົນ. ມັນເປັນທໍາມະຊາດທີ່ຈັດການກັບ turn-taking, ການຢຸດເຊົາ, ແລະແຮງໂນ້ມຖ່ວງຂອງອາລົມຂອງການສົນທະນາທີ່ແທ້ຈິງ. ດີສໍາລັບການຜະລິດການສົນທະນາ, ການສໍາພາດ, ຫຼືເນື້ອໃນແບບ podcast ບ່ອນທີ່ຄວາມຮູ້ສຶກ interplay ສໍາຄັນ.
- ແບບໂຕ້ຕອບແບບທໍາມະຊາດ
- ຂໍ້ຄວາມສອງສຽງທີ່ມີສຽງຕ່າງກັນName
- ປະຕິກິລິຍາທາງອາລົມລະຫວ່າງຜູ້ເວົ້າ
- ສຽງທີ່ບໍ່ເວົ້າອອກມາ (ຫົວຍິ້ມ, ສົງໄສ)
Sesame CSM - ສະພາບແວດລ້ອມການສົນທະນາ
Sesame CSM (Conversational Speech Model) ຖືກອອກແບບມາເພື່ອຜະລິດການເວົ້າທີ່ຟັງຄືການສົນທະນາທໍາມະຊາດ, ບໍ່ແມ່ນການອ່ານອອກສຽງ. ມັນຈັດການກັບຄວາມຮູ້ສຶກທີ່ເລິກເຊິ່ງຂອງຄໍາເວົ້າທີ່ແທ້ຈິງ - ພັກຜ່ອນສໍາລັບຄວາມຄິດ, ຍົກໃຫ້ເຫັນຄໍາສໍາຄັນ, ເພີ່ມຂື້ນ intonation ສໍາລັບຄໍາຖາມ, ແລະຄວາມອົບອຸ່ນໃນສະພາບແວດລ້ອມທີ່ເປັນມິດ.
- ການຈັດສົ່ງຄວາມຮູ້ສຶກທີ່ຮູ້ສະພາບແວດລ້ອມ
- ການສົນທະນາແບບທໍາມະຊາດ
- ການເນັ້ນໜັກທີ່ເໝາະສົມ ແລະ ຄວາມໄວ
- ອົບອຸ່ນ, ຄຸນນະພາບຄືກັບມະນຸດ
ເມື່ອອາລົມເປັນສິ່ງສຳຄັນ
ການນໍາໃຊ້ກໍລະນີບ່ອນທີ່ TTS ຄວາມຮູ້ສຶກເຮັດໃຫ້ມີຄວາມແຕກຕ່າງທີ່ແທ້ຈິງ
ប្រអប់ເກມ
NPC ທີ່ເຮັດໃຫ້ຮູ້ສຶກວ່າເປັນຄົນທີ່ໜ້າຢ້ານ, ເປັນຄົນຮ້າຍທີ່ໜ້າຢ້ານ, ເປັນຄົນຮັກທີ່ໜ້າຮັກ. Emotional TTS ເຮັດໃຫ້ຕົວລະຄອນເກມມີຄວາມເຊື່ອຖື ແລະ ຫຼົງໄຫຼ.
ການເວົ້າຂອງປຶ້ມສຽງ
ຜູ້ບອກເລື່ອງທີ່ຊັກຊວນໃນຊ່ວງເວລາທີ່ເຄັ່ງຕຶງ, ຮ້ອງຂຶ້ນໃນຊ່ວງການເຄື່ອນໄຫວ, ແລະ ເວົ້າຢ່າງອ່ອນໂຍນໃນຊ່ວງເວລາທີ່ຮັກແພງ. ລະດັບຄວາມຮູ້ສຶກປ່ຽນຂໍ້ຄວາມເປັນເລື່ອງສຽງທີ່ດຶງດູດໃຈ.
ການຕະຫຼາດ & amp; ການໂຄສະນາ
ສຽງຕື່ນເຕັ້ນສໍາລັບການເປີດຕົວຜະລິດຕະພັນ, ສຽງອົບອຸ່ນສໍາລັບຄໍາແນະນໍາ, ສຽງຮີບດ່ວນສໍາລັບການສະເຫນີເວລາຈໍາກັດ.
ເວົ້າດ້ວຍອາລົມຜ່ານ API
ສ້າງການເວົ້າດ້ວຍການຄວບຄຸມອາລົມທີ່ຊັດເຈນ
import requests
# Bark supports inline emotion cues
emotions = {
"happy": "This is absolutely wonderful! [laughs] I love it!",
"sad": "[sighs] I wish things could have been different...",
"angry": "I told you not to do that! This is unacceptable!",
"whisper": "[whispers] Can you keep a secret?",
"excited": "Oh my gosh! [gasps] We won! We actually won!"
}
for emotion, text in emotions.items():
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": text,
"model": "bark",
"voice": "v2/en_speaker_6",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open(f"emotion_{emotion}.wav", "wb") as f:
f.write(response.content)
ສຽງທີ່ມີອາລົມໃນທຸກລະດັບ
ເຖິງວ່າຈະມີແບບຟອມຟຣີເຊັ່ນ Kokoro ສົ່ງຄວາມຮູ້ສຶກທີ່ແຕກຕ່າງຈາກຕົວໜັງສື ແລະ ສະພາບການ.
ຊັ້ນຟຣີ
$0
15,000 ຕົວອັກສອນກ່ຽວກັບການລົງທະບຽນ
- Kokoro ຮັບຮູ້ສະພາບແວດລ້ອມຂອງອາລົມ
- ສຽງທຳມະຊາດຈາກການວາງຕົວໜັງສື
- ການຈັດການຄຳຖາມ ແລະ ສັນຍາລັກອັກສອນ
ຕົວເລີ່ມ
$9
500 ຄະແນນ/ເດືອນ
- ຮ້ອງດ້ວຍສຽງ ແລະ ສຽງຫົວ
- ແທັກອາລົມ Orpheus
- ບໍ່ມີອາລົມໃນການສົນທະນາ
ມືອາຊີບ
$29
2,000,000 ຕົວອັກສອນ/ເດືອນ
- ການສົນທະນາ Sesame CSM
- ຕົວແບບການສະແດງອອກທັງໝົດ
- ການກັ່ນຕອງສຽງດ້ວຍອາລົມ
ຄໍາຖາມທີ່ຖາມເລື້ອຍໆ
ຄໍາຖາມທົ່ວໄປ ກ່ຽວກັບການແປຂໍ້ຄວາມເປັນຄຳເວົ້າName
ພວກເຮົາສາມາດປັບປຸງໄດ້ແນວໃດ? ຄໍາຄິດເຫັນຂອງທ່ານຊ່ວຍພວກເຮົາແກ້ໄຂບັນຫາ.
ໃຫ້ສຽງ AI ຂອງທ່ານມີອາລົມທີ່ແທ້ຈິງ
ມີຄວາມສຸກ, ໂສກເສົ້າ, ໂກດແຄ້ນ, ສັ່ນສະເທືອນ - ສ້າງຄໍາເວົ້າທີ່ນໍາສະເຫນີຄວາມຮູ້ສຶກຢ່າງແທ້ຈິງ. ທົດລອງແບບ TTS ທີ່ມີອາລົມຟຣີ.