හැඟීම් සහිත පෙළ සිට කථාව වෙතName

සැබෑ මානසික ප්රකාශන සමග කථාව ජනනය - සතුටින්, දුකෙන්, කෝපයෙන්, උද්දාමයෙන්, මුමුණමින්, සහ තවත්. අපේ AI ආකෘති සැබෑ හැඟීම ප්රකාශ කරන කථාව ලබා දීම සඳහා පැතලි කථාව ඉක්මවා යයි. කතාවක් සඳහා පරිපූර්ණ, ක්රීඩා සංවාදය, අලෙවිකරණ අන්තර්ගතය, හා වචන තරම් කටහඬ වැදගත් වන ඕනෑම ව්යාපෘතියක්.

සතුටින් දැන් තරහයි කම්පනයට පත්වුණා. මුමුණන්න

දැන් උත්සාහ කරන්න

Kokoro සමග නිදහස්, Piper, VITS, MeloTTS
ඔබගේ ජනනය කරන ලද ශ්‍රව්‍ය මෙතනින් දිස්වේ
ජනනය කලේ
බාගත කිරීම්
TTS.ai ආදරය? ඔබේ මිතුරන්ට කියන්න!

හැඟීම් TTS විශේෂාංග

සැබෑ හැඟීම් හා වර්ණය ප්රකාශ කරන AI හඬ

බහු ආකල්ප

සුවිශේෂී හැඟීම් ශබ්ද සමග කථාව ජනනය - සතුටින්, දුක, තරහ, බිය, පුදුම, විකාර, සහ ස්වාධීන. එක් එක් හැඟීම් වෙනස්කම් පන්දු, වේගය, හා ශබ්ද.

තීව්‍රතා පාලකය

සංවේදී සිට නාටකාකාර හැඟීම් තීව්රතාවය සකස් කරන්න. හඬ හෝ පූර්ණ ප්රීතිමත් උනන්දුවක් සුළු සිනහවක් - ඔබේ අන්තර්ගතය ගැලපෙන හැඟීම් ප්රකාශය හොඳින් සකස්.

ස්වභාවික ව්‍යංජන

හැඟීම් මුළු කථා රටාව බලපායි, හුදෙක් ටෝන් නොවේ. දුක්ඛිත කථාව වැටෙන intonation සමග මන්දගාමී වේ. ෙසතුටු කථාව ඉහළ යන පන්දු සමග වේගවත් වේ. මෙම prosody ස්වභාවික දැනෙනවා.

කොඳුරමින් හා කෑගසමින්

සම්මත හැඟීම් ඉක්මවා, ආදර හෝ ASMR අන්තර්ගතය සඳහා මුමුණමින් කථාව ජනනය, හා නාට්‍යමය මොහොතක් හෝ නිවේදන සඳහා තීව්‍ර බෙදාහැරීම.

සන්දර්භය- දැනෙන ප්‍රකාශනය

සමහර ආකෘති ස්වයංක්රීයව පෙළ සිට මානසික පසුබිම හඳුනා. ප්රශ්න ඉහළ යන තේරුම් ගැනීමක් ලබා, විලාප අවධාරණය ලබා, සහ ලැයිස්තු පවා pacing ලබා.

හොඳින් කැටයම් කළ පාලකය

උසස් පරාමිතීන් ඔබ පන්දු පරාසය පාලනය ඉඩ, කතා අනුපාතය, බලශක්ති මට්ටම, සහ breathiness ස්වාධීනව අභිරුචි පෙරනිමි හැඟීම් පැතිකඩ සඳහා.

හැඟීම් කතා සඳහා හොඳම ආකෘති

හැඟීම් හා expressionality ගෙන යාම දී විශිෂ්ට බව ආකෘති

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: හොඳම හැඟීම් පාලනය - හඬ ක්ලෝන සමඟ වෙනස් කළ හැඟීම් තීව්රතාව

උත්සහ කරන්න Chatterbox

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

සඳහා හොඳම: ස්වාභාවික සිනහව, සිනා, හඬමින්, හා වචන නොවන හැඟීම් ශබ්ද

උත්සහ කරන්න Bark

OrpheusOrpheus

Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Medium 5/5

සඳහා හොඳම: මානව මට්ටමේ හැඟීම් පරාසය 100K පැය ප්රකාශනාත්මක කථා පුහුණු

උත්සහ කරන්න Orpheus

Dia TTSDia TTS

Standard

Multi-speaker dialog generation model that creates natural conversations between speakers.

Medium 5/5

සඳහා හොඳම: ස්වභාවික ආපසු ගැනීම සමඟ චරිත අතර හැඟීම් සංවාදය

උත්සහ කරන්න Dia TTS

Parler TTSParler TTS

Standard

Describe the voice you want in natural language and Parler generates matching speech.

Medium 4/5

සඳහා හොඳම: බුද්ධිමත් පාලනය සඳහා සරල ඉංග්රීසි හැඟීම් බෙදාහැරීම විස්තර

උත්සහ කරන්න Parler TTS

CosyVoice 2CosyVoice 2

Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Medium 5/5 හඬ ක්ලෝන කිරීම

සඳහා හොඳම: තත්කාලීන යෙදුම් සඳහා ශ් රව්ය සමඟ සිහින්-අස්වැන්න හැඟීම් පාලනය

උත්සහ කරන්න CosyVoice 2

හැඟීම්බර කථාව ජනනය කරන ආකාරය

තත්පර AI කථාව හැඟීම් එකතු කරන්න

1

ඔබේ පෙළ ලියන්න

ඔබ මානසිකව කතා කිරීමට අවශ්ය පෙළ ඇතුලත් කරන්න. අන්තර්ගතය මානසික බෙදාහැරීම බලපෑම් කළ හැක - විලාප, ප්රශ්න, හා නාටකාකාර පෙළ ස්වභාවිකව ප්රකාශය මග පෙන්වීම.

2

හැඟීම් තෝරන්න

සතුටින් තෝරන්න, දුක, තරහ, බිය, උද්දාමයට පත්, මුමුණමින්, හෝ ස්වාධීන. ඇතැම් ආකෘති විහිළුවක් වැනි අමතර හැඟීම් ඉදිරිපත්, තද, හෝ බලවත්.

3

තීව්‍රතාව සකසන්න

අඩු තීව්රතාවය සරල වර්ණ එකතු. ඉහළ තීව්රතාවය නාටකාකාර නිෂ්පාදනය, නොසැලකිලිමත් හැඟීම් බෙදාහැරීම.

4

ජනනය කරන්න සහ පිරිපහදු කරන්න

කතා ජනනය සහ සවන්. බෙදාහැරීම ඔබේ දැක්ම ගැලපෙන තෙක් හැඟීම් වර්ගය, තීව්රතාව, හෝ ආකෘතිය සකස් කරන්න. MP3 හෝ WAV අවසන් ශ්රව්ය බාගත.

හැඟීම් TTS ආකෘති හැකියාවන්

විවිධ ආකෘති හැඟීම් ප්රකාශ කිරීම හැසිරවීමේ ආකාරය

බර්ක් - ප්රකාශාත්මක හා ශබ්ද බලපෑම්

බර්ක් කතා සමග කතා නොවන ශබ්ද ජනනය කිරීමට සුවිශේෂී හැකියාවක් ඇත. [හිනා] වැනි පෙළ ඉල්ලීම් භාවිතා කරන්න, [සිනා], [gasps], හෝ [තොල් පැහැදිලි] හැඟීම් ප්රතිචාර ඇති කිරීමට ඔබේ පෙළ සෘජුවම. බර්ක් ද ගායනා කළ හැක, මුමුණන්න, හා ශක්තිමත් හැඟීම් ආකර්ෂණය සමග කතා නිෂ්පාදනය.

  • හිනාව:
  • දුක:
  • පුදුමයක්:
  • ගායනය: සංගීත ශබ්ද සහ ගීතය

Orpheus — හැඟීම්

Orpheus (Llama මත ඉදි 3.2) ටැග් හරහා පැහැදිලි හැඟීම් පාලනය සහාය. <සතුටින්>, <කණගාටුයි>, <කෝප>, <පුදුමයට පත්>, <අප්රසන්න>: භාරදීම පාලනය කිරීමට හැඟීම් සලකුණු පෙළ වෑල්ඩින්. ගතික සඳහා තනි පරම්පරාව තුළ හැඟීම් මිශ්ර, මාරු කටහඬ.

  • <සතුටින්> සතුටු, සතුටින් භාරදීම සඳහා
  • melancholic, අඳුරු කටහඬ සඳහා
  • <කෝප> සඳහා බලවත්, දැඩි කථාව
  • <පුදුම> කම්පනයට පත්, පුදුම ප්රතිචාර සඳහා

Dia - බහු- කථික සංවාදය

ඩියා කථිකයන් දෙදෙනෙකු සමඟ සංවාදාත්මක කතාබහ විශේෂඥ. එය ස්වභාවිකව ආපසු ගැනීම, බාධා කිරීම් සහ සැබෑ සංවාදවල හැඟීම් ගතිකයන් පාලනය කරයි. සංවාද දර්ශන ජනනය කිරීම සඳහා මහා, සම්මුඛ සාකච්ඡා, හෝ හැඟීම් අන්තර්ක්රියාකාරී කරුණු ඇති පොඩ්කාස්ට්-ශෛලිය අන්තර්ගතය.

  • ස්වභාවික සංවාදාත්මක ගතිකයන්
  • වෙනස් හඬවල් සමග කථානායක දෙදෙනා සංවාදය
  • කථිකයන් අතර හැඟීම් ප්රතිචාර
  • වචන නොවන ශබ්ද (සිනහව, පසුබට වීම)

තක්කාලි CSM — සංවාදාත්මක සන්දර්භය

තිප්පිලි CSM (සංවාදාත්මක කථාව ආකෘතිය) ස්වභාවික සංවාදයක් මෙන් ශබ්ද වන කතා නිෂ්පාදනය කිරීමට නිර්මාණය කර ඇත, හඬින් කියවීම නොවේ. එය සැබෑ කථාව මනෝභාවය සඳහා විවේක, ප්රධාන වචන මත අවධානය යොමු, ප්රශ්න සඳහා ඉහළ යන intonation, සහ මිත්රාසහිත සන්දර්භයන් තුළ උණුසුම - සුන්දර හැඟීම් ලකුණු හැසිරවීම.

  • සන්දර්භය-දැනුවත් හැඟීම් බෙදාහැරීම
  • ස්වභාවික සංවාදාත්මක රිද්මය
  • සුදුසු අවධාරණය හා pacing
  • උණුසුම්, මිනිස්-සමාන ගුණාත්මක

හැඟීම් වැදගත් වන විට

චිත්තවේගීය TTS සැබෑ වෙනසක් කරන තැන නඩු භාවිතා

ක්‍රීඩා සංවාදය

ඇත්තටම බිය ශබ්ද කරන NPC, සැබෑ තර්ජනයක් සමග දුෂ්ටයා, උණුසුම සමග සහකරු. මානසික TTS ක්රීඩාව චරිත විශ්වාසනීය හා immersive කරයි.

ශ්‍රව්‍ය පොත් විස්තරය

උණුසුම් මොහොතක් අතරතුර මුමුණන බව කථානායක, ක්රියාකාරකම් අතරතුර කෑගසයි, හා ආදරණීය දර්ශන අතරතුර මෘදු කතා. මානසික පරාසයක් බලපෑම් ශ්රව්ය කතා බවට පෙළ හරවයි.

අලෙවිකරණය සහ දැන්වීම්

නිෂ්පාදන දියත් කිරීම් සඳහා උණුසුම් හඬක්, සාක්ෂි සඳහා උණුසුම් හඬක්, සීමිත කාලයක් සඳහා හදිසි හඬක්.

API හරහා මානසික කථාව

පැහැදිලි හැඟීම් පාලනය සමග කථාව ජනනය කරන්න

Python - බර්ක් සමග හැඟීම් TTS REST API
import requests

# Bark supports inline emotion cues
emotions = {
    "happy": "This is absolutely wonderful! [laughs] I love it!",
    "sad": "[sighs] I wish things could have been different...",
    "angry": "I told you not to do that! This is unacceptable!",
    "whisper": "[whispers] Can you keep a secret?",
    "excited": "Oh my gosh! [gasps] We won! We actually won!"
}

for emotion, text in emotions.items():
    response = requests.post("https://api.tts.ai/v1/tts", json={
        "text": text,
        "model": "bark",
        "voice": "v2/en_speaker_6",
        "format": "wav"
    }, headers={"Authorization": "Bearer YOUR_API_KEY"})

    with open(f"emotion_{emotion}.wav", "wb") as f:
        f.write(response.content)

සෑම තලයේ මානසික හඬ

ෆ්‍රොයිඩ්ට අනුව මනස යනු මනෝවිද්‍යාවේ හා මනෝවිද්‍යාව පිළිබඳ න්‍යායවල සංකලනයකි.

නිදහස් ස්ථරය

$0

ලියාපදිංචිය මත අක්ෂර 15,000

  • Kokoro සන්දර්භය-සිහිපත් හැඟීම
  • විරාම ලකුණු සිට ස්වභාවික prosody
  • ප්‍රශ්ණය හා විලාප හැසිරවීම

ආරම්භකය

$9

500 ණය / මාස

  • ශබ්ද බලපෑම් සහ හිනාව සමග බර්ක්
  • Orpheus හැඟීම් ටැග
  • ඔහු සංවාදාත්මක හැඟීමක්

ප්‍රො

$29

2000 ණය / මාස

  • තක්කාලි CSM සංවාදාත්මක
  • සියලුම නිරූපණ ආකෘති
  • හැඟීම් සමග හඬ ක්ලෝන
සම්පූර්ණ මිල දර්ශනය

නිතර අසන ප්රශ්න

කතා කිරීමට හැඟීම් පෙළ ගැන පොදු ප්රශ්න

Chatterbox, Bark, Orpheus, Dia, Parler, CosyVoice2සහ IndexTTS-2 සියළුම හැඟීම් ප්රකාශන සහාය. Chatterbox වඩාත් හොඳින් ධාන්ය තීව්රතාව පාලනය ලබා දෙයි. Bark සිනහව හා සිනා වැනි වඩාත් ස්වභාවික වචන නොවන ශබ්ද නිපදවයි.

ආකෘති ජනනය කරන ලද කථාව වෙනස් කිරීමට හැඟීම් embeddings හෝ කොන්දේසි සංඥා භාවිතා. මෙම පන්දු කෝණය බලපායි, කතා අනුපාතය, ශක්ති මට්ටම්, හා හඬ ගුණාත්මක. ප්රතිඵලය ස්වභාවිකව පමණක් පෙළ පැතලි කියවීම වෙනුවට නිශ්චිත හැඟීම් ගෙන යන බව කථාව වේ.

ඔව්. Bark සහ Chatterbox whispering සහාය. Bark ආදානයේ "[whispers]" වැනි පෙළ සංඥා වලින් whispered කථාව ජනනය කරයි. Chatterbox එහි හැඟීම් පරාමිති හරහා සෘජු whisper පාලනය ඉඩ දෙයි. whispered ප්රතිදානය ස්වභාවික හා සමීප ශබ්ද.

ඔව්. බර්ක් වචන නොවන vocalizations සඳහා හොඳම ආකෘතිය වේ. එය ස්වභාවික ශබ්ද සිනහව උත්පාදනය කළ හැකි, හඬමින්, සිනා, gasping, හා පෙළ සූත්ර ඇතුළත් කිරීමෙන් අනෙකුත් ශබ්ද. මෙම ශබ්ද කතා කරන වචන සමග අඛණ්ඩව ඒකාබද්ධ.

Orpheus 100K පැය 100K ක ප් රකාශනාත්මක කථාවක් පුහුණු කර ඇති අතර මානව මට්ටමේ හැඟීම් ප්රකාශනය සාක්ෂාත් කර ගනී. Chatterbox සවන් දීමේ දී බොහෝ විට මානව පටිගත කිරීම් වලින් වෙන් කළ නොහැකි බව විශ්වාසදායක හැඟීම් බෙදා හැරීම නිෂ්පාදනය කරයි.

ඔව්. Chatterbox හා CosyVoice2අඛණ්ඩ තීව්රතාව ස්ලයිඩර්ස් ලබා. 20% කට හැඟීම් සකස් මනරම් වර්ණ හෝ 100% නාටකාකාර ප්රකාශය සඳහා. මෙම granularity ඔබ ඔබේ අන්තර්ගතය අවශ්ය නිවැරදි හැඟීම් කටහඬ ගැලපෙන ඉඩ.

සම්මත හැඟීම් සතුටින් ඇතුළත්, දුක, තරහ, බිය, පුදුම, විකාර, හා මධ්යස්ථ. සමහර ආකෘති මුමුණමින් එකතු, කෑගසමින්, sarcastic, තද, බලවත්, හා ආකර්ෂණීය. Parler ඔබට ස්වභාවික භාෂාවෙන් ඕනෑම හැඟීම් ගුණාත්මක විස්තර කිරීමට ඉඩ.

ඔව්. දෙකක්-අක්ෂර හැඟීම් සංවාදය සඳහා ඩය TTS භාවිතා, හෝ විවිධ හැඟීම් සැකසුම් සමග එක් එක් චරිතය වෙන් වෙන් වශයෙන් ජනනය. නාටකාකාර පොහොසත් සංවාද සඳහා තවත් එක් චරිතයක් හා අපහසුතාවයට ප්රීතිය වෙන්.

මානසික TTS කතාබහට සම්බන්ධ පැතලි කථාව පරිවර්තනය. වේදිකාව සන්දර්භය සඳහා හැඟීම් ගැලපෙන - තීව්ර මාර්ග බියජනක බෙදා හැරීම ලබා, සතුටු අවසන් උණුසුම් ප්රීතිය ලබා, නාටකාකාර මොහොතක් තීව්රතාව ලබා. එය සැලකිය යුතු ලෙස ගායක සහභාගීත්වය වැඩි දියුණු කරයි.

ඔව්. CosyVoice2සහ Sesame CSM සුදුසු මානසික ප්රතිචාර සමග සංවාදාත්මක AI සඳහා නිර්මාණය කර ඇත. පරිශීලක කනස්සල්ලට empathetically හෝ සතුටින් හොඳ පුවත් ප්රතිචාර දක්වන හඬ සහායක වඩා හොඳ පරිශීලක අත්දැකීමක් නිර්මාණය කරයි.

ඔව්. හැඟීම් ස්වභාවිකව බහු කථන පරාමිතීන් වෙනස්. සතුටු කථාව ඉහළ පන්දු වේගවත් කිරීමට නැඹුරු වේ. දුක්ඛිත කථාව අඩු පන්දු වේගවත් වේ. තරහ කථාව ශක්තිය හා තීව්රතාව වැඩි කර ඇත. මෙම වෙනස්කම් මිනිසා ස්වභාවිකව හැඟීම් ප්රකාශ කරන ආකාරය පිළිබිඹු.

බොහෝ ආකෘති පරම්පරාවකට එක් හැඟීමක් අයදුම් කරයි. මිශ්ර හැඟීම් සඳහා, විවිධ හැඟීම් සැකසුම් සමඟ කොටස් වෙන්කර ඇති අතර ඒවා එකට සම්බන්ධ කර ඇත. උදාහරණයක් ලෙස, වාක්‍යයක් ස්වාධීනව ආරම්භ කර පරම්පරා දෙකකට බෙදා එය කෝපයෙන් අවසන් කරන්න.
5.0/5 (1)

අපි වැඩි දියුණු කළ හැකි දේ? ඔබේ ප්රතිචාරය අපට ගැටළු විසඳීමට උපකාරී වේ.

ඔබේ AI හඬ සැබෑ හැඟීම දෙන්න

සතුටු, දුක, තරහ, මුමුණමින් - සැබවින්ම හැඟීම ගෙන යන බව කථාව ජනනය. මානසික TTS ආකෘති නිදහස් උත්සාහ කරන්න.