Sesame CSM

Speaker 1

ප්‍රමිතිය ඉංග්‍රීසි Neutral Sesame CSM

Speaker 1 යනු Sesame CSM පෙළ- සිට- කථාව ආකෘතිය මගින් බලගැන්වෙන neutral AI හඬකි. මෙම premium-tier හඬ ඉංග්‍රීසි කතාකරයි සහ චිත්‍රාගාරය- ගුණාත්මක කථා සංස්ලේෂණය ලබාදෙයි. මන්දගාමී නමුත් ඉහළ- විශ්වාසනීය ජනනය කිරීමේ වේගය සහ 5/5 ක ගුණාත්මක ශ්‍රේණිගත කිරීමක් සහිතව, Speaker 1 ai assistants, chatbots, conversational ai applications සඳහා සුදුසු වේ. මෙම ක්‍රමවේදය මඟින් ද්‍රව්‍යය ද්‍රවයක් බවට පත්කර එය ද්‍රවයක් ලෙසින් භාවිතා කිරීමට ඉඩ සලසයි. ඵලදායිතාවය: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය.

තවමත් ශ්‍රේණිගත කිරීම් නැත

Sesame CSMආකෘති තොරතුරු

ආකෘතිය Sesame CSM
සංවර්‍ධක Sesame
ප්‍රමිතිය
වේගය මන්දගාමී
බලපත්‍රය Apache 2.0
ක්ලෝන කිරීම නොමැත
සත්වයා වාරික (4 ණය / 1K අක්ෂර)
පරාමිතීන් 1B
ගෘහ නිර්මාණ ශිල්පය Llama Backbone + Audio Codec
වසර 2025

සඳහා හොඳම භාවිතය නඩු Speaker 1

මෙම හඬේ ලක්ෂණ මත පදනම්ව නිර්දේශිත යෙදුම්Name

ශ්‍රව්‍ය පොත් සහ කථා

ස්වභාවික ව්‍යවහාරය හා ප්‍රකාශනය සමග දිගු ආකෘති අන්තර්ගතය විස්තර කිරීමට Speaker 1 භාවිතා කරන්න.

වීඩියෝ කටහඬ

YouTube වීඩියෝ, දැන්වීම් සහ සමාජ මාධ්ය අන්තර්ගතයට වෘත්තීය කථාව එකතු කරන්න.

පොඩ්කාස්ට් සහ විකාශනය

ස්ටූඩියෝ-ගුණාත්මක ප්රතිදානය පොඩ්කාස්ට්, ගුවන් විදුලි, සහ වෘත්තීය විකාශනය සඳහා සුදුසු වේ.

ක්රීඩා හා අන්තර් ක්රියාකාරී මාධ්ය

ක්රීඩා සංවාදය සඳහා වාරික ගුණාත්මක, අන්තර් ක්රියාකාරී කතා, සහ immersive අත්දැකීම්.

තවත් Sesame CSM ශබ්ද

එම TTS ආකෘතියෙන් වෙනත් හඬවල්

Speaker 0

ඉංග්‍රීසි Neutral

නිතර අසන ප්රශ්න

තිත්ත මී පැණි CSM (සංවාදාත්මක කථාව ආකෘතිය) සංවාදාත්මක කථාව ජනනය කිරීම සඳහා විශේෂයෙන් නිර්මාණය කරන ලද 1 බිලියන පරාමිතීන් ආකෘතියකි. එය ආපසු-ගැනීමේ වේලාව, backchannel ප්රතිචාර, හැඟීම් ප්රතිචාර, සහ සංවාදාත්මක ගලා යන ඇතුළු මානව සංවාදයේ ස්වභාවික රටා ආකෘතිමත් කරයි. CSM සංස්ලේෂණය කරන ලද කථාව වෙනුවට ස්වභාවික මානව සංවාදයක් මෙන් ශබ්ද වන ශ්රව්ය ජනනය කරයි.

Sesame CSM Sesame විසින් සංවර්ධනය කරන ලද අතර එය Apache 2.0 බලපත්‍රය යටතේ නිකුත් කරන ලද අතර එය වාණිජමය වශයෙන් ජනනය කරන ලද ශ්‍රව්‍ය භාවිතයට ඉඩ ලබා දෙයි.

1 භාෂාව සහාය: ඉංග්රීසි.

තක්කාලි CSM වාරික තලය තුළ වේ —4කෙටි පණිවුඩයක් සඳහා 1,000 අක්ෂර. ඔබ සම්පූර්ණ ශ්රව්ය ජනනය කිරීමට පෙර නොමිලේ ඕනෑම තක්කාලි CSM හඬ ප්රවේශ විය හැකිය.

තිප්පිලි CSM මන්දගාමී (ගුණාත්මක ප්රමුඛතාවය) පරම්පරාවේ වේගය ඇත. එය පරම්පරාවකට වඩා වැඩි කාලයක් ගත නමුත් ඉහළ විශ්වාසවන්තත්වය ප්රතිදානය නිපදවයි.

තක්කාලි CSM ශ්රේණිගත කර ඇත 5/5 TTS.ai මත ශ්රව්ය ගුණාත්මක සඳහා. එය ශ්රේණිගත ශ්රේණියේ, මිනිසා-සමාන කථාව ලබා දෙයි.

නෑ, තිප්පොළ CSM තනන ලද හඬ ස්ථාවර කට්ටලයක් භාවිතා කරයි. හඬ ක්ලෝන කිරීම සඳහා, CosyVoice වැනි ආකෘති උත්සාහ2, GPT-SoVITS, හෝ Chatterbox.

ඔව්, තිප්පොළ CSM විශේෂයෙන් AI සහායකයින්, chatbots, සංවාදාත්මක AI යෙදුම් සඳහා නිර්දේශ කරනු ලැබේ. එහි සංවාදාත්මක, ස්වභාවික වේලාව, ආපසු ගැනීමේ හැකියාවන් මෙම භාවිතය සඳහා විශිෂ්ට තේරීම වේ.

ඔව්, තිප්පොළ CSM යටතේ බලපත්ර ලබා දී ඇත Apache 2.0, වාණිජ භාවිතය සඳහා ඉඩ දෙන. තිප්පොළ CSM හඬ සමග ජනනය ශ්රව්ය වීඩියෝ භාවිතා කළ හැක, පොඩ්කාස්ට්, යෙදුම්, ක්රීඩා, සහ වෙනත් ඕනෑම වාණිජ ව්යාපෘතිය.

ඔව්, TTS.ai මත සියලු හඬවල් වාණිජමය බලපත්රලාභී විවෘත මූලාශ්ර ආකෘති භාවිතා (MIT, Apache 2.0). ජනනය කරන ලද ශ්රව්ය වීඩියෝ, පොඩ්කාස්ට්, යෙදුම්, ක්රීඩා සහ වෙනත් ඕනෑම වාණිජ යෙදුමක් භාවිතා කිරීමට ඔබගේ ය.

ආකෘති නාමය සහ හඬ ID සමග /api/v1/tts/ වෙත POST ඉල්ලීමක් යවන්න. Python හි කේත උදාහරණ සඳහා අපගේ API ලේඛන පිටුව බලන්න, JavaScript, Go, සහ cURL.

ඔව්, සාම්පලයක් අසන්නට මෙම පිටුවේ ක්ලික් කරන්න ක්ලික් කරන්න. ඔබ ද කටහඬ පිටුව පෙළ මත අභිරුචි පෙළ වර්ග හා ඕනෑම හඬ සමග නිදහස් පූර්ව දර්ශනයක් ජනනය කළ හැකිය.

උත්සහ කරන්න Speaker 1 දැන්

ඕනෑම පෙළක් ටයිප් කර එය කථා කරන සවන් දෙන්න Speaker 1. භාවිතා කිරීමට නිදහස්.