Speaker 1

ප්‍රමිතිය ඉංග්‍රීසි Neutral

Sesame CSM

Speaker 1 යනු Sesame CSM පෙළ- සිට- කථාව ආකෘතිය මගින් බලගැන්වෙන neutral AI හඬකි. මෙම premium-tier හඬ ඉංග්‍රීසි කතාකරයි සහ චිත්‍රාගාරය- ගුණාත්මක කථා සංස්ලේෂණය ලබාදෙයි. මන්දගාමී නමුත් ඉහළ- විශ්වාසනීය ජනනය කිරීමේ වේගය සහ 5/5 ක ගුණාත්මක ශ්‍රේණිගත කිරීමක් සහිතව, Speaker 1 ai assistants, chatbots, conversational ai applications සඳහා සුදුසු වේ. The Sesame CSM engine is developed by Sesame under the Apache 2.0 license, making it safe for commercial use. Key capabilities include: conversational, natural timing, turn-taking, backchannel, 1b parameters.

තවමත් ශ්‍රේණිගත කිරීම් නැත

මෙම හඬ උත්සාහ කරන්න සියල්ල Sesame CSM ශබ්ද

ආකෘති තොරතුරු

ආකෘතිය	Sesame CSM
සංවර්‍ධක	Sesame
ප්‍රමිතිය
වේගය	මන්දගාමී
බලපත්‍රය	Apache 2.0
ක්ලෝන කිරීම	නොමැත
සත්වයා	වාරික (4 ණය / 1K අක්ෂර)
පරාමිතීන්	1B
ගෘහ නිර්මාණ ශිල්පය	Llama Backbone + Audio Codec
වසර	2025

සඳහා හොඳම භාවිතය නඩු Speaker 1

මෙම හඬේ ලක්ෂණ මත පදනම්ව නිර්දේශිත යෙදුම්Name

ශ්‍රව්‍ය පොත් සහ කථා

ස්වභාවික ව්‍යවහාරය හා ප්‍රකාශනය සමග දිගු ආකෘති අන්තර්ගතය විස්තර කිරීමට Speaker 1 භාවිතා කරන්න.

වීඩියෝ කටහඬ

YouTube වීඩියෝ, දැන්වීම් සහ සමාජ මාධ්ය අන්තර්ගතයට වෘත්තීය කථාව එකතු කරන්න.

පොඩ්කාස්ට් සහ විකාශනය

ස්ටූඩියෝ-ගුණාත්මක ප්රතිදානය පොඩ්කාස්ට්, ගුවන් විදුලි, සහ වෘත්තීය විකාශනය සඳහා සුදුසු වේ.

ක්රීඩා හා අන්තර් ක්රියාකාරී මාධ්ය

ක්රීඩා සංවාදය සඳහා වාරික ගුණාත්මක, අන්තර් ක්රියාකාරී කතා, සහ immersive අත්දැකීම්.

තවත් Sesame CSM ශබ්ද

එම TTS ආකෘතියෙන් වෙනත් හඬවල්

Speaker 0

ඉංග්‍රීසි Neutral

සියල්ල පෙන්වන්න Sesame CSM හඬ

නිතර අසන ප්රශ්න

තිත්ත මී පැණි CSM (සංවාදාත්මක කථාව ආකෘතිය) සංවාදාත්මක කථාව ජනනය කිරීම සඳහා විශේෂයෙන් නිර්මාණය කරන ලද 1 බිලියන පරාමිතීන් ආකෘතියකි. එය ආපසු-ගැනීමේ වේලාව, backchannel ප්රතිචාර, හැඟීම් ප්රතිචාර, සහ සංවාදාත්මක ගලා යන ඇතුළු මානව සංවාදයේ ස්වභාවික රටා ආකෘතිමත් කරයි. CSM සංස්ලේෂණය කරන ලද කථාව වෙනුවට ස්වභාවික මානව සංවාදයක් මෙන් ශබ්ද වන ශ්රව්ය ජනනය කරයි.

Sesame CSM Sesame විසින් සංවර්ධනය කරන ලද අතර එය Apache 2.0 බලපත්‍රය යටතේ නිකුත් කරන ලද අතර එය වාණිජමය වශයෙන් ජනනය කරන ලද ශ්‍රව්‍ය භාවිතයට ඉඩ ලබා දෙයි.

1 භාෂාව සහාය: ඉංග්රීසි.

තක්කාලි CSM වාරික තලය තුළ වේ —4කෙටි පණිවුඩයක් සඳහා 1,000 අක්ෂර. ඔබ සම්පූර්ණ ශ්රව්ය ජනනය කිරීමට පෙර නොමිලේ ඕනෑම තක්කාලි CSM හඬ ප්රවේශ විය හැකිය.

තිප්පිලි CSM මන්දගාමී (ගුණාත්මක ප්රමුඛතාවය) පරම්පරාවේ වේගය ඇත. එය පරම්පරාවකට වඩා වැඩි කාලයක් ගත නමුත් ඉහළ විශ්වාසවන්තත්වය ප්රතිදානය නිපදවයි.

තක්කාලි CSM ශ්රේණිගත කර ඇත 5/5 TTS.ai මත ශ්රව්ය ගුණාත්මක සඳහා. එය ශ්රේණිගත ශ්රේණියේ, මිනිසා-සමාන කථාව ලබා දෙයි.

නෑ, තිප්පොළ CSM තනන ලද හඬ ස්ථාවර කට්ටලයක් භාවිතා කරයි. හඬ ක්ලෝන කිරීම සඳහා, CosyVoice වැනි ආකෘති උත්සාහ2, GPT-SoVITS, හෝ Chatterbox.

ඔව්, තිප්පොළ CSM විශේෂයෙන් AI සහායකයින්, chatbots, සංවාදාත්මක AI යෙදුම් සඳහා නිර්දේශ කරනු ලැබේ. එහි සංවාදාත්මක, ස්වභාවික වේලාව, ආපසු ගැනීමේ හැකියාවන් මෙම භාවිතය සඳහා විශිෂ්ට තේරීම වේ.

ඔව්, තිප්පොළ CSM යටතේ බලපත්ර ලබා දී ඇත Apache 2.0, වාණිජ භාවිතය සඳහා ඉඩ දෙන. තිප්පොළ CSM හඬ සමග ජනනය ශ්රව්ය වීඩියෝ භාවිතා කළ හැක, පොඩ්කාස්ට්, යෙදුම්, ක්රීඩා, සහ වෙනත් ඕනෑම වාණිජ ව්යාපෘතිය.

ඔව්, TTS.ai මත සියලු හඬවල් වාණිජමය බලපත්රලාභී විවෘත මූලාශ්ර ආකෘති භාවිතා (MIT, Apache 2.0). ජනනය කරන ලද ශ්රව්ය වීඩියෝ, පොඩ්කාස්ට්, යෙදුම්, ක්රීඩා සහ වෙනත් ඕනෑම වාණිජ යෙදුමක් භාවිතා කිරීමට ඔබගේ ය.

ආකෘති නාමය සහ හඬ ID සමග /api/v1/tts/ වෙත POST ඉල්ලීමක් යවන්න. Python හි කේත උදාහරණ සඳහා අපගේ API ලේඛන පිටුව බලන්න, JavaScript, Go, සහ cURL.

ඔව්, සාම්පලයක් අසන්නට මෙම පිටුවේ ක්ලික් කරන්න ක්ලික් කරන්න. ඔබ ද කටහඬ පිටුව පෙළ මත අභිරුචි පෙළ වර්ග හා ඕනෑම හඬ සමග නිදහස් පූර්ව දර්ශනයක් ජනනය කළ හැකිය.

උත්සහ කරන්න Speaker 1 දැන්

ඕනෑම පෙළක් ටයිප් කර එය කථා කරන සවන් දෙන්න Speaker 1. භාවිතා කිරීමට නිදහස්.

කථාව ජනනය කරන්න නොමිලේ ලියාපදිංචි

Speaker 1

ආකෘති තොරතුරු

සඳහා හොඳම භාවිතය නඩු Speaker 1

ශ්‍රව්‍ය පොත් සහ කථා

වීඩියෝ කටහඬ

පොඩ්කාස්ට් සහ විකාශනය

ක්රීඩා හා අන්තර් ක්රියාකාරී මාධ්ය

තවත් Sesame CSM ශබ්ද

Speaker 0

නිතර අසන ප්රශ්න

තක්කාලි CSM TTS යනු කුමක්ද?

කවුද Sesame CSM සංවර්ධනය?

කුමන භාෂා Sesame CSM සහාය දක්වයි?

කොපමණ මුදලක් එය Sesame CSM හඬ භාවිතා කිරීමට වැය වේද?

කතා බහ උත්පාදනය කිරීමේදී Sesame CSM කොපමණ වේගයෙන් ද?

Sesame CSM ශ්රව්ය ගුණාත්මකභාවය කුමක්ද?

මට Sesame CSM සමග හඬ ක්ලෝන කළ හැකිද?

Sesame CSM AI සහායකයින් සඳහා සුදුසු ද?

මම වාණිජමය Sesame CSM හඬ භාවිතා කළ හැකිද?

මට මේ හඬ වාණිජ ව්‍යාපෘති සඳහා භාවිතා කළ හැකිද?

මම කොහොමද API හරහා මෙම හඬ භාවිතා කරන්නේ?

මට ජනනය කිරීමට පෙර හඬ පූර්ව දර්ශනය කළ හැකිද?

උත්සහ කරන්න Speaker 1 දැන්