Dia TTS

Speaker 1

සම්මත ඉංග්‍රීසි Neutral Dia TTS

Speaker 1 යනු Dia TTS පෙළ- සිට- කථාව ආකෘතිය මගින් බලගැන්වෙන neutral AI හඬකි. මෙම සම්මත-මට්ටම හඬ ඉංග්‍රීසි කතාකරයි සහ චිත්‍රාගාරය- ගුණාත්මක කථා සංස්ලේෂණය ලබාදෙයි. මධ්‍යම ජනනය කිරීමේ වේගය සහ 5/5 ක ගුණාත්මක ශ්‍රේණිගත කිරීමක් සහිතව, Speaker 1 podcasts, audiobook dialogues, conversational content සඳහා සුදුසු වේ. මෙම ක්‍රමවේදය මඟින් ද්‍රව්‍යය ද්‍රවයක් බවට පත්කර එය ද්‍රවයක් ලෙසින් භාවිතා කිරීමට ඉඩ සලසයි. ඵලදායිතාවය: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය යනු: ඵලදායිතාවය.

තවමත් ශ්‍රේණිගත කිරීම් නැත

Dia TTSආකෘති තොරතුරු

ආකෘතිය Dia TTS
සංවර්‍ධක Nari Labs
ප්‍රමිතිය
වේගය මධ්‍යම
බලපත්‍රය Apache 2.0
ක්ලෝන කිරීම නොමැත
සත්වයා සම්මත (2 ණය / 1K අක්ෂර)
පරාමිතීන් 1.6B
ගෘහ නිර්මාණ ශිල්පය Transformer Autoregressive + DAC
වසර 2024

සඳහා හොඳම භාවිතය නඩු Speaker 1

මෙම හඬේ ලක්ෂණ මත පදනම්ව නිර්දේශිත යෙදුම්Name

ශ්‍රව්‍ය පොත් සහ කථා

ස්වභාවික ව්‍යවහාරය හා ප්‍රකාශනය සමග දිගු ආකෘති අන්තර්ගතය විස්තර කිරීමට Speaker 1 භාවිතා කරන්න.

වීඩියෝ කටහඬ

YouTube වීඩියෝ, දැන්වීම් සහ සමාජ මාධ්ය අන්තර්ගතයට වෘත්තීය කථාව එකතු කරන්න.

පොඩ්කාස්ට් සහ විකාශනය

ස්ටූඩියෝ-ගුණාත්මක ප්රතිදානය පොඩ්කාස්ට්, ගුවන් විදුලි, සහ වෘත්තීය විකාශනය සඳහා සුදුසු වේ.

ඉ-ඉගෙනීම සහ පුහුණුව

විද්‍යුත් තැපෑල, විද්‍යුත් ලිපිනය, සහ විද්‍යුත් ලිපිනය යනාදිය විද්‍යුත් ලිපින ලෙස හැඳින්වේ.

තවත් Dia TTS ශබ්ද

එම TTS ආකෘතියෙන් වෙනත් හඬවල්

Speaker 2

ඉංග්‍රීසි Neutral

නිතර අසන ප්රශ්න

Nari Labs විසින් ඩය 1.6B පරාමිතීන් පෙළ-කථාව ආකෘතිය විශේෂයෙන් බහු කථික සංවාදයක් ජනනය කිරීම සඳහා නිර්මාණය කර ඇත. එය සුදුසු ආපසු ගැනීම, prosody, හා හැඟීම් ප්රකාශ සමග කථිකයන් දෙදෙනෙකු අතර ස්වභාවික-ශබ්ද සංවාද නිෂ්පාදනය කළ හැකිය. ඩය පොඩ්කාස්ට්-ශෛලිය අන්තර්ගතය නිර්මාණය කිරීම සඳහා පරිපූර්ණ වේ, ශ්රව්ය පොත් සංවාද, සහ අන්තර්ක්රියාකාරී සංවාදාත්මක AI.

ඩය TTS නරි ලැබ්ස් විසින් සංවර්ධනය කරන ලද අතර එය Apache 2.0 බලපත්‍රය යටතේ නිකුත් කරන ලද අතර එය වාණිජමය වශයෙන් නිපදවන ලද ශ්‍රව්‍ය භාවිතයට ඉඩ ලබා දෙයි.

ඩියා TTS 1 භාෂාව සහාය: ඉංග්රීසි.

ඩය TTS සම්මත තලය තුළ වේ —2අක්ෂර සඳහා 1,000 ක්රෙඩිට්. ඔබ සම්පූර්ණ ශ්රව්ය ජනනය කිරීමට පෙර ඕනෑම ඩය TTS හඬ නොමිලේ ප්රවේශ විය හැකිය.

Dia TTS මධ්යම පරම්පරාවේ වේගය ඇත. පරම්පරාව සාමාන්යයෙන් පෙළ දිග මත රඳා තත්පර කිහිපයක් ගත වේ.

Dia TTS ශ්රව්ය ගුණාත්මකභාවය සඳහා 5/5 ශ්රේණිගත කර ඇත TTS.ai. එය ශ්රේණිගත ශ්රේණිගත, මිනිසා-සමාන කථාව ලබා දෙයි.

නැහැ, Dia TTS තනන ලද හඬවල් ස්ථාවර කට්ටලයක් භාවිතා කරයි. හඬ ක්ලෝන කිරීම සඳහා, CosyVoice වැනි ආකෘති උත්සාහ කරන්න2, GPT-SoVITS, හෝ Chatterbox.

ඔව්, ඩය TTS විශේෂයෙන් පොඩ්කාස්ට් සඳහා නිර්දේශ කරනු ලැබේ, ශ්රව්ය පොත් සංවාද, සංවාදාත්මක අන්තර්ගතය. එහි බහු-කථිකයා, සංවාදය ජනනය, ස්වභාවික ආපසු ගැනීමේ හැකියාවන් මෙම භාවිතය සඳහා විශිෂ්ට තේරීම වේ.

ඔව්, ඩය TTS යටතේ බලපත්ර අපාචි 2.0, වාණිජ භාවිතය සඳහා ඉඩ දෙන. ඩය TTS හඬ සමග ජනනය ශ්රව්ය වීඩියෝ, පොඩ්කාස්ට්, යෙදුම්, ක්රීඩා, සහ වෙනත් ඕනෑම වාණිජ ව්යාපෘතිය භාවිතා කළ හැකිය.

ඔව්, TTS.ai මත සියලු හඬවල් වාණිජමය බලපත්රලාභී විවෘත මූලාශ්ර ආකෘති භාවිතා (MIT, Apache 2.0). ජනනය කරන ලද ශ්රව්ය වීඩියෝ, පොඩ්කාස්ට්, යෙදුම්, ක්රීඩා සහ වෙනත් ඕනෑම වාණිජ යෙදුමක් භාවිතා කිරීමට ඔබගේ ය.

ආකෘති නාමය සහ හඬ ID සමග /api/v1/tts/ වෙත POST ඉල්ලීමක් යවන්න. Python හි කේත උදාහරණ සඳහා අපගේ API ලේඛන පිටුව බලන්න, JavaScript, Go, සහ cURL.

ඔව්, සාම්පලයක් අසන්නට මෙම පිටුවේ ක්ලික් කරන්න ක්ලික් කරන්න. ඔබ ද කටහඬ පිටුව පෙළ මත අභිරුචි පෙළ වර්ග හා ඕනෑම හඬ සමග නිදහස් පූර්ව දර්ශනයක් ජනනය කළ හැකිය.

උත්සහ කරන්න Speaker 1 දැන්

ඕනෑම පෙළක් ටයිප් කර එය කථා කරන සවන් දෙන්න Speaker 1. භාවිතා කිරීමට නිදහස්.