Dia TTS

Speaker 1

සම්මත ඉංග්‍රීසි Neutral Dia TTS

Speaker 1 යනු Dia TTS පෙළ- සිට- කථාව ආකෘතිය මගින් බලගැන්වෙන neutral AI හඬකි. මෙම සම්මත-මට්ටම හඬ ඉංග්‍රීසි කතාකරයි සහ චිත්‍රාගාරය- ගුණාත්මක කථා සංස්ලේෂණය ලබාදෙයි. මධ්‍යම ජනනය කිරීමේ වේගය සහ 5/5 ක ගුණාත්මක ශ්‍රේණිගත කිරීමක් සහිතව, Speaker 1 podcasts, audiobook dialogues, conversational content සඳහා සුදුසු වේ. The Dia TTS engine is developed by Nari Labs under the Apache 2.0 license, making it safe for commercial use. Key capabilities include: multi-speaker, dialog generation, natural turn-taking, emotional expression, 1.6b parameters.

තවමත් ශ්‍රේණිගත කිරීම් නැත

Dia TTSආකෘති තොරතුරු

ආකෘතිය Dia TTS
සංවර්‍ධක Nari Labs
ප්‍රමිතිය
වේගය මධ්‍යම
බලපත්‍රය Apache 2.0
ක්ලෝන කිරීම නොමැත
සත්වයා සම්මත (2 ණය / 1K අක්ෂර)
පරාමිතීන් 1.6B
ගෘහ නිර්මාණ ශිල්පය Transformer Autoregressive + DAC
වසර 2024

සඳහා හොඳම භාවිතය නඩු Speaker 1

මෙම හඬේ ලක්ෂණ මත පදනම්ව නිර්දේශිත යෙදුම්Name

ශ්‍රව්‍ය පොත් සහ කථා

ස්වභාවික ව්‍යවහාරය හා ප්‍රකාශනය සමග දිගු ආකෘති අන්තර්ගතය විස්තර කිරීමට Speaker 1 භාවිතා කරන්න.

වීඩියෝ කටහඬ

YouTube වීඩියෝ, දැන්වීම් සහ සමාජ මාධ්ය අන්තර්ගතයට වෘත්තීය කථාව එකතු කරන්න.

පොඩ්කාස්ට් සහ විකාශනය

ස්ටූඩියෝ-ගුණාත්මක ප්රතිදානය පොඩ්කාස්ට්, ගුවන් විදුලි, සහ වෘත්තීය විකාශනය සඳහා සුදුසු වේ.

ඉ-ඉගෙනීම සහ පුහුණුව

විද්‍යුත් තැපෑල, විද්‍යුත් ලිපිනය, සහ විද්‍යුත් ලිපිනය යනාදිය විද්‍යුත් ලිපින ලෙස හැඳින්වේ.

තවත් Dia TTS ශබ්ද

එම TTS ආකෘතියෙන් වෙනත් හඬවල්

Speaker 2

ඉංග්‍රීසි Neutral

නිතර අසන ප්රශ්න

Nari Labs විසින් ඩය 1.6B පරාමිතීන් පෙළ-කථාව ආකෘතිය විශේෂයෙන් බහු කථික සංවාදයක් ජනනය කිරීම සඳහා නිර්මාණය කර ඇත. එය සුදුසු ආපසු ගැනීම, prosody, හා හැඟීම් ප්රකාශ සමග කථිකයන් දෙදෙනෙකු අතර ස්වභාවික-ශබ්ද සංවාද නිෂ්පාදනය කළ හැකිය. ඩය පොඩ්කාස්ට්-ශෛලිය අන්තර්ගතය නිර්මාණය කිරීම සඳහා පරිපූර්ණ වේ, ශ්රව්ය පොත් සංවාද, සහ අන්තර්ක්රියාකාරී සංවාදාත්මක AI.

ඩය TTS නරි ලැබ්ස් විසින් සංවර්ධනය කරන ලද අතර එය Apache 2.0 බලපත්‍රය යටතේ නිකුත් කරන ලද අතර එය වාණිජමය වශයෙන් නිපදවන ලද ශ්‍රව්‍ය භාවිතයට ඉඩ ලබා දෙයි.

ඩියා TTS 1 භාෂාව සහාය: ඉංග්රීසි.

ඩය TTS සම්මත තලය තුළ වේ —2අක්ෂර සඳහා 1,000 ක්රෙඩිට්. ඔබ සම්පූර්ණ ශ්රව්ය ජනනය කිරීමට පෙර ඕනෑම ඩය TTS හඬ නොමිලේ ප්රවේශ විය හැකිය.

Dia TTS මධ්යම පරම්පරාවේ වේගය ඇත. පරම්පරාව සාමාන්යයෙන් පෙළ දිග මත රඳා තත්පර කිහිපයක් ගත වේ.

Dia TTS ශ්රව්ය ගුණාත්මකභාවය සඳහා 5/5 ශ්රේණිගත කර ඇත TTS.ai. එය ශ්රේණිගත ශ්රේණිගත, මිනිසා-සමාන කථාව ලබා දෙයි.

නැහැ, Dia TTS තනන ලද හඬවල් ස්ථාවර කට්ටලයක් භාවිතා කරයි. හඬ ක්ලෝන කිරීම සඳහා, CosyVoice වැනි ආකෘති උත්සාහ කරන්න2, GPT-SoVITS, හෝ Chatterbox.

ඔව්, ඩය TTS විශේෂයෙන් පොඩ්කාස්ට් සඳහා නිර්දේශ කරනු ලැබේ, ශ්රව්ය පොත් සංවාද, සංවාදාත්මක අන්තර්ගතය. එහි බහු-කථිකයා, සංවාදය ජනනය, ස්වභාවික ආපසු ගැනීමේ හැකියාවන් මෙම භාවිතය සඳහා විශිෂ්ට තේරීම වේ.

ඔව්, ඩය TTS යටතේ බලපත්ර අපාචි 2.0, වාණිජ භාවිතය සඳහා ඉඩ දෙන. ඩය TTS හඬ සමග ජනනය ශ්රව්ය වීඩියෝ, පොඩ්කාස්ට්, යෙදුම්, ක්රීඩා, සහ වෙනත් ඕනෑම වාණිජ ව්යාපෘතිය භාවිතා කළ හැකිය.

ඔව්, TTS.ai මත සියලු හඬවල් වාණිජමය බලපත්රලාභී විවෘත මූලාශ්ර ආකෘති භාවිතා (MIT, Apache 2.0). ජනනය කරන ලද ශ්රව්ය වීඩියෝ, පොඩ්කාස්ට්, යෙදුම්, ක්රීඩා සහ වෙනත් ඕනෑම වාණිජ යෙදුමක් භාවිතා කිරීමට ඔබගේ ය.

ආකෘති නාමය සහ හඬ ID සමග /api/v1/tts/ වෙත POST ඉල්ලීමක් යවන්න. Python හි කේත උදාහරණ සඳහා අපගේ API ලේඛන පිටුව බලන්න, JavaScript, Go, සහ cURL.

ඔව්, සාම්පලයක් අසන්නට මෙම පිටුවේ ක්ලික් කරන්න ක්ලික් කරන්න. ඔබ ද කටහඬ පිටුව පෙළ මත අභිරුචි පෙළ වර්ග හා ඕනෑම හඬ සමග නිදහස් පූර්ව දර්ශනයක් ජනනය කළ හැකිය.

උත්සහ කරන්න Speaker 1 දැන්

ඕනෑම පෙළක් ටයිප් කර එය කථා කරන සවන් දෙන්න Speaker 1. භාවිතා කිරීමට නිදහස්.