Dia 2

Default

پیش‌فرض انگلیسی Neutral Dia 2

Default یک صدای هوش مصنوعی neutral است که توسط مدل تبدیل متن به گفتار Dia 2 پشتیبانی می‌شود. این صدای سطح استاندارد به انگلیسی صحبت می‌کند و ترکیب گفتار با کیفیت بالا را ارائه می‌دهد. با سرعت تولید نزدیک به لحظه و امتیاز کیفیت 4/۵، Default برای real-time voice agents, dialogue generation, streaming applications مناسب است. این موتور توسط Nari Labs under the Apache 2.0 license توسعه داده شده و برای استفاده تجاری ایمن است. ویژگی‌های کلیدی عبارتند از: streaming output, multi-speaker, low latency, paralinguistic cues, up to 2 min output.

هنوز رتبه بندی نشده

Dia 2اطلاعات مدل

مدل Dia 2
توسعه‌دهنده Nari Labs
کیفیت
سرعت سریع
مجوز Apache 2.0
شبیه‌سازی در دسترس نیست
حيوان استاندارد) ۲ اعتبار/ ۱K کاراکتر (
پارامترها 2B
معماری Streaming Transformer
سال 2025

بهترین موارد استفاده برای Default

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Default برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

کاربردها و دسترسی‌پذیری

تولید سریع این صدا را برای برنامه‌های زمان واقعی، خوانندگان صفحه و ابزارهای دسترسی ایده‌آل می‌کند.

آموزش و یادگیری الکترونیکی

ایجاد مواد آموزشی جذاب، دوره‌ها و محتوای آموزشی با روایت هوش مصنوعی واضح.

پرسشهای متداول

Dia2 توسط Nari Labs یک ارتقای جریان اول به Dia است، که در پارامترهای 1B و 2B موجود است. آن شروع به سنتز صدا از چند نشانه اول می‌کند، که آن را برای عوامل صدای زمان واقعی و خط لوله‌های گفتار به گفتار ایده‌آل می‌کند. از گفتگوی چند بلندگو با برچسب‌های [S1] / [S2] و نشانه‌های پارازبانی مانند (خنده)، (سرفه) پشتیبانی می‌کند.

دی‌آی ۲ توسط آزمایشگاه‌های ناری توسعه داده شده و تحت مجوز آپاچی ۲٫۰ منتشر شده‌است که به استفاده تجاری از صدای تولید شده اجازه می‌دهد.

زبان دوم: انگلیسی.

Dia ۲ در سطح استاندارد است — ۲ کرید در هر ۱۰۰۰ کاراکتر. می‌توانید پیش‌نمایش هر صدای Dia ۲ را قبل از تولید صدای کامل رایگان ببینید.

Dia ۲ سرعت تولید بسیار سریعی دارد. در زمان نزدیک به واقعی اجرا می‌شود، که آن را برای برنامه‌های کاربردی جریانی و تعاملی مناسب می‌کند.

Dia 2 برای کیفیت صدا در TTS.ai امتیاز 4/5 را دارد.

نه ، Dia ۲ از یک مجموعه ثابت از صداهای درونی استفاده می‌کند. برای شبیه‌سازی صدا ، مدلهایی مانند CosyVoice ۲ ، GPT- SoVITS ، یا Chatterbox را امتحان کنید.

بله، Dia ۲ به ویژه برای عوامل صدای زمان واقعی، تولید گفتگو، برنامه‌های پخش شده توصیه می‌شود. خروجی پخش شده، چند بلندگو، قابلیت‌های تأخیر کم آن را انتخاب عالی برای این مورد استفاده می‌کند.

بله ، Dia ۲ تحت مجوز آپاچی ۲٫۰ است ، که استفاده تجاری را اجازه می‌دهد. صدایی که با صداهای Dia ۲ تولید می‌شود می‌تواند در ویدئوها ، پادکست‌ها ، برنامه‌ها ، بازی‌ها و هر پروژه تجاری دیگر استفاده شود.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Default حالا

هر متنی را تایپ کنید و به آن گوش دهید Default. آزاد برای استفاده.