Default

پریمیوم انگلیسی Neutral

StyleTTS 2

Default یک صدای هوش مصنوعی neutral است که توسط مدل تبدیل متن به گفتار StyleTTS 2 پشتیبانی می‌شود. این صدای درجه بالا به انگلیسی صحبت می‌کند و ترکیب گفتار با کیفیت استودیو را ارائه می‌دهد. با سرعت تولید متوسط و امتیاز کیفیت 5/۵، Default برای studio-quality single-speaker synthesis, professional narration مناسب است. The StyleTTS 2 engine is developed by Columbia University under the MIT license, making it safe for commercial use. ویژگی‌های کلیدی عبارتند از: human-level, style diffusion, adversarial training, natural variation, high fidelity.

هنوز رتبه بندی نشده

این صدا را امتحان کنید همه StyleTTS 2 صداها

اطلاعات مدل

مدل	StyleTTS 2
توسعه‌دهنده	Columbia University
کیفیت
سرعت	متوسط
مجوز	MIT
شبیه‌سازی	در دسترس نیست
حيوان	Premium) ۴ کرون / ۱K کاراکتر (
پارامترها	100M
معماری	Style Diffusion + Adversarial Training
داده‌های آموزشی	585 ساعت
سال	2024

بهترین موارد استفاده برای Default

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Default برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

پخش پادکست

خروجی با کیفیت استودیویی مناسب برای پادکست‌ها، رادیو و پخش حرفه‌ای است.

بازیها و رسانه‌های تعاملیName

کیفیت بالا برای گفتگوی بازی، داستان‌های تعاملی و تجربه‌های غوطه‌ورکننده.

پرسشهای متداول

StyleTTS 2 با ترکیب پخش سبک با آموزش رقابتی با استفاده از مدل‌های بزرگ زبان گفتار، به سنتز TTS سطح انسانی می‌رسد. این نرم‌افزار طبیعی‌ترین صدای سخنرانی را در میان مدل‌های تک‌گوینده تولید می‌کند، که با ضبط‌های انسانی رقابت می‌کند.

StyleTTS ۲ توسط دانشگاه کلمبیا توسعه داده شده و تحت مجوز MIT منتشر شده‌است که به استفاده تجاری از صدای تولید شده اجازه می‌دهد.

زبان دوم: زبان انگلیسی.

StyleTTS ۲ در سطح Premium است — ۴ کرید در هر ۱۰۰۰ کاراکتر. می‌توانید پیش‌نمایش هر صدای StyleTTS ۲ را قبل از تولید صدای کامل رایگان مشاهده کنید.

StyleTTS ۲ سرعت تولید متوسطی دارد. تولید معمولاً چند ثانیه به طول متن بستگی دارد.

StyleTTS 2 برای کیفیت صدا در TTS.ai امتیاز ۵/۵ را دریافت کرد.

نه ، StyleTTS ۲ از یک مجموعه ثابت از صداهای درونی استفاده می‌کند. برای شبیه‌سازی صدا ، مدلهایی مانند CosyVoice ۲ ، GPT- SoVITS ، یا Chatterbox را امتحان کنید.

بله ، StyleTTS ۲ به ویژه برای ترکیب یک بلندگو با کیفیت استودیو ، راوی حرفه‌ای توصیه می‌شود. سطح انسانی ، انتشار سبک ، قابلیت‌های آموزش رقابتی آن ، آن را انتخاب عالی برای این مورد استفاده می‌کند.

بله، StyleTTS ۲ تحت مجوز MIT است که استفاده تجاری را اجازه می‌دهد. صداهای تولید شده با StyleTTS ۲ می‌توانند در ویدئوها، پادکست‌ها، برنامه‌ها، بازی‌ها و هر پروژه تجاری دیگر استفاده شوند.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Default حالا

هر متنی را تایپ کنید و به آن گوش دهید Default. آزاد برای استفاده.

تولید گفتار ثبت نام

Default

اطلاعات مدل

بهترین موارد استفاده برای Default

کتابهای صوتی و گویندگی

صداگذاری ویدئو

پخش پادکست

بازیها و رسانه‌های تعاملیName

پرسشهای متداول

What is StyleTTS 2 TTS?

کی StyleTTS 2 رو ساخت؟

زبان فارسی دارای ۲۲ حرف است.

چقدر هزینه داره که از صداهای StyleTTS 2 استفاده کنم؟

در این حالت، تابع 2 به صورت زیر نمایش داده می‌شود.

کیفیت صدای StyleTTS 2 چیست؟

میتونم با StyleTTS 2 یه صدا رو شبیه سازی کنم؟

آیا StyleTTS2 برای ساختن یک سنسور تک‌گوش با کیفیت استودیویی مناسب است؟

آیا می‌توانم از صداهای StyleTTS 2 به صورت تجاری استفاده کنم؟

مي تونم از اين صدا براي پروژه هاي تجاري استفاده کنم؟

چطور از اين صدا از طريق API استفاده کنم؟

ميشه قبل از توليد صدا رو پيشنمايش کنم؟

سعی کن Default حالا