StyleTTS 2

Default

پریمیوم انگلیسی Neutral StyleTTS 2

Default یک صدای هوش مصنوعی neutral است که توسط مدل تبدیل متن به گفتار StyleTTS 2 پشتیبانی می‌شود. این صدای درجه بالا به انگلیسی صحبت می‌کند و ترکیب گفتار با کیفیت استودیو را ارائه می‌دهد. با سرعت تولید متوسط و امتیاز کیفیت 5/۵، Default برای studio-quality single-speaker synthesis, professional narration مناسب است. این موتور توسط Columbia University under the MIT license توسعه داده شده و برای استفاده تجاری ایمن است. ویژگی‌های کلیدی عبارتند از: human-level, style diffusion, adversarial training, natural variation, high fidelity.

هنوز رتبه بندی نشده

StyleTTS 2اطلاعات مدل

مدل StyleTTS 2
توسعه‌دهنده Columbia University
کیفیت
سرعت متوسط
مجوز MIT
شبیه‌سازی در دسترس نیست
حيوان Premium) ۴ کرون / ۱K کاراکتر (
پارامترها 100M
معماری Style Diffusion + Adversarial Training
داده‌های آموزشی 585 ساعت
سال 2024

بهترین موارد استفاده برای Default

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Default برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

پخش پادکست

خروجی با کیفیت استودیویی مناسب برای پادکست‌ها، رادیو و پخش حرفه‌ای است.

بازیها و رسانه‌های تعاملیName

کیفیت بالا برای گفتگوی بازی، داستان‌های تعاملی و تجربه‌های غوطه‌ورکننده.

پرسشهای متداول

StyleTTS 2 با ترکیب پخش سبک با آموزش رقابتی با استفاده از مدل‌های بزرگ زبان گفتار، به سنتز TTS سطح انسانی می‌رسد. این نرم‌افزار طبیعی‌ترین صدای سخنرانی را در میان مدل‌های تک‌گوینده تولید می‌کند، که با ضبط‌های انسانی رقابت می‌کند.

StyleTTS ۲ توسط دانشگاه کلمبیا توسعه داده شده و تحت مجوز MIT منتشر شده‌است که به استفاده تجاری از صدای تولید شده اجازه می‌دهد.

زبان دوم: زبان انگلیسی.

StyleTTS ۲ در سطح Premium است — ۴ کرید در هر ۱۰۰۰ کاراکتر. می‌توانید پیش‌نمایش هر صدای StyleTTS ۲ را قبل از تولید صدای کامل رایگان مشاهده کنید.

StyleTTS ۲ سرعت تولید متوسطی دارد. تولید معمولاً چند ثانیه به طول متن بستگی دارد.

StyleTTS 2 برای کیفیت صدا در TTS.ai امتیاز ۵/۵ را دریافت کرد.

نه ، StyleTTS ۲ از یک مجموعه ثابت از صداهای درونی استفاده می‌کند. برای شبیه‌سازی صدا ، مدلهایی مانند CosyVoice ۲ ، GPT- SoVITS ، یا Chatterbox را امتحان کنید.

بله ، StyleTTS ۲ به ویژه برای ترکیب یک بلندگو با کیفیت استودیو ، راوی حرفه‌ای توصیه می‌شود. سطح انسانی ، انتشار سبک ، قابلیت‌های آموزش رقابتی آن ، آن را انتخاب عالی برای این مورد استفاده می‌کند.

بله، StyleTTS ۲ تحت مجوز MIT است که استفاده تجاری را اجازه می‌دهد. صداهای تولید شده با StyleTTS ۲ می‌توانند در ویدئوها، پادکست‌ها، برنامه‌ها، بازی‌ها و هر پروژه تجاری دیگر استفاده شوند.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Default حالا

هر متنی را تایپ کنید و به آن گوش دهید Default. آزاد برای استفاده.