GPT-SoVITS

Korean Default

پیش‌فرض کره ای Neutral GPT-SoVITS

Korean Default یک صدای هوش مصنوعی neutral است که توسط مدل تبدیل متن به گفتار GPT-SoVITS پشتیبانی می‌شود. این صدای سطح استاندارد به کره ای صحبت می‌کند و ترکیب گفتار با کیفیت استودیو را ارائه می‌دهد. با سرعت تولید آهسته تر اما با دقتی بالا و امتیاز کیفیت 5/۵، Korean Default برای voice cloning, singing synthesis, content creator voice replication مناسب است. این موتور توسط RVC-Boss under the MIT license توسعه داده شده و برای استفاده تجاری ایمن است. ویژگی‌های کلیدی عبارتند از: 5-second cloning, singing voice, few-shot learning, high fidelity, cross-lingual. مدل GPT-SoVITS همچنین از شبیه‌سازی صدا پشتیبانی می‌کند - یک نمونه کوتاه صوتی را برای ایجاد صدای سفارشی که ویژگی‌های کیفیت یکسانی را حفظ می‌کند، بارگذاری کنید.

هنوز رتبه بندی نشده

GPT-SoVITSاطلاعات مدل

مدل GPT-SoVITS
توسعه‌دهنده RVC-Boss
کیفیت
سرعت آهسته
مجوز MIT
شبیه‌سازی پشتیبانی‌شده
حيوان استاندارد) ۲ اعتبار/ ۱K کاراکتر (
پارامترها 200M
معماری GPT + SoVITS
سال 2024

بهترین موارد استفاده برای Korean Default

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Korean Default برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

پخش پادکست

خروجی با کیفیت استودیویی مناسب برای پادکست‌ها، رادیو و پخش حرفه‌ای است.

صدای برند سفارشی

این سبک صدا را با صدای خودتان کپی کنید تا صدای منحصر به فرد TTS را ایجاد کنید.

بيشتر GPT-SoVITS صداها

صداهای دیگر از همان مدل TTS

Default

چینی Neutral

English Default

انگلیسی Neutral

Japanese Default

ژاپنی Neutral

پرسشهای متداول

GPT- SoVITS مدل‌سازی زبان به سبک GPT را با SoVITS (استنباط صدای آوازخوانی از طریق ترجمه و ترکیب) برای شبیه‌سازی قدرتمند چند شلیک صدا ترکیب می‌کند. با کمتر از ۵ ثانیه صدای مرجع ، می‌تواند صدا را دقیقاً شبیه‌سازی کند و گفتار جدیدی تولید کند در حالی که ویژگی‌های منحصر به فرد سخنران را حفظ می‌کند. در ترکیب صدای سخنرانی و آوازخوانی نیز برتر است.

GPT-SoVITS توسط RVC-Boss توسعه داده شده و تحت مجوز MIT منتشر شده‌است، که استفاده تجاری از صدای تولید شده را اجازه می‌دهد.

GPT-SoVITS از ۴ زبان پشتیبانی می‌کند: انگلیسی، چینی، ژاپنی، کره‌ای.

GPT-SoVITS در سطح استاندارد است — ۲ کرید در هر ۱۰۰۰ کاراکتر. شما می‌توانید پیش‌نمایش هر صدای GPT-SoVITS را قبل از تولید صدای کامل رایگان انجام دهید.

GPT-SoVITS سرعت تولید کندتری دارد (به کیفیت اولویت می‌دهد). هر نسل زمان بیشتری می‌برد اما خروجی با کیفیت بالاتری تولید می‌کند.

GPT-SoVITS is rated 5/5 for audio quality on TTS.ai. It delivers studio-grade, human-like speech.

بله ، GPT-SoVITS از شبیه‌سازی صدای شلیک صفر پشتیبانی می‌کند. برای ایجاد صدای سفارشی ، ۵ تا ۳۰ ثانیه از صدای مرجع را بارگذاری کنید.

بله ، GPT- SoVITS به طور خاص برای شبیه‌سازی صدا ، ترکیب آواز ، تکرار صدای سازنده محتوا توصیه می‌شود. شبیه‌سازی ۵ ثانیه ای ، صدای آواز ، قابلیت یادگیری چند شلیک آن را انتخاب عالی برای این مورد استفاده می‌کند.

بله، GPT-SoVITS تحت مجوز MIT است که استفاده تجاری را اجازه می‌دهد. صدای تولید شده با صداهای GPT-SoVITS می‌تواند در ویدئوها، پادکست‌ها، برنامه‌ها، بازی‌ها و هر پروژه تجاری دیگر استفاده شود.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Korean Default حالا

هر متنی را تایپ کنید و به آن گوش دهید Korean Default. آزاد برای استفاده.