CosyVoice 2

English Female

پیش‌فرض انگلیسی Female CosyVoice 2

English Female یک صدای هوش مصنوعی زن است که توسط مدل تبدیل متن به گفتار CosyVoice 2 پشتیبانی می‌شود. این صدای سطح استاندارد به انگلیسی صحبت می‌کند و ترکیب گفتار با کیفیت استودیو را ارائه می‌دهد. با سرعت تولید متوسط و امتیاز کیفیت 5/۵، English Female برای real-time applications, streaming tts, voice assistants مناسب است. این موتور توسط Alibaba (Tongyi Lab) under the Apache 2.0 license توسعه داده شده و برای استفاده تجاری ایمن است. ویژگی‌های کلیدی عبارتند از: streaming, zero-shot cloning, cross-lingual, emotion control, human-parity. مدل CosyVoice 2 همچنین از شبیه‌سازی صدا پشتیبانی می‌کند - یک نمونه کوتاه صوتی را برای ایجاد صدای سفارشی که ویژگی‌های کیفیت یکسانی را حفظ می‌کند، بارگذاری کنید.

هنوز رتبه بندی نشده

CosyVoice 2اطلاعات مدل

مدل CosyVoice 2
توسعه‌دهنده Alibaba (Tongyi Lab)
کیفیت
سرعت متوسط
مجوز Apache 2.0
شبیه‌سازی پشتیبانی‌شده
حيوان استاندارد) ۲ اعتبار/ ۱K کاراکتر (
پارامترها 300M
معماری Finite Scalar Quantization + Flow Matching
داده‌های آموزشی 200000 ساعت
سال 2024

بهترین موارد استفاده برای English Female

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از English Female برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

پخش پادکست

خروجی با کیفیت استودیویی مناسب برای پادکست‌ها، رادیو و پخش حرفه‌ای است.

صدای برند سفارشی

این سبک صدا را با صدای خودتان کپی کنید تا صدای منحصر به فرد TTS را ایجاد کنید.

بيشتر CosyVoice 2 صداها

صداهای دیگر از همان مدل TTS

Chinese Female

چینی Female

Chinese Male

چینی Male

English Male

انگلیسی Male

Japanese Female

ژاپنی Female

پرسشهای متداول

این نرم‌افزار از یک روش کوانتیزه کردن مقیاسی متناهی برای سنتز جریانی استفاده می‌کند و از شبیه‌سازی صدای صفر-شلیک، سنتز زبانی و کنترل احساسات دانه ریز پشتیبانی می‌کند.

کاسی‌ویکس ۲ توسط علی‌بابا (Tongyi Lab) توسعه داده شده و تحت مجوز آپاچی ۲٫۰ منتشر شده‌است که به استفاده تجاری از صدای تولید شده اجازه می‌دهد.

کاسی‌وایس ۲ از هشت زبان پشتیبانی می‌کند: انگلیسی، چینی، ژاپنی، کره‌ای، فرانسوی، آلمانی، ایتالیایی، اسپانیایی.

صدای دلنشین ۲ در سطح استاندارد است — ۲ کرید در هر ۱۰۰۰ کاراکتر. می‌توانید پیش‌نمایش هر صدای صدای دلنشین ۲ را قبل از تولید صدای کامل رایگان داشته باشید.

CosyVoice ۲ سرعت تولید متوسطی دارد. تولید معمولاً چند ثانیه به طول متن بستگی دارد.

صداي خوش 2 براي کیفیت صداي TTS.ai 5/5 رتبه گرفته است.

بله ، CosyVoice ۲ از شبیه‌سازی صدای صفر-تیر پشتیبانی می‌کند. برای ایجاد صدای سفارشی ، ۵ تا ۳۰ ثانیه از صدای مرجع را بارگذاری کنید.

بله ، CosyVoice ۲ به ویژه برای برنامه‌های کاربردی زمان واقعی ، انتقال tts ، دستیارهای صدا توصیه می‌شود. انتقال ، شبیه‌سازی صفر- شلیک ، قابلیت‌های زبانی آن ، آن را انتخاب عالی برای این مورد استفاده می‌کند.

بله، صدای دلنشین ۲ تحت مجوز آپاچی ۲٫۰ است که استفاده تجاری را اجازه می‌دهد. صداهای تولید شده با صدای دلنشین ۲ می‌تواند در ویدئوها، پادکست‌ها، برنامه‌ها، بازی‌ها و هر پروژه تجاری دیگر استفاده شود.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن English Female حالا

هر متنی را تایپ کنید و به آن گوش دهید English Female. آزاد برای استفاده.