VoxCPM

Default

پیش‌فرض انگلیسی Neutral VoxCPM

Default یک صدای هوش مصنوعی neutral است که توسط مدل تبدیل متن به گفتار VoxCPM پشتیبانی می‌شود. این صدای سطح استاندارد به انگلیسی صحبت می‌کند و ترکیب گفتار با کیفیت استودیو را ارائه می‌دهد. با سرعت تولید نزدیک به لحظه و امتیاز کیفیت 5/۵، Default برای high-fidelity audio, audiobooks, long-form content with voice consistency مناسب است. این موتور توسط OpenBMB under the Apache 2.0 license توسعه داده شده و برای استفاده تجاری ایمن است. ویژگی‌های کلیدی عبارتند از: 44.1khz audio, tokenizer-free, cross-lingual cloning, context-aware, lora fine-tuning. مدل VoxCPM همچنین از شبیه‌سازی صدا پشتیبانی می‌کند - یک نمونه کوتاه صوتی را برای ایجاد صدای سفارشی که ویژگی‌های کیفیت یکسانی را حفظ می‌کند، بارگذاری کنید.

هنوز رتبه بندی نشده

VoxCPMاطلاعات مدل

مدل VoxCPM
توسعه‌دهنده OpenBMB
کیفیت
سرعت سریع
مجوز Apache 2.0
شبیه‌سازی پشتیبانی‌شده
حيوان استاندارد) ۲ اعتبار/ ۱K کاراکتر (
پارامترها 500M
معماری Continuous Space + Flow Matching
داده‌های آموزشی 1800000 ساعت
سال 2025

بهترین موارد استفاده برای Default

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Default برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

کاربردها و دسترسی‌پذیری

تولید سریع این صدا را برای برنامه‌های زمان واقعی، خوانندگان صفحه و ابزارهای دسترسی ایده‌آل می‌کند.

پخش پادکست

خروجی با کیفیت استودیویی مناسب برای پادکست‌ها، رادیو و پخش حرفه‌ای است.

بيشتر VoxCPM صداها

صداهای دیگر از همان مدل TTS

Default Chinese

چینی Neutral

پرسشهای متداول

VoxCPM 1.5 توسط OpenBMB یک مدل TTS جدید بدون توکن‌ساز است که به جای توکن‌های جداگانه در فضای پیوسته عمل می‌کند. صدای ۴۴٫۱ کیلوهرتز با صدای با کیفیت بالا تولید می‌کند، از شبیه‌سازی صدای شلیک صفر از ۳ تا ۱۰ ثانیه پشتیبانی می‌کند، و ثبات را در سراسر پاراگراف‌ها حفظ می‌کند. شبیه‌سازی زبانی به شما اجازه می‌دهد که صدای انگلیسی را به گفتار چینی و برعکس اعمال کنید.

VoxCPM توسط OpenBMB توسعه داده شده و تحت مجوز آپاچی ۲٫۰ منتشر شده‌است که به استفاده تجاری از صدای تولید شده اجازه می‌دهد.

VoxCPM از دو زبان پشتیبانی می‌کند: انگلیسی، چینی.

VoxCPM در سطح استاندارد است — ۲ کرید در هر ۱۰۰۰ کاراکتر. می‌توانید پیش‌نمایش هر صدای VoxCPM را قبل از تولید صدای کامل رایگان داشته باشید.

VoxCPM سرعت تولید بسیار سریعی دارد. در زمان نزدیک به واقعی اجرا می‌شود ، که آن را برای برنامه‌های کاربردی جریان و تعاملی مناسب می‌کند.

VoxCPM در TTS.ai از نظر کیفیت صدا 5/5 را دریافت کرده است.

بله ، VoxCPM از شبیه‌سازی صدای شلیک صفر پشتیبانی می‌کند. برای ایجاد صدای سفارشی ، ۵ تا ۳۰ ثانیه از صدای مرجع را بارگذاری کنید.

بله ، VoxCPM به ویژه برای صدای با صداقت بالا ، کتاب‌های صوتی ، محتوای فرم طولانی با ثبات صدا توصیه می‌شود. صدای ۴۴٫۱ کیلوهرتز ، بدون توکنیزه کردن ، قابلیت‌های شبیه‌سازی چندزبانه آن را انتخاب عالی برای این مورد استفاده می‌کند.

بله ، VoxCPM تحت مجوز آپاچی ۲٫۰ است ، که استفاده تجاری را اجازه می‌دهد. صدایی که با صداهای VoxCPM تولید می‌شود می‌تواند در ویدئوها ، پادکست‌ها ، برنامه‌ها ، بازی‌ها و هر پروژه تجاری دیگر استفاده شود.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Default حالا

هر متنی را تایپ کنید و به آن گوش دهید Default. آزاد برای استفاده.