Default

Q: نتفلیکس چیست؟

VoxCPM 1.5 توسط OpenBMB یک مدل TTS جدید بدون توکنساز است که به جای توکنهای جداگانه در فضای پیوسته عمل میکند. صدای ۴۴٫۱ کیلوهرتز با صدای با کیفیت بالا تولید میکند، از شبیهسازی صدای شلیک صفر از ۳ تا ۱۰ ثانیه پشتیبانی میکند، و ثبات را در سراسر پاراگرافها حفظ میکند. شبیهسازی زبانی به شما اجازه میدهد که صدای انگلیسی را به گفتار چینی و برعکس اعمال کنید.

Q: VoxCPM از چه زبانهایی پشتیبانی میکند؟

VoxCPM از دو زبان پشتیبانی میکند: انگلیسی، چینی.

Q: چقدر هزینه داره که از صداهای VoxCPM استفاده کنم؟

VoxCPM در سطح استاندارد است — ۲ کرید در هر ۱۰۰۰ کاراکتر. میتوانید پیشنمایش هر صدای VoxCPM را قبل از تولید صدای کامل رایگان داشته باشید.

Q: میتونم با VoxCPM یه صدا رو شبیه سازی کنم؟

بله ، VoxCPM از شبیهسازی صدای شلیک صفر پشتیبانی میکند. برای ایجاد صدای سفارشی ، ۵ تا ۳۰ ثانیه از صدای مرجع را بارگذاری کنید.

Q: VoxCPM برای صدای با کیفیت بالا مناسب است؟

بله ، VoxCPM به ویژه برای صدای با صداقت بالا ، کتابهای صوتی ، محتوای فرم طولانی با ثبات صدا توصیه میشود. صدای ۴۴٫۱ کیلوهرتز ، بدون توکنیزه کردن ، قابلیتهای شبیهسازی چندزبانه آن را انتخاب عالی برای این مورد استفاده میکند.

پیش‌فرض انگلیسی Neutral

VoxCPM

Default یک صدای هوش مصنوعی neutral است که توسط مدل تبدیل متن به گفتار VoxCPM پشتیبانی می‌شود. این صدای سطح استاندارد به انگلیسی صحبت می‌کند و ترکیب گفتار با کیفیت استودیو را ارائه می‌دهد. با سرعت تولید نزدیک به لحظه و امتیاز کیفیت 5/۵، Default برای high-fidelity audio, audiobooks, long-form content with voice consistency مناسب است. The VoxCPM engine is developed by OpenBMB under the Apache 2.0 license, making it safe for commercial use. ویژگی‌های کلیدی عبارتند از: 44.1khz audio, tokenizer-free, cross-lingual cloning, context-aware, lora fine-tuning. مدل VoxCPM همچنین از شبیه‌سازی صدا پشتیبانی می‌کند - یک نمونه کوتاه صوتی را برای ایجاد صدای سفارشی که ویژگی‌های کیفیت یکسانی را حفظ می‌کند، بارگذاری کنید.

هنوز رتبه بندی نشده

این صدا را امتحان کنید همه VoxCPM صداها

اطلاعات مدل

مدل	VoxCPM
توسعه‌دهنده	OpenBMB
کیفیت
سرعت	سریع
مجوز	Apache 2.0
شبیه‌سازی	پشتیبانی‌شده
حيوان	استاندارد) ۲ اعتبار/ ۱K کاراکتر (
پارامترها	500M
معماری	Continuous Space + Flow Matching
داده‌های آموزشی	1800000 ساعت
سال	2025

بهترین موارد استفاده برای Default

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Default برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

کاربردها و دسترسی‌پذیری

تولید سریع این صدا را برای برنامه‌های زمان واقعی، خوانندگان صفحه و ابزارهای دسترسی ایده‌آل می‌کند.

پخش پادکست

خروجی با کیفیت استودیویی مناسب برای پادکست‌ها، رادیو و پخش حرفه‌ای است.

بيشتر VoxCPM صداها

صداهای دیگر از همان مدل TTS

Default Chinese

چینی Neutral

نمایش همۀ VoxCPM صداها

پرسشهای متداول

VoxCPM 1.5 توسط OpenBMB یک مدل TTS جدید بدون توکن‌ساز است که به جای توکن‌های جداگانه در فضای پیوسته عمل می‌کند. صدای ۴۴٫۱ کیلوهرتز با صدای با کیفیت بالا تولید می‌کند، از شبیه‌سازی صدای شلیک صفر از ۳ تا ۱۰ ثانیه پشتیبانی می‌کند، و ثبات را در سراسر پاراگراف‌ها حفظ می‌کند. شبیه‌سازی زبانی به شما اجازه می‌دهد که صدای انگلیسی را به گفتار چینی و برعکس اعمال کنید.

VoxCPM توسط OpenBMB توسعه داده شده و تحت مجوز آپاچی ۲٫۰ منتشر شده‌است که به استفاده تجاری از صدای تولید شده اجازه می‌دهد.

VoxCPM از دو زبان پشتیبانی می‌کند: انگلیسی، چینی.

VoxCPM در سطح استاندارد است — ۲ کرید در هر ۱۰۰۰ کاراکتر. می‌توانید پیش‌نمایش هر صدای VoxCPM را قبل از تولید صدای کامل رایگان داشته باشید.

VoxCPM سرعت تولید بسیار سریعی دارد. در زمان نزدیک به واقعی اجرا می‌شود ، که آن را برای برنامه‌های کاربردی جریان و تعاملی مناسب می‌کند.

VoxCPM در TTS.ai از نظر کیفیت صدا 5/5 را دریافت کرده است.

بله ، VoxCPM از شبیه‌سازی صدای شلیک صفر پشتیبانی می‌کند. برای ایجاد صدای سفارشی ، ۵ تا ۳۰ ثانیه از صدای مرجع را بارگذاری کنید.

بله ، VoxCPM به ویژه برای صدای با صداقت بالا ، کتاب‌های صوتی ، محتوای فرم طولانی با ثبات صدا توصیه می‌شود. صدای ۴۴٫۱ کیلوهرتز ، بدون توکنیزه کردن ، قابلیت‌های شبیه‌سازی چندزبانه آن را انتخاب عالی برای این مورد استفاده می‌کند.

بله ، VoxCPM تحت مجوز آپاچی ۲٫۰ است ، که استفاده تجاری را اجازه می‌دهد. صدایی که با صداهای VoxCPM تولید می‌شود می‌تواند در ویدئوها ، پادکست‌ها ، برنامه‌ها ، بازی‌ها و هر پروژه تجاری دیگر استفاده شود.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Default حالا

هر متنی را تایپ کنید و به آن گوش دهید Default. آزاد برای استفاده.

تولید گفتار ثبت نام

Default

اطلاعات مدل

بهترین موارد استفاده برای Default

کتابهای صوتی و گویندگی

صداگذاری ویدئو

کاربردها و دسترسی‌پذیری

پخش پادکست

بيشتر VoxCPM صداها

Default Chinese

پرسشهای متداول

نت‌فلیکس چیست؟

کی VoxCPM رو توسعه داد؟

VoxCPM از چه زبانهایی پشتیبانی می‌کند؟

چقدر هزینه داره که از صداهای VoxCPM استفاده کنم؟

ماکروسافت ویندوز در چه زمانی به بازار عرضه شد؟

کیفیت صدای VoxCPM چیست؟

میتونم با VoxCPM یه صدا رو شبیه سازی کنم؟

VoxCPM برای صدای با کیفیت بالا مناسب است؟

آیا می‌توانم از صداهای VoxCPM به صورت تجاری استفاده کنم؟

مي تونم از اين صدا براي پروژه هاي تجاري استفاده کنم؟

چطور از اين صدا از طريق API استفاده کنم؟

ميشه قبل از توليد صدا رو پيشنمايش کنم؟

سعی کن Default حالا