VibeVoice

Speaker 1

پیش‌فرض انگلیسی Neutral VibeVoice

Speaker 1 یک صدای هوش مصنوعی neutral است که توسط مدل تبدیل متن به گفتار VibeVoice پشتیبانی می‌شود. این صدای سطح استاندارد به انگلیسی صحبت می‌کند و ترکیب گفتار با کیفیت استودیو را ارائه می‌دهد. با سرعت تولید نزدیک به لحظه و امتیاز کیفیت 5/۵، Speaker 1 برای podcasts, dialogues, long-form narration, multi-speaker content مناسب است. این موتور توسط Microsoft under the MIT license توسعه داده شده و برای استفاده تجاری ایمن است. ویژگی‌های کلیدی عبارتند از: multi-speaker, long-form (90 min), podcast generation, dialogue, low latency.

هنوز رتبه بندی نشده

VibeVoiceاطلاعات مدل

مدل VibeVoice
توسعه‌دهنده Microsoft
کیفیت
سرعت سریع
مجوز MIT
شبیه‌سازی در دسترس نیست
حيوان استاندارد) ۲ اعتبار/ ۱K کاراکتر (
پارامترها 1.5B
معماری LLM + DAC
داده‌های آموزشی 100000 ساعت
سال 2025

بهترین موارد استفاده برای Speaker 1

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Speaker 1 برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

کاربردها و دسترسی‌پذیری

تولید سریع این صدا را برای برنامه‌های زمان واقعی، خوانندگان صفحه و ابزارهای دسترسی ایده‌آل می‌کند.

پخش پادکست

خروجی با کیفیت استودیویی مناسب برای پادکست‌ها، رادیو و پخش حرفه‌ای است.

بيشتر VibeVoice صداها

صداهای دیگر از همان مدل TTS

Speaker 1 (Chinese)

چینی Neutral

Speaker 2

انگلیسی Neutral

Speaker 2 (Chinese)

چینی Neutral

Speaker 3

انگلیسی Neutral

Speaker 4

انگلیسی Neutral

پرسشهای متداول

ویب‌وایس توسط مایکروسافت در دو نوع عرضه می‌شود: مدل ۱٫۵ بیتی برای محتوای طولانی (تا ۹۰ دقیقه، ۴ بلندگو) و مدل زمان واقعی ۰٫۵ بیتی برای پخش با تاخیر صدای اولیه ~ ۲۰۰ میلی‌ثانیه.

ویب‌وایس توسط مایکروسافت توسعه داده شده و تحت مجوز MIT (تنها برای تحقیقات) منتشر شده‌است که به استفاده تجاری از صدای تولید شده اجازه می‌دهد.

زبان فارسی: ۱ نفر.

VibeVoice در سطح Premium است — ۴ کرید در هر ۱۰۰۰ کاراکتر. می‌توانید پیش‌نمایش هر صدای VibeVoice را قبل از تولید صدای کامل رایگان داشته باشید.

VibeVoice سرعت تولید متوسطی دارد. تولید معمولاً چند ثانیه به طول متن بستگی دارد.

VibeVoice is rated 5/5 for audio quality on TTS.ai. It delivers studio-grade, human-like speech.

نه ، VibeVoice از یک مجموعه ثابت از صداهای درونی استفاده می‌کند. برای شبیه‌سازی صدا ، مدل‌هایی مانند CosyVoice 2 ، GPT-SoVITS ، یا Chatterbox را امتحان کنید.

بله ، VibeVoice به ویژه برای پادکست ها ، کتاب های صوتی ، محتوای بلندگوهای چندگانه توصیه می شود. قابلیت تولید پادکست چندگانه آن ، تا ۹۰ دقیقه ، آن را انتخاب عالی برای این مورد استفاده می کند.

بله، VibeVoice تحت مجوز MIT (تنها برای تحقیقات) است که استفاده تجاری را اجازه می‌دهد. صدایی که با صداهای VibeVoice تولید می‌شود می‌تواند در ویدئوها، پادکست‌ها، برنامه‌ها، بازی‌ها و هر پروژه تجاری دیگر استفاده شود.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Speaker 1 حالا

هر متنی را تایپ کنید و به آن گوش دهید Speaker 1. آزاد برای استفاده.