MOSS-TTSD

Default Speaker

پیش‌فرض انگلیسی Neutral MOSS-TTSD

Default Speaker یک صدای هوش مصنوعی neutral است که توسط مدل تبدیل متن به گفتار MOSS-TTSD پشتیبانی می‌شود. این صدای سطح استاندارد به انگلیسی صحبت می‌کند و ترکیب گفتار با کیفیت استودیو را ارائه می‌دهد. با سرعت تولید متوسط و امتیاز کیفیت 5/۵، Default Speaker برای podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices مناسب است. این موتور توسط OpenMOSS under the Apache 2.0 license توسعه داده شده و برای استفاده تجاری ایمن است. ویژگی‌های کلیدی عبارتند از: multi-speaker dialogue, up to 5 speakers, 60min coherent audio, voice cloning, 20 languages. مدل MOSS-TTSD همچنین از شبیه‌سازی صدا پشتیبانی می‌کند - یک نمونه کوتاه صوتی را برای ایجاد صدای سفارشی که ویژگی‌های کیفیت یکسانی را حفظ می‌کند، بارگذاری کنید.

هنوز رتبه بندی نشده

MOSS-TTSDاطلاعات مدل

مدل MOSS-TTSD
توسعه‌دهنده OpenMOSS
کیفیت
سرعت متوسط
مجوز Apache 2.0
شبیه‌سازی پشتیبانی‌شده
حيوان استاندارد) ۲ اعتبار/ ۱K کاراکتر (
پارامترها 7B
معماری MOSS-TTS-Delay + dialogue continuation head
سال 2026

بهترین موارد استفاده برای Default Speaker

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Default Speaker برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

پخش پادکست

خروجی با کیفیت استودیویی مناسب برای پادکست‌ها، رادیو و پخش حرفه‌ای است.

صدای برند سفارشی

این سبک صدا را با صدای خودتان کپی کنید تا صدای منحصر به فرد TTS را ایجاد کنید.

بيشتر MOSS-TTSD صداها

صداهای دیگر از همان مدل TTS

Default (Chinese)

چینی Neutral

پرسشهای متداول

MOSS-TTSD v1.0 from OpenMOSS is a 7B dialogue text-to-speech model that continues conversations from a short audio prompt. Supports up to 5 simultaneous speakers via [S1]/[S2] tags, zero-shot voice cloning from 3-10s reference audio, and up to 60 minutes of coherent multi-turn dialogue across 20 languages. Distinct from MOSS-TTS — TTSD is specialized for podcast/audiobook/dubbing workflows.

MOSS-TTSD was developed by OpenMOSS and is released under the Apache 2.0 license, which permits commercial use of generated audio.

MOSS-TTSD supports 20 languages: English, Chinese, German, Spanish, French, Japanese, Italian, Korean and more.

MOSS-TTSD is in the Standard tier — 2 credits per 1,000 characters. You can preview any MOSS-TTSD voice for free before generating full audio.

MOSS-TTSD has moderate generation speed. Generation typically takes a few seconds depending on text length.

MOSS-TTSD is rated 5/5 for audio quality on TTS.ai. It delivers studio-grade, human-like speech.

Yes, MOSS-TTSD supports zero-shot voice cloning. Upload 5-30 seconds of reference audio to create a custom voice.

Yes, MOSS-TTSD is specifically recommended for podcasts, audiobooks, dubbed dialogue, conversational content with multiple voices. Its multi-speaker dialogue, up to 5 speakers, 60min coherent audio capabilities make it an excellent choice for this use case.

Yes, MOSS-TTSD is licensed under Apache 2.0, which allows commercial use. Audio generated with MOSS-TTSD voices can be used in videos, podcasts, apps, games, and any other commercial project.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Default Speaker حالا

هر متنی را تایپ کنید و به آن گوش دهید Default Speaker. آزاد برای استفاده.