Sesame CSM

Speaker 0

پریمیوم انگلیسی Neutral Sesame CSM

Speaker 0 یک صدای هوش مصنوعی neutral است که توسط مدل تبدیل متن به گفتار Sesame CSM پشتیبانی می‌شود. این صدای درجه بالا به انگلیسی صحبت می‌کند و ترکیب گفتار با کیفیت استودیو را ارائه می‌دهد. با سرعت تولید آهسته تر اما با دقتی بالا و امتیاز کیفیت 5/۵، Speaker 0 برای ai assistants, chatbots, conversational ai applications مناسب است. این موتور توسط Sesame under the Apache 2.0 license توسعه داده شده و برای استفاده تجاری ایمن است. ویژگی‌های کلیدی عبارتند از: conversational, natural timing, turn-taking, backchannel, 1b parameters.

هنوز رتبه بندی نشده

Sesame CSMاطلاعات مدل

مدل Sesame CSM
توسعه‌دهنده Sesame
کیفیت
سرعت آهسته
مجوز Apache 2.0
شبیه‌سازی در دسترس نیست
حيوان Premium) ۴ کرون / ۱K کاراکتر (
پارامترها 1B
معماری Llama Backbone + Audio Codec
سال 2025

بهترین موارد استفاده برای Speaker 0

کاربردهای پیشنهادی بر اساس ویژگی‌های این صدا

کتابهای صوتی و گویندگی

از Speaker 0 برای روایت محتوای شکل طولانی با نظم و بیان طبیعی استفاده کنید.

صداگذاری ویدئو

گویندگی حرفه‌ای را به ویدئوهای یوتیوب، تبلیغات و محتوای رسانه‌های اجتماعی اضافه کنید.

پخش پادکست

خروجی با کیفیت استودیویی مناسب برای پادکست‌ها، رادیو و پخش حرفه‌ای است.

بازیها و رسانه‌های تعاملیName

کیفیت بالا برای گفتگوی بازی، داستان‌های تعاملی و تجربه‌های غوطه‌ورکننده.

بيشتر Sesame CSM صداها

صداهای دیگر از همان مدل TTS

Speaker 1

انگلیسی Neutral

پرسشهای متداول

مدل سخنرانی مصاحبه‌ای (Sesame CSM) یک مدل ۱ میلیارد پارامتر است که به طور خاص برای تولید سخنرانی مصاحبه‌ای طراحی شده است. این الگوهای طبیعی گفتگوی انسانی را مدل می‌کند ، از جمله زمان‌بندی نوبت‌گیری ، پاسخ‌های کانال پشتی ، واکنش‌های احساسی و جریان گفتگو. CSM صدایی تولید می‌کند که به جای گفتار مصنوعی ، مانند یک گفتگوی طبیعی انسانی است.

Sesame CSM توسط Sesame توسعه داده شده و تحت مجوز آپاچی ۲٫۰ منتشر شده‌است که به استفاده تجاری از صدای تولید شده اجازه می‌دهد.

زبان سیریلیک دارای یک نویسه است:.

Sesame CSM در سطح Premium است — ۴ کرید در هر ۱۰۰۰ کاراکتر. می‌توانید پیش‌نمایش هر صدای Sesame CSM را قبل از تولید صدای کامل رایگان داشته باشید.

Sesame CSM سرعت تولید کندتری دارد (به کیفیت اولویت می‌دهد). هر نسل زمان بیشتری می‌برد اما خروجی با دقتی بالاتر تولید می‌کند.

سسيم سي اس ام براي كيفيت صداي TTS.ai 5/5 رتبه گرفته است اين برنامه يه نوع صحبت انسان مانند استوديويي رو ارائه مي کنه

نه ، Sesame CSM از یک مجموعه ثابت از صداهای درونی استفاده می‌کند. برای شبیه‌سازی صدا ، مدلهایی مانند CosyVoice 2 ، GPT-SoVITS ، یا Chatterbox را امتحان کنید.

بله، Sesame CSM به ویژه برای کمک‌های هوش مصنوعی، چت‌بات‌ها، برنامه‌های هوش مصنوعی مکالمه‌ای توصیه می‌شود. توانایی‌های مکالمه‌ای، زمان‌بندی طبیعی، نوبت‌گیری آن را انتخاب عالی برای این مورد استفاده می‌کند.

بله ، Sesame CSM تحت مجوز آپاچی ۲٫۰ است ، که استفاده تجاری را اجازه می‌دهد. صدایی که با صداهای Sesame CSM تولید می‌شود می‌تواند در ویدئوها ، پادکست‌ها ، برنامه‌ها ، بازی‌ها و هر پروژه تجاری دیگر استفاده شود.

Yes, all voices on TTS.ai use commercially-licensed open-source models (MIT, Apache 2.0). The generated audio is yours to use in videos, podcasts, apps, games, and any other commercial application.

یک درخواست POST را به /api/v1/tts/ با نام مدل و شناسه صدا ارسال کنید. برای مثال‌های کد در پایتون، جاوااسکریپت، گو و cURL صفحه مستندات API ما را ببینید.

بله ، برای شنیدن یک نمونه ، دکمۀ پخش را در این صفحه فشار دهید. همچنین می‌توانید متن سفارشی را در صفحه متن به گفتار تایپ کنید و یک پیش‌نمایش رایگان با هر صدایی تولید کنید.

سعی کن Speaker 0 حالا

هر متنی را تایپ کنید و به آن گوش دهید Speaker 0. آزاد برای استفاده.