Report Bug / Feature Request

آژانس‌های صدای هوش مصنوعی - ساختن کمک‌های هوش مصنوعی مکالمه‌ای

کارگزاران هوشمند صوتی را با شخصیت‌های سفارشی بسازید. برای پشتیبانی از مشتریان، پذیرش، آموزش و غیره استفاده کنید.

هنوز صداهای TTS برای زبان شما نداریم. به ما کمک کنید تا صداهای خودتان را اضافه کنیم! فروش صدای خود

سازنده کارگزار

نقش، شخصیت، دامنه دانش و قوانین مکالمه عامل را توصیف کنید.

تنظیمات

چگونگی کار آژانس‌های صدا

1. تو حرف بزن

با مامورتون به طور طبيعي صحبت کنيد سخنراني شما ضبط شده و در زمان واقعي پخش ميشه

2. رونوشت STT

ویژوال کامپایلر زبان برنامه‌نویسی C را به ۹۹ زبان مختلف ترجمه می‌کند.

فرایندهای LLM

مغز مامور LLM ورودي ها رو با استفاده از شخصيت و دستورالعمل سيستم پردازش مي کنه

4. پاسخ TTS

پاسخ با استفاده از صدا و مدل انتخابی شما به گفتار طبیعی تبدیل می‌شود.

انواع عامل

قالب‌های عامل پیش ساخته برای هر صنعت و مورد استفاده

روبه‌روی مشتری

آموزش و پرورش

خلاقیت و سرگرمی

تجارت & داخلی‌

شخصی

چرا آژانس‌های صدا؟

عامل‌های صدای هوش مصنوعی که با نیازهای شما مقیاس پذیر هستند

24/7 در دسترس بودن

کارگزارهاي صوتي هيچوقت نمي خوابن تماس ها و مکالمات رو 24 ساعته بدون هيچ کس ديگه اي انجام ميدن

چندزبانه

پشتیبانی از مشتریان در ۳۰ زبان با صداهای طبیعی. نیازی به کارکنان چند زبانه نیست.

شخصیت سفارشی

شخصیت، نگرش و تخصص کارمندت رو مشخص کن هر کارمندی احساس منحصر به فردی داره و برند خودش رو داره

تأخیر کم

زمان پاسخ زیر ثانیه توسط خطوط لوله STT، LLM و TTS بهینه شده در پردازنده‌های گرافیکی اختصاصی تأمین می‌شود.

پرسشهای متداول

آژانس‌های صوتی هوش مصنوعی سیستم‌های هوش مصنوعی مکالمه‌ای هستند که تشخیص گفتار (STT)، یک مدل زبان (LLM) و متن به گفتار (TTS) را برای برقراری مکالمات صوتی طبیعی ترکیب می‌کنند.

یک عامل می‌تواند یک ربات خدمات مشتری باشد که پرسش‌های متداول شما را دنبال می‌کند، در حالی که یک چت صوتی یک مکالمه باز است.

ربات‌های خدمات مشتری، سیستم‌های IVR تلفنی، گیرنده‌های مجازی، دستیارهای تدریس خصوصی، ربات‌های صلاحیت فروش، برنامه‌ریزان ملاقات، داستان‌گویان تعاملی، همراهان درمانی، شرکای تمرین زبان و غیره.

برای کارگزاران مکالمه با تأخیر کم، Kokoro ایده‌آل است - آن تقریباً ۱۰۰ برابر سریعتر از زمان واقعی تولید می‌کند. برای گفتگوی طبیعی تر، Dia TTS از مکالمه چند بلندگو پشتیبانی می‌کند. برای شبیه‌سازی صدا (تطابق با صدای برند)، از Chatterbox یا GPT-SoVITS استفاده کنید.

بله. خط لوله STT (خفه شدن سریعتر) از ۹۹ زبان برای درک پشتیبانی می‌کند ، و مدلهای TTS مانند CosyVoice ۲ و GPT- SoVITS از ۸+ زبان برای پاسخ پشتیبانی می‌کنند. شما می‌توانید عوامل چندزبانه را بسازید که در زبان تماس‌گیرنده تشخیص داده و پاسخ می‌دهند.

این شامل رونویسی STT (~200ms)، پاسخ LLM (~500ms-1s)، و سنتز TTS (~200ms) است.

بله. هر عاملي يه هشدار سيستمي داره که شخصيت، دانش، نغمه و قوانين رفتاري رو تعريف ميکنه. ميتوني رسمي يا غير رسميش کني، مرزهاي موضوعي رو تعيين کني، قوانين بالا رفتن رو تعريف کني، و کنترل کني که چطور سوالات ناشناخته رو حل ميکنه.

بله. از API STT ما برای تشخیص گفتار، هر API LLM برای هوش، و API TTS ما برای خروجی صدا استفاده کنید.

بله. APIهای عامل صدای ما را به پلتفرمهای تلفنی مانند Twilio، Vonage یا Plivo متصل کنید تا سیستم‌های IVR مبتنی بر تلفن، ربات‌های تماس خروجی و گیرنده‌های مجازی را که تماس‌های ۲۴ ساعته را مدیریت می‌کنند، بسازید.

هزینه‌های عامل بستگی به مدل‌های مورد استفاده دارد. مدل‌های سطح آزاد (Kokoro, Piper) هزینه ۰ کاراکتر برای TTS دارند. STT ۱۰۰۰ کاراکتر در دقیقه است. هزینه‌های LLM بستگی به ارائه‌دهنده شما دارد. برنامه‌های آغازین (۹ دلار در ماه) شامل ۵۰۰۰۰۰ کاراکتر است که برای صدها تعامل عامل کافی است.

بله. از ویژگی شبیه‌سازی صدای ما برای ایجاد یک صدای سفارشی از یک نمونه صوتی کوتاه استفاده کنید (حداقل ۵ ثانیه). مدل‌هایی مانند Chatterbox و GPT-SoVITS می‌توانند صدای شما یا هر صدای برند دیگری را برای تجربه عملگر ثابت شبیه‌سازی کنند.

بله. تمام پردازش‌ها بر روی کارگزارهای اختصاصی GPU ما انجام می‌شود. ما پس از پردازش رونوشت‌های مکالمات یا صدا را ذخیره نمی‌کنیم. هیچ داده‌ای با شخص ثالث به اشتراک گذاشته نمی‌شود یا برای آموزش استفاده نمی‌شود. برنامه‌های سازمانی گزینه‌های جداسازی داده‌های اضافی را ارائه می‌دهند.
5.0/5 (1)

چه چیزی میتونیم بهتر کنیم؟ بازخورد شما به ما کمک میکنه مشکلات رو حل کنیم.

ساخت اولین عامل صدای خود

کارگزاران هوشمند صوتی را در چند دقیقه بسازید. مجانی ثبت نام کنید و ۵۰ کرید را برای شروع ساختن دریافت کنید.