Report Bug / Feature Request

Голосові агенти комп' ютерного зв' язку - помічники комп' ютерного зв' язку

Побудуйте розумних голосових агентів за допомогою нетипових осіб. Розробіть їх для підтримки клієнта, прийому, репетиторства тощо.

Інструмент збирання агентів

Опишіть роль агента, його особистість, сферу знання і правила спілкування.

Параметри

Як працюють голосові агенти

1) Ви говорите

Розмовляйте зі своїм агентом природно, ваша промова захоплена і потече в режимі реального часу.

2. STT T Transcess

Віспер перетворює вашу мову на текст точно на 99 мов.

3. LLM процеси

Мозок агента LLM обробляє ваші вхідні дані за допомогою персони та системи.

4 Відгуки на TTS

Відповідь перетворюється на природну мову за допомогою вибраного голосу і моделі.

Типи агентів

Шаблони попередньо вбудованих агентів для кожної індустрії і випадків використання

Витрати на параметри@ title: window

Освіта і навчання

Творчі та розваги

Бізнес і внутрішня частина

Особисте

Чому голосові агенти?

Потужний голосовий агент комп' ютерного гравця, який працює відповідно до ваших потреб.

24 години на добу@ label: listbox KDE distribution method

Виконуйте дзвінки й розмови по годиннику без перенапруження.

Багатомовний

Підтримка клієнтів 30+ мовами, які звучать природньо. Немає потреби у багатомовному персоналі.

Нетипова особа

Визначте особистість, тон та досвід вашого агента. Кожен агент відчуває себе унікальним і набраним.

Низька частота

Час субсекунди відповіді, що працює оптимізованим STT, LLM і TTS на каналах відданого GPU.

Часті запитання

Право голосу - це розмовні системи комп' ютерного зв' язку, які поєднують розпізнавання мови (STT), мовну модель (LLM), і текстове мовлення (TTS) для спілкування з голосом. Вони можуть відповідати на запитання, дотримуватися інструкцій і виконувати завдання незалежно, як віртуальний учасник прийому або оператор підтримки.

Балачка - це загальна мета розмови з ШІ 1: 1. Агенти створюються з метою виконання конкретних завдань ♫ Вони мають визначену особу, базу знань і роботу. Агентом може бути сервіс клієнта, який відповідає вашому ЧаПу, а голосова балачка - відкритий діалог.

Замовлення на службі, телефонні апарати IVR, віртуальні секретарі, помічники репетиторів, квадри для продажу, планувальники призначення, інтерактивні оповідачі, спільники з лікування, мовні партнери та інше.

Для низьких розмовних агентів Kokoro є ідеальною мовою, вона створює мовлення майже у 100x швидше, ніж реальний час. Для більш природного діалогового вікна, Dia TTS підтримує багатомовність. Для клонування голосу (порівняно з голосовим голосом) скористайтеся Chatterbox або GPT- SoVITS.

Так. На трубопроводі STT (Faster Whisper) передбачено підтримку 99 мов для розуміння, а моделі TTS на зразок Cosy Voice 2 і GPT- SoVITS підтримують 8+ мов для відповіді. Ви можете будувати багатомовні агенти, які розпізнають і відповідають за допомогою мови, що викликається.

Застаріле завершення роботи (мови у → вимови) зазвичай 1- 3 секунди за допомогою Kkroro для TTS, а швидший Whiper для STT. Це включає STT трансляцію (~200 мс), відповідь LLM (~ 500 мс- 1s) і TTS- синтез (~200 мс).

Так. Кожен з агентів має системний запит, який визначає його особистість, знання, тон і правила поведінки. Ви можете зробити його формальним або випадковим, встановити обмеження на тему, визначити правила ескалації і керувати тим, як він справляється з невідомими питаннями.

Так. Використовуйте наш API STT для розпізнавання мовлення, будь- якого програмного інтерфейсу LLM для виведення голосу, а також для нашого програмного інтерфейсу TTS. Наші сумісні з OpenAI кінцеві точки роблять інтеграцію зрозумілою. Серед планів Pro і Pro і Proinecess є доступ до API.

З'єднайте наш голосовий агент API з телефонічними платформами, такими як Твіліо, Вонаж або Піво, щоб побудувати телефонні системи IVR, поза межами, викликаючи боти, і віртуальні секретарі, які працюють цілодобово.

Кошти агентів залежать від модифікацій, які використовуються. Вільні моделі (Kokoro, Piper) коштували 0 символів для TTS. STT - це 1000 символів за хвилину. Вартість LLM залежить від вашого постачальника послуг. Плани запуску ($9/mo) містять 500 000 символів, які потрібні для сотень дій з агентами.

Так. Скористайтеся нашою можливістю клонування голосів, щоб створити власний голос на основі короткої вибірки звуку (до 5 секунд). Моделі на зразок Chatterbox і GPT- SoVITS можуть клонувати ваш голос або будь- який брендовий голос для послідовного досвіду агента.

Так. Всі процеси відбуваються на наших відмінних серверах GPU. Ми не зберігаємо облікові записи або звукові дані після обробки. Дані не розподілено з третьою партією або використовуються для тренування. У бізнес- планах передбачено додаткові параметри відокремлення даних.
5.0/5 (1)

Ваші відгуки допомагають нам вирішити проблеми.

Побудова вашого першого голосового агента

Створення інтелектуальних голосових агентів у хвилинах. Запишіться безкоштовно і почніть будувати 15 000 символів.