Report Bug / Feature Request

AI 音声エージェント - 会話型 AI アシスタントの構築

カスタムパーソナリティを持つインテリジェントなボイスエージェントを構築し、顧客サポート、受付、指導などに配置します。

エージェント・ビルダー

また,エージェントの役割,性格,知識領域,会話ルールを記述した。

設定

ボイスエージェントの仕組み

1.ユー・スピーク

エージェントと自然に話せる あなたの会話はリアルタイムでキャプチャーされストリーミングされる

STTトランスクリプツ

Whisperは99の言語で正確に音声をテキストに変換します。

プロセス

エージェントの脳は あなたの入力を処理します 彼の人格とシステムプロンプトを使って

TTS レスポンス

応答は選択した音声とモデルを使って自然言語に変換されます。

エージェントタイプ

すべての産業およびユースケースに対する予め構築されたエージェントテンプレート

カスタマーファーシング

教育・研修

クリエイティブ・エンターテインメント

内部

人事

なぜボイスエージェント?

あなたのニーズに合わせて拡張できる AI を駆使したボイスエージェント

24時間対応

ボイスエージェントは眠らない スタッフの負担なしに 24時間通話と会話を処理する

多言語

自然に聞こえる声で30以上の言語で顧客をサポートします。多言語スタッフは必要ありません。

カスタムパーソナ

エージェントの性格、トーン、専門性を定義し、それぞれのエージェントがユニークでブランドに合った感覚を与えます。

低遅延

専用GPU上の最適化STT,LLMおよびTTSパイプラインによりサブ秒の応答時間を実現した。

よくある質問

AIボイスエージェントは,音声認識(STT),言語モデル(LLM),テキスト‐トゥ‐スピーチ(TTS)を組み合わせた会話型AIシステムであり,質問に答え,指示に従い,仮想の受付係やサポートエージェントのように自律的にタスクを完了する。

音声チャットはAIとの一般的な1:1の会話です。エージェントは特定のタスクのために作られています。彼らは定義された人物、知識ベース、ワークフローを持っています。エージェントはFAQに従うカスタマーサービスボットであり、音声チャットは開放的な会話です。

カスタマーサービスボット,電話IVRシステム,バーチャルレセプションスタッフ,トレーニングアシスタント,セールス資格ボット,予約スケジューラ,インタラクティブストーリーテラー,セラピーコンパニオン,言語実践パートナーなどがある。

低遅延の会話エージェントに対しては、Kokoroが理想的です。リアルタイムよりも100倍も速く音声を生成します。より自然な対話のためには、Dia TTSは多人数の会話をサポートします。声のクローン化(ブランドの声に合わせる)には、ChatterboxまたはGPT-SoVITSを使用してください。

はい。STTパイプライン (Faster Whisper) は理解のために 99 言語をサポートし、CosyVoice 2 や GPT-SoVITS のような TTS モデルは 8 以上の言語を応答のためにサポートします。呼び出し者の言語で検出し応答する多言語エージェントを作成できます。

TTTの転写(約200ms),LLM応答(約500ms−1s),TTS合成(約200ms)を含む。

はい。各エージェントには、その性格、知識、トーン、行動ルールを定義するシステムプロンプトがあります。それを正式かカジュアルか、トピックの境界を設定し、エスカレーションルールを定義し、未知の質問をどのように扱うかを制御できます。

音声認識には STT API を、知能に LLM API を、音声出力には TTS API を使用できます。OpenAI 互換エンドポイントは統合を簡単にします。Pro と Enterprise プランには API アクセスが含まれています。

電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話機の電話

無料のモデル (Kokoro, Piper) では TTS に対して0文字のコストがかかります。STT は 1,000 文字/分です。LLM のコストはプロバイダに依存します。スタートプラン (月額 9 ドル) には 500,000 文字が含まれており、数百のエージェントインタラクションに十分です。

はい。私たちの音声クローン機能を使って、短いオーディオサンプル(5秒以下)からカスタム音声を作成できます。 Chatterbox や GPT-SoVITS のようなモデルは、一貫したエージェント体験のために、あなたの音声またはあらゆるブランドの音声をクローンできます。

はい、すべての処理は専用のGPUサーバで行われます。処理後の会話録音やオーディオは保存されません。データは第三者と共有されませんし、訓練にも使用されません。エンタープライズプランには追加のデータ隔離オプションがあります。
5.0/5 (1)

改善点は何ですか?フィードバックは問題を解決するのに役立ちます。

初めてのボイスエージェントを作成

数分でインテリジェントな音声エージェントを作成します。無料で登録し、50クレジットを得て作成を開始してください。