Report Bug / Feature Request

Discord のテキストから音声に変換

自然なAI音声で音声チャンネルで話すDiscordボットを作成します。カスタムTTSコマンド、音声を使ったモデレーションボット、歓迎メッセージ、およびサーバ用のインタラクティブな体験を作成します。20以上のAI音声モデルと簡単なREST APIを使用します。

ディスコードボット 音声チャンネル カスタム音声 低遅延 REST API

トライ・イット・ナウ

無料でココロ、パイパー、VITS、メロTTS
生成されたオーディオはここに表示されます
生成
TTS.aiが気に入りましたか?友達に教えてあげましょう!

ディスコードのTTS機能

Discord サーバに AI 音声を追加するためのすべてのもの

チャンネル内の自然な音声

ディスコードのロボット型TTSを,音声チャネルに加わり,自然な音調とリズムでメッセージを大声で発話する,生きたAI音声に置き換える。

ユーザごとのカスタム音声

個々のユーザや役割にユニークなAI声を割り当てます。プレミアム会員は独自の声を、モデレータは独自の声を持ちます。

寄付とサブアラート

寄付、サブスクリプション、サーバブーストに対する音声警告をトリガーします。カスタムメッセージは、レベルごとに設定可能な音声で音声チャンネルで読み上げられます。

低遅延応答

ココロとパイパーは2秒以内に音声を送信し,ライブ音声チャネル会話におけるボットの応答が即座で自然に感じられるようにする。

100 以上のボイスが利用可能

30以上の言語に渡る100以上のAI声から選択できます。サーバメンバーは個別の体験を得るために好きな声を選択できます。

API統合

簡単なREST APIは discord.js、discord.py、およびどんなDiscordボットフレームワークとも統合できます。完全なコード例とドキュメントが提供されています。

ディスコードのベスト・ボイス・モデル

リアルタイムのDiscordボットに適した速く、自然に聞こえるモデル

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

適応する: リアルタイムのDiscord音声チャンネルの音声を最も高速で高品質にするオプション

試してみる Kokoro

MeloTTSMeloTTS

Free

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Fast 4/5

適応する: 国際的なDiscordコミュニティをサポートするフリーの多言語モデル

試してみる MeloTTS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

適応する: 面白いボット応答のための楽しい音響効果と笑い声

試してみる Bark

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

適応する: 無料の超高速モデルで、大容量のチャットメッセージ読み込みに適しています

試してみる Piper

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 音声クローン

適応する: 浸透型サーバ用の感情制御付きカスタムボットのクローン

試してみる Chatterbox

ディスコードサーバにAI TTSを追加する方法

ゼロから話すボットに 数分で変わる

1

API キーを取得

無料のTTS.aiアカウントに登録し、ダッシュボードからAPIキーを生成します。無料のレベルには15,000文字と無制限の無料モデルアクセスが含まれます。

2

Discord ボットを設定

Discord ボットアプリケーションを作成し、サーバに招待し、 discord.js または discord.py をインストールします。コード例を使って TTS API に接続します。

3

音声とコマンドの設定Name

/tts, /voice, /say のようなスラッシュコマンドを設定します。デフォルトのボイスをチャンネル、役割、ユーザごとに割り当てます。スパムを防ぐための速度制限を設定します。

4

ライブにデプロイ(G)

VPS、Heroku、または Railway 上でボットをホストします。ボットはコマンドで音声チャンネルに加入し、自然なAIの声でメッセージを話します。

Discord TTS ボットのユースケース

ディスコードコミュニティがTTS.aiを使う方法

チャットツースピーチボット

音声チャネルでテキストメッセージを読み上げるボットを作成します。サーバメンバーがテキストチャネルに入力すると、ボットはユニークなAI音声でメッセージを読み上げます。ユーザごとに異なる音声を割り当てるか、メンバーに自分の音声を選択させることができます。例えば!voice kokoro af_sky のようなコマンドで行います。

  • テキストチャンネルを音声で読み上げます
  • ユーザごとの音声割り当て
  • 自動言語検出
  • 前置き

歓迎とアナウンスボット

新規メンバーが音声チャンネルに加入するときに、歓迎メッセージを発声して歓迎します。イベント、サーバの更新、ゲームセッションの開始をカスタムのAI音声で発表します。異なる発表カテゴリに異なる音声を使用します。歓迎にはフレンドリーな音声、警告には深い音声を使用します。

  • 音声チャンネル加入/離脱アナウンス
  • 予定イベントの発表
  • 各通知タイプのカスタム音声
  • 多言語歓迎メッセージ

ゲームセッションボット

D&D ボットは、各NPCに対して異なるキャラクターの声を話し、アイテムの説明を読み、戦闘の結果を語り、バーチャルテーブルトップセッションをより浸透させます。

  • RPG NPC の複数キャラクターの声
  • クエストと伝承の語り
  • 戦闘解説とプレイバイプレイ
  • 繰り返し文字のボイスクローン

翻訳ボット

多言語 Discord サーバのための TTS と翻訳を組み合わせます。メンバーは自分の言語で話し、ボットは翻訳し、結果をターゲット言語で話します。国際的なゲームコミュニティ、言語学習サーバ、グローバルチームに最適です。

  • リアルタイムメッセージ翻訳+音声
  • 30以上の言語サポート
  • 母語発音別
  • ソース言語を自動検出

Discord ボット統合

discord.js と TTS.ai API を使って Discord ボットに TTS を追加

JavaScript (discord.js v14) を使用 REST API
const { Client, GatewayIntentBits } = require('discord.js');
const { joinVoiceChannel, createAudioPlayer,
        createAudioResource } = require('@discordjs/voice');
const fetch = require('node-fetch');
const fs = require('fs');

const client = new Client({
    intents: [GatewayIntentBits.Guilds, GatewayIntentBits.GuildMessages,
              GatewayIntentBits.GuildVoiceStates, GatewayIntentBits.MessageContent]
});

client.on('messageCreate', async (message) => {
    if (!message.content.startsWith('!say ')) return;
    const text = message.content.slice(5);

    // Generate speech with TTS.ai API
    const res = await fetch('https://api.tts.ai/v1/tts', {
        method: 'POST',
        headers: {
            'Authorization': 'Bearer YOUR_API_KEY',
            'Content-Type': 'application/json'
        },
        body: JSON.stringify({
            text: text,
            model: 'kokoro',
            voice: 'af_heart',
            format: 'wav'
        })
    });

    // Play in voice channel
    const buffer = await res.buffer();
    fs.writeFileSync('/tmp/tts.wav', buffer);
    const connection = joinVoiceChannel({
        channelId: message.member.voice.channelId,
        guildId: message.guildId,
        adapterCreator: message.guild.voiceAdapterCreator
    });
    const player = createAudioPlayer();
    player.play(createAudioResource('/tmp/tts.wav'));
    connection.subscribe(player);
});

どんなDiscordサーバでも使える

テスト用の無料プラン、活動サーバ用の安価なプラン。

フリー・タイア

$0

登録で50クレジット

  • 4つのフリーモデル
  • ボットの設定をテスト
  • クレジットカード不要

スターター

$9

500クレジット/月

  • 20以上の全ての声優モデル
  • 中小型サーバ
  • APIアクセス

プロ

$29

2000クレジット/月

  • ハイトラフィックサーバ
  • プレミアムモデル+優先
  • 声のクローン
価格を表示

よくある質問

TTS for Discord に関するよくある質問

Discord ボットアプリケーションを作成し、コマンドを処理するのに discord.js または discord.py を使用し、オーディオを生成するために TTS.ai API を呼び出します。この API は @discordjs/voice または discord.py voice を使ってボットが Discord ボイスチャンネルにストリーミングするオーディオバイトを返します。

Kokoro は典型的なメッセージに対して 2 秒以下で音声を生成します。Discord の音声接続オーバーヘッドと組み合わせると、コマンドから音声への全体の遅延は 2-4 秒です。Piper は単純なメッセージに対してさらに速くなります。

はい。ボットのデータベースに Discord ユーザ ID ごとの音声設定を保存します。ユーザが TTS コマンドを送ると、彼らの好みの音声とモデルを検索し、その設定でオーディオを生成します。ユーザは /voice コマンドで音声を変更できます。

はい。Kokoro、Piper、VITS、MeloTTSは使用制限なしで完全にフリーです。小規模なDiscordサーバの場合、フリープランはすべてのTTSニーズに十分です。より大きなサーバは、音声クローンやエモーション機能を備えたプレミアムモデルを必要とするかもしれません。

音声チャンネルごとに TTS リクエストをキュー化し、順次処理します。異なるチャンネルからの同時リクエストを扱うには、ボットコードに async/await パターンを使用してください。APIは並列リクエストをサポートしており、複数のチャンネルが同時にオーディオを生成できます。

はい。特定のチャンネルでメッセージイベントを聴き取り、自動的に TTS API に送信します。レート制限 (例: 5 秒に一つのメッセージ) とメッセージ長制限を追加して、悪用を防ぎます。管理者がチャンネルごとに自動読み込みを切り替えることができるようにします。

私たちのモデルは30以上の言語をサポートしています。Kokoroは9つの主要な言語をカバーし、Piperは30以上をカバーし、MeloTTSは6つの言語と複数のアクセントを扱います。Discordボットはメッセージの言語を自動的に検出するか、ユーザに好みの言語を設定させます。

ボットにレート制限を実装します。例えば、ユーザ当たり毎分3回の要求。メッセージ間のクールダウンを追加し、TTS を特定のチャンネルまたは役割に制限し、最大文字数を設定し、テキストを API に送信する前に侮辱フィルタを追加します。

はい。Chatterbox または GPT-SoVITS を使って 5-30 秒のオーディオサンプルから音声をクローンします。音声クローン API を使って参照音声をアップロードし、クローンされた音声 ID をボットのすべての TTS リクエストに使用して、ユニークなボットパーソナリティを作成します。

はい。ボットはステージチャンネルにスピーカーとして参加し、TTS オーディオを提供できます。これはコミュニティイベント、Q&Aセッション、およびボットが提出された質問やアナウンスを読み上げるようなモデレートされた討論にとって非常に便利です。

無料モデル(Kokoro、Piper)を使うと、TTS APIのコストはゼロです。 唯一のコストはボットホスティングで、ベーシック VPS では月額5ドルで済むでしょう。 プレミアムモデルは文字を使用しますが、音声品質や機能を向上させるためにオプションです。

もちろんです。TTS をモデレーションボット、ミュージックボット、ゲームボットと組み合わせてください。例えば、音声チャンネルでモデレーションの動作を発表したり、ゲームスコアを大声で読み上げたり、ナレーターのための TTS を使った対話型音声ベースのゲームを作成したりできます。
5.0/5 (1)

改善点は何ですか?フィードバックは問題を解決するのに役立ちます。

ディスコードボットに音声を付ける準備はいいですか?

20以上の音声モデル、低遅延、簡単なREST API。