불화를위한 텍스트를 음성으로

자연스러운 AI 음성으로 음성 채널에서 말하는 Discord 봇을 만들 수 있습니다. 20개 이상의 AI 음성 모델과 간단한 REST API를 사용하여 맞춤형 TTS 명령, 음성 지원 중재 봇, 환영 메시지, 서버를 위한 대화형 환경을 만들 수 있습니다.

디스코드 봇 음성 채널 사용자 정의 음성 낮은 지연 시간 REST API

지금 시도해 보세요

Kokoro, 파이퍼, VITS, MeloTTS와 무료
생성된 오디오가 여기에 나타납니다
생성됨
다운로드
TTS.ai가 마음에 드시나요? 친구들에게 알려주세요!

디스코드 TTS 기능

디스코드 서버에 AI 음성을 추가하는 데 필요한 모든 것

채널에서 자연스러운 음성

음성 채널에 합류하고 자연스러운 음조와 리듬으로 메시지를 크게 말하는 생생한 AI 음성으로 로봇식 Discord TTS를 대체하십시오.

사용자별 사용자 정의 음성

개별 사용자 또는 역할에 고유한 AI 음성을 할당합니다. 프리미엄 가입자는 독점적인 음성을 얻을 수 있으며 중재자는 자신만의 독특한 사운드를 갖습니다.

기부 및 서브 알림

기부, 구독 및 서버 부스트에 대한 음성 알림을 트리거합니다. 계층별로 구성 가능한 음성을 사용하여 음성 채널에서 사용자 지정 메시지를 크게 읽습니다.

낮은 지연 응답

Kokoro와 Piper는 2초 이내에 오디오를 전송하여 라이브 음성 채널 대화에서 봇 응답이 즉각적이고 자연스럽게 느껴지도록 보장합니다.

100+ 사용 가능한 음성

30개 이상의 언어로 100개 이상의 AI 음성을 선택할 수 있습니다. 모든 서버 멤버는 개인화된 경험을 위해 자신이 좋아하는 음성을 선택할 수 있습니다.

API 통합

간단한 REST API는 discord.js, discord.py 및 모든 Discord 봇 프레임워크와 통합됩니다. 전체 코드 예제 및 문서 제공.

디스코드를위한 최고의 음성 모델

빠르고 자연스러운 소리의 모델은 실시간 Discord 봇에 이상적입니다.

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

최적의 용도: 실시간 Discord 음성 채널 연설을위한 가장 빠른 고품질 옵션

시도해 보기 Kokoro

MeloTTSMeloTTS

Free

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Fast 4/5

최적의 용도: 국제 Discord 커뮤니티를 지원하는 무료 다국어 모델

시도해 보기 MeloTTS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

최적의 용도: 재미있는 사운드 효과와 웃음 엔터테인먼트 봇 응답

시도해 보기 Bark

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

최적의 용도: 무료 초고속 모델은 대용량 채팅 메시지 읽기에 이상적입니다

시도해 보기 Piper

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 음성 복제

최적의 용도: 몰입형 서버를 위한 감정 제어 기능을 갖춘 맞춤형 봇 개성 복제

시도해 보기 Chatterbox

디스코드 서버에 AI TTS를 추가하는 방법

0에서 말하는 봇으로 몇 분 안에

1

API 키 가져오기

무료 TTS.ai 계정에 가입하고 대시보드에서 API 키를 생성하십시오. 무료 계층에는 15,000 개의 문자와 무제한 무료 모델 액세스가 포함됩니다.

2

디스코드 봇 설정하기

Discord 봇 애플리케이션을 만들고, 서버에 초대하고, discord.js 또는 discord.py를 설치합니다. 코드 예제를 사용하여 TTS API에 연결합니다.

3

음성 및 명령 설정

/tts, /voice, /say와 같은 슬래시 명령을 설정합니다. 채널, 역할 또는 사용자별로 기본 음성을 할당합니다. 스팸을 방지하기 위해 속도 제한을 구성합니다.

4

배포 및 라이브로 전환

VPS, Heroku 또는 Railway에서 봇을 호스팅하세요. 봇은 명령에 따라 음성 채널에 참여하고 자연스러운 AI 음성으로 메시지를 말합니다.

Discord TTS 봇 사용 사례

디스코드 커뮤니티가 TTS.ai을 사용하는 방법

채팅에서 음성으로 봇

음성 채널에서 문자 메시지를 큰 소리로 읽는 봇을 만들 수 있습니다. 서버 구성원이 텍스트 채널에 입력하면 봇이 고유한 AI 음성으로 메시지를 말합니다. 서로 다른 사용자에게 다른 음성을 할당하거나 구성원이!voice kokoro af_sky와 같은 명령을 사용하여 자신의 음성을 선택하도록 할 수 있습니다.

  • 텍스트 채널을 음성으로 읽기
  • 사용자별 음성 할당
  • 자동 언어 감지
  • 음성 전에 모욕 필터링

환영 & 발표 봇

새로운 회원이 음성 채널에 가입할 때 음성 환영 메시지로 인사하세요. 사용자 지정 AI 음성으로 이벤트, 서버 업데이트 또는 게임 세션 시작을 발표하세요. 다른 발표 카테고리에 다른 음성을 사용하세요 — 환영을 위한 친절한 음성, 경고를 위한 깊은 음성.

  • 음성 채널 가입/탈퇴 알림
  • 예약된 이벤트 발표
  • 각 발표 유형에 대한 사용자 지정 음성
  • 다국어 환영 메시지

게임 세션 봇

AI 음성 NPC, 퀘스트 내레이션 또는 테이블탑 RPG용 던전 마스터 대화로 게임 세션을 향상시킬 수 있습니다. D&D 봇은 각 NPC의 다른 캐릭터 음성을 말하거나 아이템 설명을 읽거나 전투 결과를 내레이션할 수 있어 가상 테이블탑 세션을 더욱 몰입감 있게 만듭니다.

  • RPG NPC를 위한 다중 캐릭터 음성
  • 퀘스트와 전설 이야기
  • 전투 해설 및 플레이-비-플레이
  • 반복되는 문자에 대한 음성 복제

번역 봇

다국어 Discord 서버를 위한 TTS와 번역을 결합하세요. 회원들이 자신의 언어로 말하거나 타이핑하면 봇이 대상 언어로 결과를 번역하고 말합니다. 국제 게이밍 커뮤니티, 언어 학습 서버, 글로벌 팀에 완벽합니다.

  • 실시간 메시지 번역 + 음성
  • 30개 이상의 언어 지원
  • 언어별 원어민 발음
  • 자동으로 원본 언어 검색

디스코드 봇 통합

discord.js와 TTS.ai API로 디스코드 봇에 TTS 추가

자바스크립트 (discord.js v14) REST API
const { Client, GatewayIntentBits } = require('discord.js');
const { joinVoiceChannel, createAudioPlayer,
        createAudioResource } = require('@discordjs/voice');
const fetch = require('node-fetch');
const fs = require('fs');

const client = new Client({
    intents: [GatewayIntentBits.Guilds, GatewayIntentBits.GuildMessages,
              GatewayIntentBits.GuildVoiceStates, GatewayIntentBits.MessageContent]
});

client.on('messageCreate', async (message) => {
    if (!message.content.startsWith('!say ')) return;
    const text = message.content.slice(5);

    // Generate speech with TTS.ai API
    const res = await fetch('https://api.tts.ai/v1/tts', {
        method: 'POST',
        headers: {
            'Authorization': 'Bearer YOUR_API_KEY',
            'Content-Type': 'application/json'
        },
        body: JSON.stringify({
            text: text,
            model: 'kokoro',
            voice: 'af_heart',
            format: 'wav'
        })
    });

    // Play in voice channel
    const buffer = await res.buffer();
    fs.writeFileSync('/tmp/tts.wav', buffer);
    const connection = joinVoiceChannel({
        channelId: message.member.voice.channelId,
        guildId: message.guildId,
        adapterCreator: message.guild.voiceAdapterCreator
    });
    const player = createAudioPlayer();
    player.play(createAudioResource('/tmp/tts.wav'));
    connection.subscribe(player);
});

어떤 Discord 서버에도 적합

테스트를위한 무료 계층, 활성 서버에 대한 저렴한 계획.

무료 계층

$0

가입시 15 크레딧

  • 4 무료 모델
  • 봇 설정 테스트
  • 신용카드 필요 없음

시작

$9

500 크레딧/월

  • 모든 20+ 음성 모델
  • 소형에서 중형 크기의 서버
  • API 액세스

프로

$29

2000 크레딧/월

  • 높은 트래픽 서버
  • 프리미엄 모델 + 우선순위
  • 음성 복제
전체 가격 보기

자주 묻는 질문

Discord용 TTS에 대한 일반적인 질문

Discord 봇 애플리케이션을 만들고 discord.js 또는 discord.py를 사용하여 명령을 처리하고 TTS.ai API를 호출하여 오디오를 생성합니다. API는 @discordjs/voice 또는 discord.py voice를 사용하여 봇이 Discord 음성 채널로 스트리밍하는 오디오 바이트를 반환합니다.

Kokoro는 일반적인 메시지에 대해 2초 이내에 오디오를 생성합니다. Discord 음성 연결 오버헤드와 결합하면 총 지연 시간은 일반적으로 명령에서 음성으로 2-4초입니다. Piper는 간단한 메시지에 대해 더 빠릅니다.

예. Discord 사용자 ID별 음성 선호도를 봇의 데이터베이스에 저장합니다. 사용자가 TTS 명령을 보낼 때, 선호하는 음성과 모델을 찾은 다음 해당 설정으로 오디오를 생성합니다. 사용자는 /voice 명령을 사용하여 음성을 변경할 수 있습니다.

예. Kokoro, Piper, VITS, MeloTTS는 사용 제한 없이 완전히 무료입니다. 소규모 Discord 서버의 경우 무료 계층은 모든 TTS 요구 사항에 충분합니다. 더 큰 서버는 음성 복제 및 감정 기능을 위해 프리미엄 모델을 원할 수 있습니다.

음성 채널당 TTS 요청을 대기열에 놓고 순차적으로 처리합니다. 봇 코드에서 비동기화/기다림 패턴을 사용하여 다른 채널에서 동시에 오는 요청을 처리합니다. API는 병렬 요청을 지원하므로 여러 채널에서 동시에 오디오를 생성할 수 있습니다.

예. 특정 채널에서 메시지 이벤트를 감시하고 자동으로 TTS API로 보냅니다. 속도 제한(예: 5초에 한 개의 메시지) 및 메시지 길이 제한을 추가하여 남용을 방지합니다. 운영자가 채널별로 자동 읽기를 전환할 수 있도록 허용합니다.

저희 모델들은 30개 이상의 언어를 지원합니다. Kokoro는 9개의 주요 언어를 지원하며, Piper는 30개 이상의 언어를 지원하며, MeloTTS는 여러 억양 변형을 지원하는 6개의 언어를 지원합니다.

봇에서 속도 제한(예: 사용자당 분당 3회 요청)을 구현하고, 메시지 간에 쿨다운을 추가하고, TTS를 특정 채널 또는 역할에 제한하고, 최대 문자 제한을 설정하고, 텍스트를 API로 보내기 전에 욕설 필터를 추가합니다.

예. Chatterbox 또는 GPT-SoVITS를 사용하여 5-30초 오디오 샘플에서 음성을 복제합니다. 음성 복제 API를 통해 참조 오디오를 업로드한 다음 복제된 음성 ID를 봇의 모든 TTS 요청에 사용하여 고유한 봇 개성을 만들 수 있습니다.

예. 봇은 스피커로서 무대 채널에 참여하고 TTS 오디오를 전달할 수 있습니다. 이 기능은 봇이 제출된 질문이나 발표를 큰 소리로 읽는 커뮤니티 이벤트, Q&A 세션 및 중재 토론에 매우 유용합니다.

무료 모델 (Kokoro, 파이퍼)를 사용하여, TTS API 비용은 0입니다. 당신의 유일한 비용은 봇 호스팅, 기본 VPS에서 월 $ 5로 낮을 수 있습니다. 프리미엄 모델은 문자를 사용하지만 향상된 음성 품질과 기능을 위해 선택 사항입니다.

TTS를 중재 봇, 음악 봇 또는 게임 봇과 결합할 수 있습니다. 예를 들어, 음성 채널에서 중재 작업을 발표하거나, 게임 점수를 크게 읽거나, 내레이터를 위해 TTS를 사용하여 대화형 음성 기반 게임을 만들 수 있습니다.
5.0/5 (1)

개선할 수 있는 점은 무엇입니까? 고객님의 피드백이 문제를 해결하는 데 도움이 됩니다.

디스코드 봇에 음성을 넣을 준비가 되셨나요?

API 키를 얻고 오늘 TTS 기반 Discord 봇을 만들기 시작하세요. 20+ 음성 모델, 낮은 지연 시간, 간단한 REST API.