Văn bản sang giọng nói cho Discord

Tạo các lệnh TTS tùy chỉnh, các bot điều chỉnh có khả năng phát âm, các thông điệp chào mừng, và trải nghiệm tương tác cho máy chủ của bạn — được cung cấp bởi hơn 20 mô hình giọng nói AI và một API REST đơn giản.

Discord Bot Kênh giọng nói Âm thanh tùy chỉnh Độ trễ thấp API REST

Thử ngay

Miễn phí với Kokoro, Piper, VITS, MeloTTS
Âm thanh của bạn sẽ xuất hiện ở đây
Tạo
Tải về
Cảm ơn bạn đã tin tưởng TTS.ai!

Tính năng TTS của Discord

Mọi thứ bạn cần để thêm giọng nói AI vào máy chủ Discord của bạn

Giọng nói tự nhiên trong kênh

Thay thế Discord TTS robotic với giọng nói AI sống động tham gia các kênh giọng nói và nói các thông điệp lớn tiếng với giọng điệu và nhịp điệu tự nhiên.

Giọng nói tùy chỉnh cho mỗi người dùng

Chỉ định giọng nói AI độc đáo cho từng người dùng hoặc vai trò. Người đăng ký Premium sẽ có giọng nói độc quyền trong khi người điều khiển có âm thanh riêng biệt.

Thông báo

Tắt báo động giọng nói cho các quyên góp, đăng ký, và tăng tốc máy chủ. Thông điệp tùy chỉnh được đọc to trong các kênh giọng nói với giọng nói cấu hình mỗi cấp. Name

Phản ứng chậm thấp

Kokoro và Piper cung cấp âm thanh trong vòng 2 giây, đảm bảo các phản hồi của bot cảm thấy ngay lập tức và tự nhiên trong các cuộc trò chuyện kênh giọng nói trực tiếp.

Có hơn 100 giọng nói

Chọn từ hơn 100 giọng nói AI trên hơn 30 ngôn ngữ. Mỗi thành viên máy chủ có thể chọn giọng nói yêu thích của họ cho một trải nghiệm cá nhân hóa.

API tích hợp

API REST đơn giản tích hợp với discord.js, discord.py, và bất kỳ khung bot Discord nào.

Mô hình giọng nói tốt nhất cho Discord

Các mô hình âm thanh nhanh, tự nhiên lý tưởng cho các bot Discord thời gian thực

KokoroKokoro

Free

Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.

Fast 5/5

Tốt nhất cho: Tùy chọn chất lượng cao nhất cho giọng nói kênh Discord thời gian thực

Thử đi. Kokoro

MeloTTSMeloTTS

Free

High-quality multilingual text-to-speech that runs on CPU with minimal latency.

Fast 4/5

Tốt nhất cho: Mô hình đa ngôn ngữ miễn phí hỗ trợ cộng đồng Discord quốc tế

Thử đi. MeloTTS

BarkBark

Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Slow 4/5

Tốt nhất cho: Hiệu ứng âm thanh vui nhộn và tiếng cười cho phản ứng vui vẻ của robot

Thử đi. Bark

PiperPiper

Free

A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.

Fast 3/5

Tốt nhất cho: Mô hình siêu nhanh miễn phí lý tưởng cho việc đọc tin nhắn chat với số lượng lớn

Thử đi. Piper

ChatterboxChatterbox

Premium

State-of-the-art zero-shot voice cloning with emotion control from Resemble AI.

Medium 5/5 Bản sao giọng

Tốt nhất cho: Sao chép nhân cách robot tùy chỉnh với điều khiển cảm xúc cho máy chủ hấp dẫn

Thử đi. Chatterbox

Cách thêm AI TTS vào máy chủ Discord của bạn

Từ không có gì đến một robot nói trong vài phút

1

Lấy khóa API của bạn

Đăng ký một tài khoản TTS.ai miễn phí và tạo một chìa khóa API từ bảng điều khiển của bạn. Tầng miễn phí bao gồm 15.000 ký tự cộng với quyền truy cập không giới hạn vào mô hình miễn phí.

2

Cấu hình Discord Bot của bạn

Tạo một ứng dụng bot Discord, mời nó đến máy chủ của bạn, và cài đặt discord.js hoặc discord.py. Dùng ví dụ mã của chúng tôi để kết nối API TTS.

3

Cấu hình âm thanh và lệnhName

Cấu hình lệnh slash như /tts, /voice, và /say. Chỉ định giọng nói mặc định cho mỗi kênh, vai trò, hoặc người dùng. Cấu hình giới hạn tốc độ để ngăn chặn thư rác.

4

Bắt đầu & chạy

Tự động hóa robot của bạn trên VPS, Heroku, hoặc Railway. Robot của bạn sẽ tham gia vào kênh giọng nói theo lệnh và nói thông điệp với giọng nói AI tự nhiên.

Discord TTS Bot Use Cases

Cộng đồng Discord sử dụng TTS.ai như thế nào

Robot Trò chuyện-để-nóiName

Tạo một robot đọc tin nhắn văn bản trong một kênh giọng nói. Các thành viên máy chủ gõ vào một kênh văn bản, và robot nói tin nhắn của họ với giọng nói AI độc đáo. Chỉ định giọng nói khác nhau cho các người dùng khác nhau hoặc cho phép các thành viên chọn giọng nói của riêng họ bằng một lệnh như! voice kokoro af_ sky. Name

  • Đọc kênh văn bản bằng giọng nói
  • Đặt giọng nói cho từng người dùng
  • Tự động phát hiện ngôn ngữ
  • Lọc lời lẽ thô tục trước khi nói

Robot chào mừng và thông báo

Chào mừng thành viên mới bằng một thông điệp chào mừng khi họ tham gia vào một kênh giọng nói. Thông báo sự kiện, cập nhật máy chủ, hoặc bắt đầu phiên chơi với giọng AI tùy chỉnh. Dùng giọng khác nhau cho các loại thông báo khác nhau — giọng thân thiện cho chào mừng, giọng sâu cho cảnh báo.

  • Thông báo gia nhập/rời kênh giọng nói
  • Thông báo sự kiện đã lên lịch
  • Giọng nói tùy chỉnh cho mỗi loại thông báo
  • Thông điệp chào mừng đa ngôn ngữ

Robot phiên chơi gameName

Tăng cường các phiên chơi game với NPC có giọng nói AI, câu chuyện nhiệm vụ, hoặc đối thoại chủ dungeon cho RPG trên bàn. Một bot D&D có thể nói giọng nói nhân vật khác nhau cho mỗi NPC, đọc mô tả đồ vật, hoặc kể lại kết quả chiến đấu - làm cho các phiên chơi trên bàn ảo hấp dẫn hơn.

  • Nhiều giọng nói nhân vật cho NPC RPG
  • Truyện kể về nhiệm vụ và truyền thuyết
  • Trích dẫn chiến đấu và chơi-bằng-trò chơi
  • Bản sao giọng nói cho các ký tự lặp lại

Trình dịch

Gộp TTS với dịch thuật cho một máy chủ Discord đa ngôn ngữ. Các thành viên nói hoặc gõ bằng ngôn ngữ của họ, robot dịch và nói kết quả bằng ngôn ngữ mục tiêu. Tốt cho cộng đồng game quốc tế, máy chủ học ngôn ngữ, và các nhóm toàn cầu.

  • Dịch tin tức thời gian thực + nói
  • Hỗ trợ 30+ ngôn ngữ
  • Tiếng Việt
  • Tự động phát hiện ngôn ngữ nguồn

Tổng hợp bot Discord

Thêm TTS vào bot Discord của bạn với discord.js và API TTS.ai

JavaScript (discord.js v14) REST API
const { Client, GatewayIntentBits } = require('discord.js');
const { joinVoiceChannel, createAudioPlayer,
        createAudioResource } = require('@discordjs/voice');
const fetch = require('node-fetch');
const fs = require('fs');

const client = new Client({
    intents: [GatewayIntentBits.Guilds, GatewayIntentBits.GuildMessages,
              GatewayIntentBits.GuildVoiceStates, GatewayIntentBits.MessageContent]
});

client.on('messageCreate', async (message) => {
    if (!message.content.startsWith('!say ')) return;
    const text = message.content.slice(5);

    // Generate speech with TTS.ai API
    const res = await fetch('https://api.tts.ai/v1/tts', {
        method: 'POST',
        headers: {
            'Authorization': 'Bearer YOUR_API_KEY',
            'Content-Type': 'application/json'
        },
        body: JSON.stringify({
            text: text,
            model: 'kokoro',
            voice: 'af_heart',
            format: 'wav'
        })
    });

    // Play in voice channel
    const buffer = await res.buffer();
    fs.writeFileSync('/tmp/tts.wav', buffer);
    const connection = joinVoiceChannel({
        channelId: message.member.voice.channelId,
        guildId: message.guildId,
        adapterCreator: message.guild.voiceAdapterCreator
    });
    const player = createAudioPlayer();
    player.play(createAudioResource('/tmp/tts.wav'));
    connection.subscribe(player);
});

Giá cả phải chăng cho bất kỳ máy chủ Discord nào

Tầng miễn phí để thử nghiệm, kế hoạch có giá cả phải chăng cho máy chủ hoạt động.

Lớp tự do

$0

15,000 ký tự khi đăng ký

  • 4 mẫu miễn phí
  • Kiểm tra cấu hình robot
  • Không cần thẻ tín dụng

Bắt đầu

$9

500,000 ký tự/tháng

  • Tất cả 20+ mẫu giọng nói
  • Máy chủ cỡ nhỏ đến trung bình
  • Truy cập API

Tốt

$29

2,000,000 characters/month

  • Máy chủ tải cao
  • Các mẫu cao cấp + ưu tiên
  • Ký âm
Xem giá đầy đủ

Câu hỏi thường gặp

Câu hỏi thường gặp về TTS cho Discord

Tạo một ứng dụng bot Discord, sử dụng discord.js hoặc discord.py để xử lý lệnh, và gọi API TTS.ai để tạo âm thanh. API trả về byte âm thanh mà bot của bạn truyền đến kênh giọng nói Discord bằng cách sử dụng @discordjs/voice hoặc discord.py voice.

Kokoro tạo âm thanh trong chưa đến 2 giây cho các thông điệp thông thường. Cùng với kết nối âm thanh trên Discord, thời gian chờ tổng cộng thường là 2-4 giây từ lệnh đến lời nói. Piper thậm chí nhanh hơn cho các thông điệp đơn giản.

Có. Lưu ưu tiên giọng nói cho mỗi ID người dùng Discord trong cơ sở dữ liệu của bot. Khi người dùng gửi một lệnh TTS, tìm giọng nói và mẫu ưa thích của họ, sau đó tạo âm thanh với các thiết lập đó. Người dùng có thể thay đổi giọng nói của họ bằng lệnh /voice.

Có. Kokoro, Piper, VITS, và MeloTTS hoàn toàn miễn phí và không giới hạn sử dụng. Đối với một máy chủ Discord nhỏ, cấp miễn phí là đủ cho tất cả các nhu cầu TTS. Các máy chủ lớn hơn có thể muốn các mẫu cao cấp cho bản sao giọng nói và tính năng cảm xúc.

Đang xếp hàng yêu cầu TTS cho mỗi kênh giọng nói và xử lý chúng theo thứ tự. Dùng mẫu async/await trong mã bot để xử lý yêu cầu đồng thời từ các kênh khác nhau. API hỗ trợ yêu cầu song song, vì vậy nhiều kênh có thể tạo âm thanh cùng lúc.

Có. Lắng nghe các sự kiện tin nhắn trong các kênh cụ thể và tự động gửi chúng đến API TTS. Thêm giới hạn tốc độ (ví dụ, một tin nhắn mỗi 5 giây) và giới hạn chiều dài tin nhắn để ngăn ngừa lạm dụng. Cho phép người điều khiển bật/ tắt đọc tự động cho mỗi kênh.

Các mô hình của chúng tôi hỗ trợ hơn 30 ngôn ngữ. Kokoro bao gồm 9 ngôn ngữ chính, Piper bao gồm 30+, và MeloTTS xử lý 6 ngôn ngữ với nhiều biến thể giọng nói. Discord bot của bạn có thể tự động phát hiện ngôn ngữ thông điệp hoặc cho phép người dùng đặt ngôn ngữ ưa thích của họ.

Thực hiện giới hạn tốc độ trong robot của bạn (ví dụ, 3 yêu cầu mỗi phút mỗi người dùng). Thêm thời gian nghỉ giữa các thông điệp, hạn chế TTS cho các kênh hoặc vai trò cụ thể, đặt giới hạn ký tự tối đa, và thêm bộ lọc ngụy biện trước khi gửi văn bản đến API.

Có. Dùng Chatterbox hoặc GPT-SoVITS để sao chép giọng nói từ một mẫu âm thanh 5-30 giây. Tải lên âm thanh tham chiếu qua API sao chép giọng nói, sau đó sử dụng ID giọng nói sao chép trong tất cả các yêu cầu TTS của robot của bạn cho một tính cách bot độc nhất.

Có. Robot có thể tham gia các kênh sân khấu như một người nói và cung cấp âm thanh TTS. Điều này rất tốt cho các sự kiện cộng đồng, các phiên Q&A, và các cuộc thảo luận được điều khiển nơi mà robot đọc to các câu hỏi hoặc thông báo đã gửi.

Sử dụng các mô hình miễn phí (Kokoro, Piper), chi phí API TTS là không. Chi phí duy nhất của bạn là lưu trữ bot, có thể thấp đến $5/ tháng trên một VPS cơ bản. Các mô hình Premium sử dụng các ký tự nhưng tùy chọn cho chất lượng giọng nói và các tính năng được cải thiện.

Tất nhiên rồi. Gộp TTS với các robot điều chỉnh, robot âm nhạc, hoặc robot trò chơi. Ví dụ, thông báo các hành động điều chỉnh trong các kênh giọng nói, đọc giọng hát của trò chơi, hoặc tạo trò chơi tương tác dựa trên giọng nói bằng cách sử dụng TTS cho người kể chuyện.
5.0/5 (1)

Chúng tôi có thể cải thiện gì? phản hồi của bạn giúp chúng tôi khắc phục vấn đề.

Sẵn sàng để nói chuyện với Discord Bot của bạn chưa?

Tìm một khóa API và bắt đầu xây dựng một bot Discord với TTS hôm nay. 20+ mẫu giọng nói, thời gian chờ thấp, API REST đơn giản.