Free AI Văn bản sang Giọng nóiComment

22+ mẫu mã nguồn mở, 100+ giọng nói, 32+ Không cần tài khoản.

0/500 ký tự Miễn phí
Không có thẻ tín dụng. 50 điểm miễn phí 32+ ngôn ngữ Dùng thương mại được.
0:00 / 0:00
Tải về âm thanh Liên kết hết hạn trong 24h
Giống như TTS.ai?

Mọi thứ bạn cần cho AI giọng nói

26 công cụ được cung cấp bởi 24+ mô hình AI mã nguồn mở

22+ Mô hình giọng nói AI

Bộ sưu tập đầy đủ nhất các mô hình TTS mã nguồn mở trong một nền tảng

KokoroKokoro Free

Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.

Tốt nhất cho: High-quality TTS with minimal latency, streaming applications

Thử miễn phí

PiperPiper Free

Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.

Tốt nhất cho: Quick previews, accessibility, and embedded applications

Thử miễn phí

VITSVITS Free

VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.

Tốt nhất cho: General-purpose text-to-speech with natural prosody

Thử miễn phí

MeloTTSMeloTTS Free

MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.

Tốt nhất cho: Production applications needing fast, multilingual TTS

Thử miễn phí

BarkBark Standard

Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.

Nhà phát triển: Suno · Giấy phép: MIT

Thử đi.

Bark SmallBark Small Standard

Lighter version of Bark with faster inference and lower memory usage.

Nhà phát triển: Suno · Giấy phép: MIT

Thử đi.

CosyVoice 2CosyVoice 2 Standard

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Nhà phát triển: Alibaba (Tongyi Lab) · Giấy phép: Apache 2.0

Thử đi.

Dia TTSDia TTS Standard

Mô hình sinh ra đối thoại đa loa tạo ra các cuộc trò chuyện tự nhiên giữa các loa.

Nhà phát triển: Nari Labs · Giấy phép: Apache 2.0

Thử đi.

Parler TTSParler TTS Standard

Describe the voice you want in natural language and Parler generates matching speech.

Nhà phát triển: Hugging Face · Giấy phép: Apache 2.0

Thử đi.

IndexTTS-2IndexTTS-2 Standard

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Nhà phát triển: Index Team · Giấy phép: Apache 2.0

Thử đi.

Spark TTSSpark TTS Standard

Voice cloning TTS with controllable emotion and speaking style via prompts.

Nhà phát triển: SparkAudio · Giấy phép: Apache 2.0

Thử đi.

GPT-SoVITSGPT-SoVITS Standard

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Nhà phát triển: RVC-Boss · Giấy phép: MIT

Thử đi.

OrpheusOrpheus Standard

Human-level emotional TTS model trained on 100K hours of speech data.

Nhà phát triển: Canopy Labs · Giấy phép: Llama 3.2 Community

Thử đi.

Qwen3 TTSQwen3 TTS Standard

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Nhà phát triển: Alibaba (Qwen) · Giấy phép: Apache 2.0

Thử đi.

ChatterboxChatterbox Premium

Kỹ thuật sao chép giọng nói với kiểm soát cảm xúc từ Resemble AI.

Chất lượng:

Thử đi.

Tortoise TTSTortoise TTS Premium

Text-to-speech đa giọng tập trung vào chất lượng với kiến trúc tự hồi quy.

Chất lượng:

Thử đi.

StyleTTS 2StyleTTS 2 Premium

Human-level text-to-speech through style diffusion and adversarial training.

Chất lượng:

Thử đi.

OpenVoiceOpenVoice Premium

Instant voice cloning with granular control over style, emotion, and accent.

Chất lượng:

Thử đi.

CosyVoice 2CosyVoice 2

Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.

Ngôn ngữ: en, zh, ja, ko, fr, de, it, es

Bản sao giọng

IndexTTS-2IndexTTS-2

Zero-shot TTS with fine-grained emotion control and high expressiveness.

Ngôn ngữ: en, zh

Bản sao giọng

Spark TTSSpark TTS

Voice cloning TTS with controllable emotion and speaking style via prompts.

Ngôn ngữ: en, zh

Bản sao giọng

GPT-SoVITSGPT-SoVITS

Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.

Ngôn ngữ: en, zh, ja, ko

Bản sao giọng

ChatterboxChatterbox

Kỹ thuật sao chép giọng nói với kiểm soát cảm xúc từ Resemble AI.

Ngôn ngữ: en

Bản sao giọng

Tortoise TTSTortoise TTS

Text-to-speech đa giọng tập trung vào chất lượng với kiến trúc tự hồi quy.

Ngôn ngữ: en

Bản sao giọng

OpenVoiceOpenVoice

Instant voice cloning with granular control over style, emotion, and accent.

Ngôn ngữ: en, zh, ja, ko, fr, de, es, it

Bản sao giọng

Qwen3 TTSQwen3 TTS

Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.

Ngôn ngữ: en, zh, ja, ko, de, fr, ru, pt, es, it

Bản sao giọng

API đầu tiên của nhà phát triển

REST API tương thích với OpenAI. Một điểm kết thúc, 22+ mô hình. Hỗ trợ stream cho các ứng dụng thời gian thực.

  • Định dạng tương thích OpenAI
  • Truyền TTS cho các ứng dụng thời gian thực
  • Xử lý hàng loạt cho các công việc lớn
  • Thông báo Webhook
Xem tài liệu API
Python
import requests

response = requests.post(
    "https://api.tts.ai/v1/tts/",
    headers={"Authorization": "Bearer sk-tts-xxx"},
    json={
        "model": "kokoro",
        "text": "Hello from TTS.ai!",
        "voice": "af_bella",
    }
)

with open("output.mp3", "wb") as f:
    f.write(response.content)

Giá đơn giản, minh bạch

Bắt đầu miễn phí, tăng dần khi phát triển.

Miễn phí

$0

50 tín hiệu

  • Kokoro, Piper, VITS, MeloTTS
  • Giới hạn ký tự
  • 3 gen/ giờ (không có tài khoản)
đăng ký miễn phí

Bắt đầu

$9/ms

500 điểm/tháng

  • Tất cả 22+ mẫu
  • Giới hạn 5. 000 ký tự
  • Bản sao giọng
Bắt đầu
Nổi tiếng nhất

Chuẩn

$29/ms

2,000 credit/tháng

  • Mọi thứ trong Starter
  • Truy cập API
  • Xử lý ưu tiên
Lấy chuyên nghiệp

Tập đoàn

$99/ms

10,000 credit/tháng

  • Mọi thứ trong Pro
  • API tập trung
  • Xếp hàng ưu tiên
Liên hệ bán hàng

View all plans including credit packs →

Câu hỏi thường gặp

TTS.ai là nền tảng giọng nói AI toàn diện nhất, cung cấp hơn 22 mô hình chuyển văn bản thành giọng nói, sao chép giọng nói, chuyển giọng nói thành văn bản và các công cụ âm thanh.

Có! TTS.ai cung cấp miễn phí text-to-speech với các mô hình Kokoro, Piper, VITS, và MeloTTS. Không cần tài khoản. Đăng ký để nhận 50 credit miễn phí và truy cập vào tất cả các mô hình. Các kế hoạch trả tiền bắt đầu từ $9/tháng.

Để tăng tốc độ, hãy dùng Kokoro hoặc Piper. Để tăng chất lượng, hãy thử CosyVoice 2 hoặc StyleTTS 2. Để sao chép giọng nói, hãy dùng Chatterbox hoặc GPT- SoVITS. Để so sánh, hãy dùng Dia TTS. Thử nhiều mô hình trên cùng một văn bản.

Có. API REST tương thích với OpenAI cho TTS, STT, sao chép giọng nói, và công cụ âm thanh. Có sẵn trên các kế hoạch Pro ($29/tháng) và Enterprise ($99/tháng). Xem tài liệu tại tts.ai/api/.

Chất lượng giọng nói khác nhau tùy theo mẫu. Các mẫu cao cấp như CosyVoice 2, StyleTTS 2, và Chatterbox tạo ra giọng nói gần như chất lượng con người với giọng điệu và cảm xúc tự nhiên. Các mẫu miễn phí như Kokoro cung cấp chất lượng tuyệt vời cho hầu hết các trường hợp sử dụng.

TTS.ai hỗ trợ hơn 30 ngôn ngữ trên toàn bộ thư viện mô hình của nó. tiếng Anh có hỗ trợ mô hình rộng nhất, nhưng các mô hình như CosyVoice 2 bao gồm tiếng Trung, tiếng Nhật và tiếng Hàn; GPT-SoVITS xử lý tiếng Trung, tiếng Nhật, tiếng Hàn và tiếng Anh; và MeloTTS hỗ trợ tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Trung, tiếng Nhật và tiếng Hàn.

Vâng. Tất cả xử lý diễn ra trên máy chủ GPU dành riêng của chúng tôi. Chúng tôi không lưu nhập văn bản của bạn hoặc âm thanh được tạo ra sau khi gửi. Mẫu giọng nói tải lên để sao chép chỉ được sử dụng cho phiên chạy hiện tại và không được giữ lại. Chúng tôi không bao giờ chia sẻ dữ liệu của bạn với bên thứ ba hoặc sử dụng nó để huấn luyện mô hình.

Yes. All audio generated on TTS.ai is yours to use commercially, including for YouTube videos, podcasts, audiobooks, apps, advertisements, and products. Our models are open source under permissive licenses (MIT, Apache 2.0). No royalties or attribution required.

TTS. ai tạo âm thanh theo định dạng WAV mặc định cho chất lượng tối đa. Bạn có thể chuyển đổi sang MP3, FLAC, OGG, hoặc M4A bằng công cụ chuyển đổi âm thanh miễn phí của chúng tôi. API hỗ trợ xác định định dạng xuất ưa thích của bạn trực tiếp trong yêu cầu.

Upload a short audio sample (as little as 5 seconds) of the voice you want to clone, then type any text to generate speech in that voice. Models like Chatterbox, GPT-SoVITS, and CosyVoice 2 support voice cloning. The cloned voice captures tone, accent, and speaking style.

Các mẫu miễn phí (Kokoro, Piper, VITS, MeloTTS) không yêu cầu tài khoản và không tốn credit. Các mẫu tiêu chuẩn (2 credit/1K characters) bao gồm Bark, CosyVoice 2, F5-TTS, và Dia. Các mẫu Premium (4 credit/1K characters) bao gồm OpenVoice, Chatterbox, StyleTTS 2, và Tortoise. Các mẫu trả phí thường cung cấp chất lượng cao hơn, nhiều giọng nói hơn, và các tính năng bổ sung như sao chép giọng nói.

Vâng. API hỗ trợ xử lý hàng loạt để chuyển đổi số lượng lớn văn bản thành giọng nói. Gửi nhiều yêu cầu và lấy kết quả không đồng bộ bằng cách sử dụng UUID công việc. Các kế hoạch doanh nghiệp ($99/ tháng) bao gồm truy cập hàng đợi ưu tiên để xử lý hàng loạt nhanh hơn. Tốt nhất cho sản xuất sách âm thanh, nội dung khóa học, và các dự án lồng tiếng quy mô lớn.
5.0/5 (1)

Bắt đầu sử dụng giọng nói AI hôm nay

Tham gia các nhà sáng tạo, nhà phát triển và doanh nghiệp sử dụng TTS.ai