Free AI Văn bản sang Giọng nóiComment
22+ mẫu mã nguồn mở, 100+ giọng nói, 32+ Không cần tài khoản.
Mọi thứ bạn cần cho AI giọng nói
26 công cụ được cung cấp bởi 24+ mô hình AI mã nguồn mở
22+ Mô hình giọng nói AI
Bộ sưu tập đầy đủ nhất các mô hình TTS mã nguồn mở trong một nền tảng
Kokoro Free
Kokoro is an 82 million parameter text-to-speech model that punches well above its weight class. Despite its tiny size, it produces remarkably natural and expressive speech. Kokoro supports multiple languages including English, Japanese, Chinese, and Korean with a variety of expressive voices. It runs incredibly fast — generating audio nearly 100x faster than real-time on a GPU.
Tốt nhất cho: High-quality TTS with minimal latency, streaming applications
Thử miễn phí
Piper Free
Piper is a lightweight text-to-speech engine developed by Rhasspy that uses VITS and larynx architectures. It runs entirely on CPU, making it ideal for edge devices, home automation, and applications requiring offline TTS. With over 100 voices across 30+ languages, Piper delivers natural-sounding speech at real-time speeds even on a Raspberry Pi 4.
Tốt nhất cho: Quick previews, accessibility, and embedded applications
Thử miễn phí
VITS Free
VITS (Variational Inference with adversarial learning for end-to-end Text-to-Speech) is a parallel end-to-end TTS method that generates more natural sounding audio than current two-stage models. It adopts variational inference augmented with normalizing flows and an adversarial training process, achieving a significant improvement in naturalness.
Tốt nhất cho: General-purpose text-to-speech with natural prosody
Thử miễn phí
MeloTTS Free
MeloTTS by MyShell.ai is a multilingual TTS library supporting English (American, British, Indian, Australian), Spanish, French, Chinese, Japanese, and Korean. It is extremely fast, processing text at near real-time speed on CPU alone. MeloTTS is designed for production use and supports both CPU and GPU inference.
Tốt nhất cho: Production applications needing fast, multilingual TTS
Thử miễn phí
Bark Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Nhà phát triển: Suno · Giấy phép: MIT
Thử đi.
Bark Small Standard
Lighter version of Bark with faster inference and lower memory usage.
Nhà phát triển: Suno · Giấy phép: MIT
Thử đi.
CosyVoice 2 Standard
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Nhà phát triển: Alibaba (Tongyi Lab) · Giấy phép: Apache 2.0
Thử đi.
Dia TTS Standard
Mô hình sinh ra đối thoại đa loa tạo ra các cuộc trò chuyện tự nhiên giữa các loa.
Nhà phát triển: Nari Labs · Giấy phép: Apache 2.0
Thử đi.
Parler TTS Standard
Describe the voice you want in natural language and Parler generates matching speech.
Nhà phát triển: Hugging Face · Giấy phép: Apache 2.0
Thử đi.
IndexTTS-2 Standard
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Nhà phát triển: Index Team · Giấy phép: Apache 2.0
Thử đi.
Spark TTS Standard
Voice cloning TTS with controllable emotion and speaking style via prompts.
Nhà phát triển: SparkAudio · Giấy phép: Apache 2.0
Thử đi.
GPT-SoVITS Standard
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Nhà phát triển: RVC-Boss · Giấy phép: MIT
Thử đi.
Orpheus Standard
Human-level emotional TTS model trained on 100K hours of speech data.
Nhà phát triển: Canopy Labs · Giấy phép: Llama 3.2 Community
Thử đi.
Qwen3 TTS Standard
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Nhà phát triển: Alibaba (Qwen) · Giấy phép: Apache 2.0
Thử đi.
CosyVoice 2
Alibaba's scalable streaming TTS with human-parity naturalness and near-zero latency.
Ngôn ngữ: en, zh, ja, ko, fr, de, it, es
Bản sao giọng
IndexTTS-2
Zero-shot TTS with fine-grained emotion control and high expressiveness.
Ngôn ngữ: en, zh
Bản sao giọng
Spark TTS
Voice cloning TTS with controllable emotion and speaking style via prompts.
Ngôn ngữ: en, zh
Bản sao giọng
GPT-SoVITS
Few-shot voice cloning TTS that replicates any voice from just 5 seconds of audio.
Ngôn ngữ: en, zh, ja, ko
Bản sao giọng
Chatterbox
Kỹ thuật sao chép giọng nói với kiểm soát cảm xúc từ Resemble AI.
Ngôn ngữ: en
Bản sao giọng
Tortoise TTS
Text-to-speech đa giọng tập trung vào chất lượng với kiến trúc tự hồi quy.
Ngôn ngữ: en
Bản sao giọng
OpenVoice
Instant voice cloning with granular control over style, emotion, and accent.
Ngôn ngữ: en, zh, ja, ko, fr, de, es, it
Bản sao giọng
Qwen3 TTS
Alibaba's multilingual TTS with voice cloning, preset voices, and voice design from text.
Ngôn ngữ: en, zh, ja, ko, de, fr, ru, pt, es, it
Bản sao giọngAPI đầu tiên của nhà phát triển
REST API tương thích với OpenAI. Một điểm kết thúc, 22+ mô hình. Hỗ trợ stream cho các ứng dụng thời gian thực.
- Định dạng tương thích OpenAI
- Truyền TTS cho các ứng dụng thời gian thực
- Xử lý hàng loạt cho các công việc lớn
- Thông báo Webhook
import requests
response = requests.post(
"https://api.tts.ai/v1/tts/",
headers={"Authorization": "Bearer sk-tts-xxx"},
json={
"model": "kokoro",
"text": "Hello from TTS.ai!",
"voice": "af_bella",
}
)
with open("output.mp3", "wb") as f:
f.write(response.content)
Giá đơn giản, minh bạch
Bắt đầu miễn phí, tăng dần khi phát triển.
Miễn phí
50 tín hiệu
- Kokoro, Piper, VITS, MeloTTS
- Giới hạn ký tự
- 3 gen/ giờ (không có tài khoản)
Chuẩn
2,000 credit/tháng
- Mọi thứ trong Starter
- Truy cập API
- Xử lý ưu tiên
Tập đoàn
10,000 credit/tháng
- Mọi thứ trong Pro
- API tập trung
- Xếp hàng ưu tiên
Câu hỏi thường gặp
Bắt đầu sử dụng giọng nói AI hôm nay
Tham gia các nhà sáng tạo, nhà phát triển và doanh nghiệp sử dụng TTS.ai