Mô hình mã nguồn mở chuyển văn bản thành giọng nói
Mỗi mô hình TTS trên nền tảng của chúng tôi là mã nguồn mở với giấy phép thương mại thân thiện. MIT, Apache 2. 0 — không khóa sở hữu, không giới hạn sử dụng, không phí cấp phép bất ngờ. Dùng chúng thông qua API lưu trữ của chúng tôi, hoặc tự lưu trữ chúng trên cơ sở hạ tầng của bạn với sự kiểm soát đầy đủ.
Thử ngay
Lợi ích của TTS mã nguồn mở
Tại sao các mô hình mã nguồn mở quan trọng cho các dự án của bạn
Giấy phép mã nguồn mở
Mỗi mẫu trên TTS.ai sử dụng giấy phép mã nguồn mở không có hộp đen độc quyền, không bị nhà sản xuất khóa, không có phí cấp phép bất ngờ.
MIT / Apache 2. 0
Các mô hình được cấp phép theo MIT hoặc Apache 2.0, giấy phép mã nguồn mở cho phép nhất. Dùng thương mại, sửa đổi, phân phối lại — không giới hạn.
Tự chủ
Tải xuống bất kỳ mô hình nào và chạy nó trên phần cứng của bạn. Kiểm soát đầy đủ dữ liệu, thời gian đợi và cơ sở hạ tầng. Không cần phụ thuộc vào đám mây.
Được tối ưu hóa GPU
Các mô hình được tối ưu hóa cho GPU NVIDIA với hỗ trợ CUDA. Piper chỉ chạy trên CPU. Hầu hết các mô hình cần 2-8GB VRAM để suy luận hiệu quả.
Bảo trì cộng đồng
Các cộng đồng mã nguồn mở tích cực duy trì và cải thiện các mô hình này.
Dùng thương mại được
Tất cả các mô hình cho phép sử dụng thương mại theo giấy phép của họ. Xây dựng sản phẩm, bán dịch vụ, và tạo nội dung thương mại mà không có bản quyền hoặc phí sử dụng.
Catalogue Model Open Source của chúng tôi
Mỗi người mẫu, giấy phép của nó, và những gì nó làm tốt nhất
Kokoro
Free
Lightweight 82M parameter model delivering studio-quality speech with blazing-fast inference.
Tốt nhất cho: Apache 2.0 — mô hình miễn phí chất lượng tốt nhất, 82M tham số, dễ dàng tự chủ
Thử đi. Kokoro
Piper
Free
A fast, local neural text to speech system optimized for Raspberry Pi and embedded devices.
Tốt nhất cho: MIT — chỉ CPU, hoàn hảo cho các thiết bị edge và tự lưu trữ tích hợp
Thử đi. Piper
VITS
Free
Conditional variational autoencoder with adversarial learning for end-to-end text-to-speech.
Tốt nhất cho: MIT — kiến trúc cơ sở được sử dụng bởi nhiều mô hình hạ lưu
Thử đi. VITS
Bark
Standard
Transformer-based text-to-audio model that generates realistic speech, music, and sound effects.
Tốt nhất cho: MIT — khả năng tạo âm thanh độc đáo vượt quá TTS tiêu chuẩn
Thử đi. Bark
Tortoise TTS
Premium
Multi-voice text-to-speech focused on quality with autoregressive architecture.
Tốt nhất cho: Apache 2.0 — chất lượng tối đa, thực thi tham chiếu được nghiên cứu rộng rãi
Thử đi. Tortoise TTS
OpenVoice
Premium
Instant voice cloning with granular control over style, emotion, and accent.
Tốt nhất cho: MIT — mã nguồn mở sao chép giọng nói với kiểm soát kiểu dáng hạt
Thử đi. OpenVoiceCách sử dụng TTS mã nguồn mở
Dùng API của chúng tôi hoặc tự chạy mô hình
Tìm hiểu các mô hình mã nguồn mở
Xem danh mục của chúng tôi với hơn 20 mẫu TTS mã nguồn mở. Mỗi trang mẫu cho thấy giấy phép, kiến trúc, khả năng, và yêu cầu tự lưu trữ.
Thử trong trình duyệt
Thử nghiệm bất kỳ mô hình nào trực tiếp trên TTS.ai mà không cần cài đặt gì cả. Máy chủ GPU của chúng tôi xử lý xử lý để bạn có thể đánh giá chất lượng trước khi tự lưu trữ.
Tự chủ hoặc sử dụng API của chúng tôi
Clone model repos from GitHub and run locally, or use our hosted API for production. Self-hosting gives full control; our API provides managed infrastructure.
Xây dựng ứng dụng của bạn
Tạo TTS trong sản phẩm của bạn bằng cách sử dụng các mô hình tự lưu trữ hoặc API REST của chúng tôi. Tất cả các mô hình đều có thể sử dụng thương mại mà không cần phí cấp phép hay bản quyền.
So sánh giấy phép
Tất cả các mẫu trên TTS.ai sử dụng giấy phép mã nguồn mở thương mại thân thiện
| Mô hình | Giấy phép | Dùng thương mại | Sửa đổi | Máy tự động | Định danh |
|---|---|---|---|---|---|
| Kokoro | Apache 2.0 | Cần thiết | |||
| Piper | MIT | Tùy chọn | |||
| VITS | MIT | Tùy chọn | |||
| MeloTTS | MIT | Tùy chọn | |||
| Chatterbox | MIT | Tùy chọn | |||
| Tortoise TTS | Apache 2.0 | Cần thiết | |||
| StyleTTS 2 | MIT | Tùy chọn | |||
| OpenVoice | MIT | Tùy chọn | |||
| Sesame CSM | Apache 2.0 | Cần thiết | |||
| Orpheus | Llama 3.2 | "Built with Llama" |
Tự lưu trữ vs lưu trữ API
Bạn tự chạy mô hình hoặc để chúng tôi xử lý cơ sở hạ tầng
Máy tự động trên phần cứng của bạn
Mỗi mô hình trên TTS.ai có sẵn như một dự án mã nguồn mở trên GitHub hoặc Hugging Face. Tải về trọng lượng, cài đặt các phụ thuộc, và chạy suy luận trên GPU của bạn. Bạn có thể kiểm soát hoàn toàn về thời gian đợi, riêng tư, và quy mô.
- Tự do dữ liệu hoàn toàn — âm thanh không bao giờ rời máy chủ của bạn
- Không có chi phí mỗi yêu cầu sau khi cài đặt ban đầu
- Điều chỉnh tinh tế tùy chỉnh trên dữ liệu của bạn
- Cần phần cứng GPU (NVIDIA khuyến nghị)
- Bạn quản lý cập nhật, tăng kích thước và phụ thuộc
Dùng API TTS.ai
Truy cập ngay lập tức vào tất cả 20+ mô hình thông qua một API REST duy nhất. Chúng tôi xử lý việc cung cấp GPU, cập nhật mô hình, quản lý hàng đợi và tăng kích thước. Một chìa khóa API cho phép truy cập vào mỗi mô hình — không cần quản lý các triển khai riêng biệt.
- Không cần phần cứng GPU
- Tất cả 20+ mẫu thông qua một API
- Cập nhật và cải tiến mô hình tự động
- Thời gian hoạt động 99,9% với cơ sở hạ tầng dư thừa
- Chỉ trả tiền cho những gì bạn sử dụng
Bắt đầu nhanh: API hoặc máy chủ tự động
Dùng API lưu trữ của chúng tôi, hoặc cài đặt Kokoro tại địa phương trong vài phút
import requests
response = requests.post("https://api.tts.ai/v1/tts", json={
"text": "Open source TTS with a simple API.",
"model": "kokoro",
"voice": "af_heart",
"format": "wav"
}, headers={"Authorization": "Bearer YOUR_API_KEY"})
with open("output.wav", "wb") as f:
f.write(response.content)
# Install Kokoro locally
pip install kokoro
# Generate speech on your own GPU
import kokoro
pipeline = kokoro.KPipeline(lang_code="a")
generator = pipeline("Hello from your own server!", voice="af_heart")
for i, (gs, ps, audio) in enumerate(generator):
kokoro.save(audio, f"output_{i}.wav")
Mã nguồn mở, giá cả phải chăng
API lưu trữ của chúng tôi làm cho TTS mã nguồn mở truy cập được mà không cần quản lý GPU.
Lớp tự do
$0
15,000 ký tự khi đăng ký
- 4 mẫu mã mã nguồn mở miễn phí
- Không đăng ký cho việc sử dụng cơ bản
- Cho phép sử dụng thương mại
Bắt đầu
$9
500,000 ký tự/tháng
- Tất cả 20+ mẫu mã nguồn mở
- Ký âm
- Truy cập API
Tốt
$29
2,000,000 characters/month
- Xử lý ưu tiên GPU
- Tất cả các mẫu cao cấp
- Hỗ trợ doanh nghiệp
Câu hỏi thường gặp
Câu hỏi thường gặp về mã nguồn mở chuyển văn bản sang nói
Chúng tôi có thể cải thiện gì? phản hồi của bạn giúp chúng tôi khắc phục vấn đề.
Thử mã nguồn mở TTS hôm nay
20+ mô hình mã nguồn mở, tất cả đều được cấp phép thương mại. Dùng API của chúng tôi hoặc tự chủ — lựa chọn là của bạn.