Về

Nền tảng giọng nói AI mã nguồn mở toàn diện nhất. 20+ mẫu, 100+ giọng nói, tất cả ở một nơi.

Được tạo bởi

TTS.ai được tạo ra bởi John Nader (nadermx), một nhà phát triển độc lập xây dựng công cụ AI mã nguồn mở. TTS.ai là một phần của sứ mệnh để tạo ra công nghệ giọng nói AI tốt nhất có thể truy cập được cho mọi người — không bị giới hạn bởi nhà cung cấp, không thu thập dữ liệu, chỉ là công nghệ giọng nói mạnh mẽ với giá cả công bằng.

Nhiệm vụ của chúng ta

TTS.ai được xây dựng trên một niềm tin đơn giản: công nghệ giọng nói AI tốt nhất nên có sẵn cho mọi người. Trong khi các dịch vụ độc quyền tính giá cao cho text-to-speech cơ bản, cộng đồng mã nguồn mở đã tạo ra các mô hình tương đương hoặc vượt quá chất lượng thương mại.

Chúng tôi tập hợp những mô hình giọng nói AI mã nguồn mở tốt nhất vào một nền tảng đơn giản, dễ sử dụng, không bị giới hạn bởi nhà cung cấp, không thu thập dữ liệu, chỉ có công nghệ giọng nói mạnh mẽ với giá cả hợp lý.

Chúng tôi cung cấp

Văn bản sang Giọng nóiComment

20+ mẫu bao gồm Kokoro, Chatterbox, Bark, và nhiều hơn. Từ tổng hợp nhẹ nhàng nhanh đến chất lượng sản xuất phòng thu.

Từ nói sang văn bản

Được cung cấp bởi Whisper, Faster-Whisper, và SenseVoice. Phiên âm âm thanh bằng hơn 100 ngôn ngữ với dấu thời gian và phát hiện người nói.

Bản sao giọng

Sao chép bất kỳ giọng nói nào từ mẫu 5 giây. Chatterbox, GPT-SoVITS, CosyVoice 2, và nhiều hơn nữa. Tạo giọng nói tùy chỉnh cho các dự án của bạn.

Xử lý âm thanh

Tăng cường âm thanh, gỡ bỏ giọng hát, tách đoạn, gỡ bỏ tiếng vang, phát hiện phím/BPM, và chuyển đổi định dạng. Tất cả đều được điều khiển bởi AI.

Thảo luận bằng giọng nói

Truyền tải giọng nói thời gian thực với AI. Chọn mô hình và giọng nói của bạn để trải nghiệm trò chuyện tương tác.

API phát triển

API REST tương thích với OpenAI. Python SDK, ví dụ mã, và tài liệu chi tiết. Xây dựng tính năng giọng nói vào ứng dụng của bạn.

Mã nguồn mở trước

Mỗi mô hình trên TTS.ai là mã nguồn mở, được cấp phép theo MIT hoặc Apache 2.0.

Chúng ta có.

Kokoro
Chatterbox
CosyVoice 2
Bark
Orpheus
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Sesame CSM
Spark
Qwen3-TTS
Whisper
Demucs
Và nhiều hơn nữa...

Tất cả trọng lượng mô hình được tải về từ kho chính thức của chúng. Chúng tôi không thêm bất kỳ sửa đổi độc quyền nào.

Cơ sở hạ tầng

TTS.ai chạy trên máy chủ GPU chuyên dụng với GPU NVIDIA Tesla P40 (tổng cộng 96GB VRAM).

  • Cụm GPU dành riêng cho suy luận - không chia sẻ tài nguyên
  • Phân bổ GPU động dựa trên yêu cầu VRAM mô hình
  • Hệ thống ưu tiên 5 hàng đợi cho tốc độ tối ưu
  • Mô hình được tải sẵn trong VRAM để suy luận ngay lập tức
  • Chuyển phát âm thanh hỗ trợ CDN để tải về nhanh

Tư nhân và an ninh

  • Không huấn luyện dữ liệu: Chúng tôi không bao giờ dùng âm thanh hay văn bản của anh để huấn luyện người mẫu.
  • Tự động xoá: Âm thanh được tạo sẽ tự động bị xóa sau 24 giờ
  • Mật mã: Tất cả dữ liệu được mã hóa khi chuyển (TLS 1. 2+) và khi nghỉ
  • Không theo dõi: Chúng ta đã làm.
  • Hợp với GDPR: Yêu cầu dữ liệu hoặc xóa dữ liệu bất cứ lúc nào

Bản mẫu:TTS.ai

TTS.ai được tạo bởi John Nader (nadermx), một nhà phát triển độc lập đam mê làm cho công nghệ giọng nói AI có thể truy cập được cho mọi người. Chúng tôi quản lý và phục vụ các mô hình mã nguồn mở tốt nhất từ cộng đồng hơn là đào tạo những mô hình độc quyền.

Cơ sở hạ tầng của chúng tôi chạy trên máy chủ chuyên dụng với NVIDIA Tesla P40 GPU cung cấp 96GB VRAM.

Chúng tôi giảm thiểu lưu trữ dữ liệu. Đầu vào văn bản được xử lý trong thời gian thực và không được lưu trữ vĩnh viễn. Tất cả các tập tin âm thanh được tải lên và tạo ra sẽ tự động bị xóa trong vòng 24 giờ. Chúng tôi không bao giờ sử dụng dữ liệu của bạn để huấn luyện các mô hình AI.

TTS.ai phục vụ cho một cộng đồng phát triển của các nhà phát triển, người tạo nội dung, và các doanh nghiệp trên toàn thế giới.

Trong khi chúng tôi không cung cấp một SLA chính thức cho người dùng cấp miễn phí, các kế hoạch trả phí được hưởng lợi từ xử lý ưu tiên và độ tin cậy cao hơn.

Vâng, mọi mẫu trên TTS.ai đều là mã nguồn mở, được cấp phép theo MIT hoặc Apache 2.0 chúng tôi tích cực hỗ trợ cộng đồng AI giọng nói mã nguồn mở và đóng góp tối ưu hóa và tích hợp lại với hệ sinh thái.

Dự án của chúng tôi bao gồm thêm các mô hình mới nhất khi chúng được phát hành, mở rộng hỗ trợ ngôn ngữ, cải thiện khả năng trò chuyện giọng nói thời gian thực, và xây dựng nhiều công cụ xử lý âm thanh hơn.

TTS.ai được xây dựng và duy trì bởi một nhà phát triển độc lập, vì vậy không có vị trí mở. Tuy nhiên, đóng góp mã nguồn mở luôn được chào đón — liên hệ qua trang liên hệ hoặc GitHub.

Vâng, chúng tôi chào đón sự hợp tác với các nhà phát triển, doanh nghiệp và tổ chức muốn tích hợp AI giọng nói vào sản phẩm của họ. Liên hệ với chúng tôi để thảo luận về tích hợp API, định giá khối lượng, hoặc triển khai mô hình tùy chỉnh.

Chúng tôi thường xuyên kiểm tra an ninh cơ sở hạ tầng của mình. Tất cả dữ liệu được mã hóa khi chuyển bằng TLS 1. 2+, mật khẩu được phân chia với thuật toán tiêu chuẩn công nghiệp, và khóa API sử dụng phân chia một chiều. Truy cập máy chủ bị giới hạn cho những người được ủy quyền thông qua khóa SSH.

TTS.ai is GDPR compliant and follows data minimization principles. We do not store personal audio data beyond 24 hours, do not use customer data for training, and provide full data access, correction, and deletion rights upon request.

Chúng tôi liên tục giám sát bối cảnh AI giọng nói mã nguồn mở và thêm các mô hình mới khi chúng trở nên sẵn có và chứng minh chất lượng của chúng.