About TTS.ai

Nền tảng giọng nói AI mã nguồn mở toàn diện nhất. 24+ mẫu, 100+ giọng nói, tất cả ở một nơi.

Được tạo bởi

TTS.ai được tạo bởi

Nhiệm vụ của chúng ta

TTS.ai được xây dựng trên một niềm tin đơn giản: công nghệ giọng nói AI tốt nhất nên được truy cập bởi mọi người. Trong khi các dịch vụ độc quyền thu phí cao hơn cho văn bản chuyển sang nói cơ bản, cộng đồng mã nguồn mở đã tạo ra các mô hình tương đương hoặc vượt quá chất lượng thương mại.

Chúng tôi tập hợp những mô hình AI giọng nói mã nguồn mở tốt nhất vào một nền tảng đơn giản, dễ sử dụng, không bị ràng buộc bởi nhà cung cấp, không thu thập dữ liệu, chỉ có công nghệ giọng nói mạnh mẽ với giá cả hợp lý.

Chúng tôi cung cấp

Văn bản sang Giọng nóiComment

24+ mẫu bao gồm Kokoro, Chatterbox, Bark, và nhiều hơn. Từ tổng hợp nhẹ nhàng nhanh đến chất lượng sản xuất phòng thu.

Từ nói sang văn bảnName

Được cung cấp bởi Whisper, Faster-Whisper, và SenseVoice. Phiên âm âm thanh bằng hơn 100 ngôn ngữ với dấu thời gian và phát hiện người nói.

Bản sao giọng

Sao chép bất kỳ giọng nói nào từ mẫu 5 giây. Chatterbox, GPT-SoVITS, CosyVoice 2, và nhiều hơn nữa. Tạo giọng nói tùy chỉnh cho các dự án của bạn.

Xử lý âm thanh

Tăng cường âm thanh, gỡ bỏ giọng hát, tách đoạn, gỡ bỏ tiếng vang, phát hiện phím/BPM, và chuyển đổi định dạng. Tất cả đều được điều khiển bởi AI.

Thảo luận bằng giọng nói

Truyền tải giọng nói thời gian thực với AI. Chọn mô hình và giọng nói của bạn để trải nghiệm trò chuyện tương tác.

API của nhà phát triển

API REST tương thích với OpenAI. Python SDK, ví dụ mã, và tài liệu chi tiết. Xây dựng tính năng giọng nói vào ứng dụng của bạn.

Mã nguồn mở trước

Mỗi mô hình trên TTS.ai là mã nguồn mở, được cấp phép theo MIT hoặc Apache 2.0.

Chúng ta có.

Kokoro
Chatterbox
CosyVoice 2
Bark
Fish Speech
Piper
VITS
MeloTTS
StyleTTS2
Tortoise
GLM-TTS
Dia
Whisper
Demucs
And more...

Tất cả trọng lượng mô hình được tải về từ kho chính thức của chúng. Chúng tôi không thêm bất kỳ sửa đổi độc quyền nào.

Cơ sở hạ tầng

TTS.ai chạy trên máy chủ GPU chuyên dụng với GPU NVIDIA Tesla P40 (tổng cộng 96GB VRAM).

  • Cụm GPU dành riêng cho suy luận - không chia sẻ tài nguyên
  • Phân bổ GPU động dựa trên yêu cầu VRAM mô hình
  • Hệ thống ưu tiên 5 hàng đợi cho tốc độ tối ưu
  • Mô hình được tải sẵn trong VRAM để suy luận ngay lập tức
  • Chuyển phát âm thanh hỗ trợ CDN để tải về nhanh

Bảo mật & Tư nhân

  • Không huấn luyện dữ liệu: Chúng tôi không bao giờ dùng âm thanh hay văn bản của bạn để huấn luyện mô hình
  • Tự động xoá: Âm thanh được tạo sẽ tự động xoá sau 24 giờ
  • Mật mã: Tất cả dữ liệu được mã hóa khi chuyển (TLS 1. 2+) và khi nghỉ
  • Không theo dõi:
  • GDPR compliant: Yêu cầu dữ liệu của bạn hoặc xóa bất cứ lúc nào

Bản mẫu:TTS.ai

TTS.ai được xây dựng bởi một nhóm các nhà phát triển độc lập đam mê làm cho công nghệ giọng nói AI có sẵn cho mọi người. Chúng tôi quản lý và phục vụ các mô hình mã nguồn mở tốt nhất từ cộng đồng hơn là đào tạo các mô hình độc quyền.

Cơ sở hạ tầng của chúng tôi chạy trên máy chủ chuyên dụng với NVIDIA Tesla P40 GPU cung cấp 96GB VRAM.

Chúng tôi giảm thiểu lưu trữ dữ liệu. Đầu vào văn bản được xử lý trong thời gian thực và không được lưu trữ vĩnh viễn. Tất cả các tập tin âm thanh được tải lên và tạo ra sẽ tự động bị xóa trong vòng 24 giờ. Chúng tôi không bao giờ sử dụng dữ liệu của bạn để huấn luyện các mô hình AI.

TTS.ai phục vụ cho một cộng đồng phát triển của các nhà phát triển, người tạo nội dung, và các doanh nghiệp trên toàn thế giới.

Trong khi chúng tôi không cung cấp một SLA chính thức cho người dùng cấp miễn phí, các kế hoạch trả phí được hưởng lợi từ xử lý ưu tiên và độ tin cậy cao hơn.

Vâng, mỗi mô hình trên TTS.ai là mã nguồn mở, được cấp phép theo MIT hoặc Apache 2.0. chúng tôi tích cực hỗ trợ cộng đồng AI giọng nói mã nguồn mở và đóng góp tối ưu hóa và tích hợp trở lại hệ sinh thái.

Đường lối của chúng tôi bao gồm thêm các mô hình mới tiên tiến khi chúng được phát hành, mở rộng hỗ trợ ngôn ngữ, cải thiện khả năng trò chuyện giọng nói thời gian thực, và xây dựng nhiều công cụ xử lý âm thanh hơn.

Chúng tôi luôn quan tâm đến những nhà phát triển tài năng đam mê AI giọng nói và công nghệ mã nguồn mở. Nếu bạn quan tâm đến việc đóng góp, hãy liên hệ qua trang liên hệ của chúng tôi.

Vâng, chúng tôi chào đón sự hợp tác với các nhà phát triển, doanh nghiệp và tổ chức muốn tích hợp AI giọng nói vào sản phẩm của họ. Liên hệ với chúng tôi để thảo luận về tích hợp API, định giá khối lượng, hoặc triển khai mô hình tùy chỉnh.

We conduct regular security reviews of our infrastructure. All data is encrypted in transit with TLS 1.2+, passwords are hashed with industry-standard algorithms, and API keys use one-way hashing. Server access is restricted to authorized personnel via SSH keys.

TTS.ai is GDPR compliant and follows data minimization principles. We do not store personal audio data beyond 24 hours, do not use customer data for training, and provide full data access, correction, and deletion rights upon request.

We continuously monitor the open-source voice AI landscape and add new models as they become available and prove their quality. Major model updates typically happen monthly, with minor optimizations deployed on an ongoing basis.