Spark TTS

Chinese Default

Mặc định Trung QuốcName Neutral Spark TTS

Chinese Default là giọng nói AI neutral được cung cấp bởi mô hình chuyển văn bản sang nói Spark TTS. Giọng nói standard- level này nói Trung QuốcName và cung cấp tổng hợp giọng nói cao-quality. Với tốc độ tạo trung bình và đánh giá chất lượng 4/5, Chinese Default rất phù hợp với content creation with cloned voices and emotional control. Động cơ Spark TTS được phát triển bởi SparkAudio under the CC BY-NC-SA 4.0 license, làm cho nó an toàn cho sử dụng thương mại. Các tính năng chính bao gồm: voice cloning, emotion control, style control, prompt-based, 5-second cloning. Mô hình Spark TTS cũng hỗ trợ sao chép giọng nói - tải lên một mẫu âm thanh ngắn để tạo ra một giọng nói tùy chỉnh giữ lại các đặc điểm chất lượng tương tự.

Chưa đánh giá

Spark TTSThông tin mẫu

Mô hình Spark TTS
Nhà phát triển SparkAudio
Chất lượng
Tốc độ Trung bình
Giấy phép CC BY-NC-SA 4.0
Kênh Hỗ trợ
Thú Tiêu chuẩn (2 tín hiệu/ 1K ký tự)
Tham số 500M
Kiến trúc BiCodec + LLM + Flow Matching
Năm 2025

Lưu ý: Chinese Default

Ứng dụng được khuyến nghị dựa trên đặc điểm của giọng nói này

Sách âm thanh và Trình bày

Dùng Chinese Default để kể nội dung dạng dài với giai điệu và biểu hiện tự nhiên.

Lồng tiếng Video

Thêm lời giải thích chuyên nghiệp cho video YouTube, quảng cáo và nội dung truyền thông xã hội.

Giọng tự chọn

Sao chép kiểu giọng này với âm thanh của bạn để tạo ra giọng nói TTS độc đáo.

Học và huấn luyệnName

Tạo các tài liệu đào tạo, khóa học và nội dung giáo dục thú vị với lời giải thích AI rõ ràng.

Nhiều hơn Spark TTS Giọng nói

Giọng nói khác từ cùng mô hình TTS

Default

Tiếng AnhName Neutral

Câu hỏi thường gặp

Spark TTS của SparkAudio là một mô hình chuyển văn bản sang nói kết hợp sao chép giọng nói với cảm xúc và phong cách nói có thể kiểm soát. Chỉ cần sử dụng 5 giây âm thanh tham chiếu, nó có thể sao chép giọng nói và sau đó tạo ra giọng nói với cảm xúc, tốc độ và phong cách khác nhau trong khi duy trì bản sắc giọng nói sao chép. Spark TTS sử dụng một hệ thống điều khiển dựa trên lời nhắc.

Spark TTS được phát triển bởi SparkAudio và được phát hành theo giấy phép CC BY-NC-SA 4.0, cho phép sử dụng thương mại của âm thanh được tạo ra.

Spark TTS hỗ trợ 2 ngôn ngữ: tiếng Anh, tiếng Trung.

Spark TTS nằm trong cấp độ Tiêu chuẩn — 2 tín hiệu trên 1. 000 ký tự. Bạn có thể xem trước bất kỳ giọng nói Spark TTS nào miễn phí trước khi tạo ra âm thanh đầy đủ.

Spark TTS có tốc độ tạo trung bình. Việc tạo thường mất vài giây tùy thuộc vào độ dài văn bản.

Spark TTS được đánh giá 4/5 cho chất lượng âm thanh trên TTS.ai.

Có, Spark TTS hỗ trợ sao chép giọng nói không cần chụp ảnh. Tải lên 5-30 giây âm thanh tham chiếu để tạo giọng nói tùy chỉnh.

Vâng, Spark TTS được khuyến cáo đặc biệt cho việc tạo nội dung với giọng nói nhân bản và kiểm soát cảm xúc. Khả năng nhân bản giọng nói, kiểm soát cảm xúc, kiểm soát phong cách của nó làm cho nó là một lựa chọn tuyệt vời cho trường hợp sử dụng này.

Có, Spark TTS được cấp phép theo CC BY-NC-SA 4.0, cho phép sử dụng thương mại. Âm thanh được tạo ra với giọng nói Spark TTS có thể được sử dụng trong video, podcast, ứng dụng, trò chơi, và bất kỳ dự án thương mại nào khác.

Vâng, tất cả giọng nói trên TTS.ai sử dụng mô hình mã nguồn mở được cấp phép thương mại (MIT, Apache 2. 0). Âm thanh được tạo ra là của bạn để sử dụng trong video, podcast, ứng dụng, trò chơi, và bất kỳ ứng dụng thương mại nào khác.

Gửi một yêu cầu POST đến /api/v1/tts/ với tên mô hình và ID giọng nói. Xem trang Tài liệu API của chúng tôi cho các ví dụ mã trong Python, JavaScript, Go, và cURL.

Có, nhấn nút chơi trên trang này để nghe mẫu. Bạn cũng có thể gõ văn bản tùy chỉnh trên trang Đoạn văn sang Giọng nói và tạo một bản xem trước miễn phí với bất kỳ giọng nào.

Thử đi. Chinese Default Bây giờ

Nhập bất kỳ văn bản nào và nghe nó được nói bởi Chinese Default. Miễn phí.