Ký âm

Sao chép giọng nói từ mẫu âm thanh ngắn. Tạo giọng nói trong giọng nói sao chép với AI.

Âm thanh tham chiếu

Kéo và thả tập tin vào đây, hoặc duyệt

Upload clear speech (minimum varies by model, 3-15s). MP3, WAV, FLAC. Max 20MB.

file.mp3

0 MB
Chất lượng âm thanh ...
Thời gian: -- Độ âm: -- Im lặng: --
— hoặc ghi lại trực tiếp —
00:00

Mô hình sao chép

Chiều dài âm thanh tối thiểu: 5s

Chất lượng:
Xem thử nhanh hơn

Văn bản để nói

0/5000 chữ cái
Ngôn ngữ nên phù hợp với âm thanh tham chiếu
5 chữ cái Đăng ký to track usage

Kết quả

Tải lên giọng nói tham khảo, nhập văn bản, và tạo để nghe giọng nói sao chép

Sao chép giọng nói và tạo ra lời nói...

0:00 0:00

Âm thanh đã lưu của bạn

Đăng ký để lưu giọng nói sao chép để sử dụng sau.

Cách sao chép giọng nói

1. Tải lên âm thanh tham chiếu

Hãy cung cấp 10- 30 giây giọng nói rõ ràng từ giọng bạn muốn sao chép. Âm thanh càng rõ ràng, kết quả càng tốt.

2. Chọn mẫu

Chọn từ các mô hình sao chép như OpenVoice, Chatterbox, CosyVoice 2, hoặc GPT- SoVITS. Mỗi mô hình có ưu điểm độc đáo cho các ngôn ngữ và phong cách khác nhau.

3. Nhập văn bản và tạo

Nhập văn bản muốn nói trong giọng nói nhân bản và nhấn vào tạo. Tải về hoặc lưu giọng nói để sử dụng sau này.

Tình huống sử dụng

Bản sao giọng nói cho mọi nhu cầu sáng tạo và chuyên nghiệp

Tạo nội dung

Tạo lồng tiếng đồng nhất với giọng nói của chính bạn mà không cần ghi lại. Sửa lỗi, thêm các đoạn mới, hoặc tạo nội dung trong giọng nói của bạn khi không có micro.

Lồng tiếng đa ngôn ngữ

Nói những thứ mà anh không biết

Trò chơi và nhân vậtName

Tạo giọng nói độc đáo cho trò chơi, hoạt hình, và phương tiện tương tác. Sao chép giọng nói tham chiếu và tạo ra các dòng đối thoại không giới hạn.

Sách âm thanh

Kể toàn bộ sách bằng giọng nói nhất quán. Dùng giọng nói sao chép của bạn để sản xuất sách âm thanh hiệu quả mà không cần nhiều giờ ghi âm.

Khả năng tiếp cận

Giúp những người đã mất giọng nói nói lại bằng cách sử dụng mẫu đã ghi âm trước đó. Bảo tồn bản sắc giọng nói cho mục đích cá nhân và y tế.

Giọng của thương hiệu

Bảo trì một giọng nói thương hiệu nhất quán trên tất cả nội dung âm thanh. Sao chép người phát ngôn thương hiệu của bạn và tạo âm thanh tiếp thị, lời nhắc IVR và thông báo.

Gợi ý cho kết quả tốt nhất

Thứ hai

  • Dùng ghi âm rõ ràng, không nhiễu
  • Mục tiêu là 10-30 giây nói chuyện.
  • Dùng loa đơn
  • Ghi âm trong môi trường yên tĩnh
  • Dùng tốc độ nói tự nhiên
  • Ưa chuộng WAV hoặc MP3 tốc độ bit cao

Tránh

  • Âm thanh nền hoặc âm nhạc
  • Nhiều loa trong tham chiếu
  • Clip rất ngắn (dưới 3 giây)
  • Âm thanh nén nặng
  • Tiếng thì thầm hay tiếng la hét
  • Điệu hồi hay dội âm trong ghi âm

Chiều dài mẫu ảnh hưởng đến chất lượng như thế nào

Âm thanh tham chiếu của anh càng dài và sạch sẽ, bản sao càng tốt.

Chiều dài mẫu Chất lượng sao chép Tốt nhất cho Truy cập
5–10s Cơ bản Kiểm tra nhanh — ghi lại âm điệu chung nhưng có thể bỏ qua các sắc thái Tự do
30–60s Tốt Bản sao rắn cho hầu hết các trường hợp sử dụng — ghi lại âm sắc, nhịp điệu và giọng điệu Tự do
2–5 min Tốt lắm. Bản sao trung thực cao — biến dạng tự nhiên, chất lượng nhất quán trên tất cả các kết quả Tài khoản miễn phí
10+ min Tuyệt vời. Sự tái tạo gần như hoàn hảo — lý tưởng cho sách âm thanh, podcast, sử dụng chuyên nghiệp Tài khoản miễn phí
1–2+ hrs Độ chất lượng phòng thu Điều chỉnh một mô hình tùy chỉnh trên giọng nói của bạn — không thể phân biệt được với bản gốc Pro Plan

Để đạt được kết quả tốt nhất, hãy dùng âm thanh sạch với một loa duy nhất, không có nhạc nền, và nói chuyện tự nhiên. Định dạng WAV hay FLAC giữ lại nhiều chi tiết nhất.

Kế hoạch sao chép giọng nói

Bắt đầu miễn phí, nâng cấp khi cần nhiều hơn

Tự do
  • Âm thanh tham khảo 5-60 giây
  • Chất lượng bản sao cơ bản
  • Mô hình Chatterbox
  • Xuất MP3
Nổi tiếng nhất
Tài khoản miễn phí
  • Âm thanh tham khảo 10 phút + 15.000 ký tự
  • Tất cả các mô hình sao chép
  • Chế độ chất lượng HD
  • Lưu giọng nói sao chép
  • Bản sao chép giữa các ngôn ngữ
  • Mọi định dạng xuất
Đăng ký miễn phí
Tốt
  • Âm thanh tham khảo 2 giờ+
  • Chất lượng giống phòng thu
  • Điều chỉnh tinh tế mô hình tùy chỉnh
  • Tạo ra hàng loạt
  • Truy cập API
  • Xử lý ưu tiên
Cập nhật

Câu hỏi thường gặp

Bản sao giọng nói AI sử dụng học sâu để sao chép giọng nói của một người từ một mẫu âm thanh ngắn. Một khi sao chép, bạn có thể tạo ra giọng nói mới nghe giống như người nói gốc. Các mẫu hiện đại chỉ cần 5 giây âm thanh tham chiếu.

Chatterbox cung cấp bản sao không- bắn tốt nhất với điều khiển cảm xúc. CosyVoice 2 rất tốt cho bản sao đa ngôn ngữ (8 ngôn ngữ). GPT- SoVITS xuất sắc với chỉ 5 giây âm thanh. OpenVoice cung cấp kiểm soát kiểu dáng phân tử.

Hầu hết các mẫu hoạt động với 5- 30 giây âm thanh rõ ràng. Các mẫu dài hơn (tối đa 60 giây) thường cho kết quả tốt hơn. Âm thanh nên sạch, loa đơn, không có nhạc nền hay tiếng ồn.

Bạn chỉ nên sao chép giọng nói mà bạn được phép sử dụng. Điều này bao gồm giọng nói của chính bạn, giọng nói từ những người đồng ý, hoặc giọng nói từ nguồn được cấp phép đúng cách. Việc sao chép giọng nói không được phép có thể vi phạm luật pháp trong khu vực bạn đang sống.

Có! Các mô hình sao chép giọng nói đa ngôn ngữ như CosyVoice 2 và GPT- SoVITS có thể tạo ra giọng nói trong các ngôn ngữ khác nhau trong khi duy trì bản sắc giọng nói sao chép. Điều này hữu ích cho lồng tiếng và bản địa hóa.

Dùng một bản ghi sạch với một loa duy nhất, không có nhạc nền hay tiếng ồn, và nói chuyện tự nhiên với âm lượng đồng nhất. Tránh những lời thì thầm, tiếng hét, hay âm thanh xử lý nặng. Định dạng WAV hoặc FLAC ở 16 kHz hoặc cao hơn sẽ cho kết quả tốt nhất.

Sao chép giọng nói là hợp pháp khi bạn có sự đồng ý của chủ giọng nói hoặc sử dụng giọng nói của chính mình. Nhiều khu vực pháp lý có luật bảo vệ quyền tương tự giọng nói. Đừng sao chép giọng nói để giả vờ người khác, tạo deepfakes, hoặc phạm tội gian lận. Luôn luôn nhận được sự cho phép trước khi sao chép giọng nói của người khác.

Có, bạn có thể sử dụng giọng nói nhân bản thương mại miễn là bạn có quyền sử dụng giọng nói tham chiếu. Điều này bao gồm giọng nói của chính bạn, các diễn viên lồng tiếng thuê được đồng ý, hoặc mẫu giọng nói được cấp phép đúng cách. Âm thanh được tạo ra có thể được sử dụng trong sản phẩm, video, và ứng dụng.

Có, người dùng đăng ký có thể lưu hồ sơ giọng nói nhân bản vào tài khoản của họ. Một khi đã lưu, bạn có thể tái sử dụng giọng nói nhân bản cho các thế hệ tương lai mà không cần tải lại âm thanh tham chiếu. Điều này có sẵn dưới phần "Giọng nói của tôi" của tài khoản của bạn.

Các mô hình như Chatterbox cung cấp điều khiển cảm xúc rõ ràng (hạnh phúc, buồn, giận dữ, v. v.) với giọng nói sao chép. Các mô hình khác thu được giọng điệu và phong cách chung từ âm thanh tham chiếu của bạn. Để chuyển cảm xúc tốt nhất, hãy bao gồm lời nói biểu cảm trong mẫu tham chiếu của bạn.

Bản sao giọng nói thường mất 3- 10 giây tùy thuộc vào mô hình và độ dài văn bản. Chatterbox và GPT- SoVITS được tối ưu hóa cho việc sao chép nhanh. Thế hệ đầu tiên có thể mất lâu hơn một chút khi mô hình xử lý âm thanh tham chiếu.

Bản sao giọng nói sử dụng mức giá cao cấp với 4x ký tự cho các mẫu như Chatterbox và Tortoise. Tài khoản miễn phí nhận được 15.000 ký tự khi đăng ký. Các mẫu bản sao cấp chuẩn như CosyVoice 2 sử dụng 2x ký tự.
5.0/5 (1)

Ký âm bất kỳ giọng nào với AI

Tải lên một mẫu âm thanh ngắn và bắt đầu tạo ra giọng nói bằng bất kỳ giọng nào. Đăng ký miễn phí để bắt đầu.