Xử lý TTS theo lô

Chuyển đổi hàng trăm văn bản thành giọng nói cùng một lúc. Nhập hàng bằng tay hoặc tải lên một bảng tính CSV/XLSX để tạo âm thanh cho mỗi dòng.

# Văn bản Giọng nói Tên tập tin
1
2
3

Kéo và thả tập tin CSV của bạn vào đây, hoặc duyệt

CSV với cột: text, voice (tùy chọn), filename (tùy chọn)
file.csv
# Văn bản Giọng nói Tên tập tin
Định dạng CSV ví dụ:
textvoicefilename
Chào mừng đến với dịch vụ của chúng tôiaf_heartwelcome
Lệnh của anh đã được gửi.order_shipped
Cảm ơn vì đã gọi.bf_emmathanks

Kéo và thả tập tin Excel của bạn vào đây, hoặc duyệt

XLSX với cột: text, voice (tùy chọn), filename (tùy chọn)
file.xlsx
# Văn bản Giọng nói Tên tập tin
Định dạng XLSX ví dụ:
textvoicefilename
Chào mừng đến với dịch vụ của chúng tôiaf_heartwelcome
Lệnh của anh đã được gửi.order_shipped
Cảm ơn vì đã gọi.bf_emmathanks
0 mục sẵn sàng tạo 0 Tổng số ký tự
Tự do với mô hình Kokoro
Xử lý có thể mất vài phút với các gói lớn
Đang xử lý 0 / 0... 0%
Kết quả hàng loạt
# Tên tập tin Tình trạng Hành động

Thiết lập hàng loạt

Dùng khi một hàng không chỉ ra một giọng nói

Cảm ơn

Tổng chi phí ước tính 0 chữ cái
Số dư hiện tại Không đăng nhập
Cần thêm nhân vật?

Gợi ý xử lý hàng loạt

  • Dùng CSV cho hơn 100 mục để có luồng công việc nhanh nhất
  • Mỗi hàng tạo ra một tập tin âm thanh
  • Tối đa 500 mục mỗi gói
  • Thời gian xử lý phụ thuộc vào tổng chiều dài văn bản
  • Để cột giọng nói trống để dùng giọng nói mặc định
  • Tải về ZIP giữ nguyên mẫu đặt tên của bạn

Xử lý TTS theo lô

Tạo âm thanh cho hàng trăm văn bản trong ba bước đơn giản. Không cần kiến thức về mã lệnh hay API.

Bước 1

Thêm văn bản của bạn

Nhập văn bản bằng tay từng hàng một, hoặc tải lên một bảng tính CSV hoặc XLSX. Mỗi hàng trở thành một tập tin âm thanh. Có thể chọn xác định giọng nói và tên tập tin cho mỗi hàng để kiểm soát đầy đủ mọi kết quả.

Bước 2

Cấu hình thiết lập

Chọn một mô hình AI và giọng nói mặc định áp dụng cho tất cả các hàng không có giọng nói cụ thể. Chọn định dạng xuất (MP3 hoặc WAV) và đặt một mẫu đặt tên: dùng cột tên tập tin, số theo thứ tự, hoặc tiền tố tùy chỉnh.

Bước 3

Tạo và tải về ZIP

Nhấn vào Tạo tất cả và xem tiến độ thời gian thực khi mỗi hàng được xử lý. Bật hoặc tải về kết quả riêng lẻ, hoặc lấy tất cả cùng một lúc như một tập tin lưu ZIP. Mục lỗi có thể được thử lại riêng lẻ.

TTS dùng hàng loạt

Quá trình xử lý hàng loạt tiết kiệm nhiều giờ làm việc lặp đi lặp lại trong giáo dục, điện thoại, thương mại điện tử và bản địa hóa nội dung.

Mô- đun học tập điện tử

Tạo lời giải thích cho toàn bộ khóa học cùng một lúc. Tải lên một bảng tính của các văn bản bài học và tạo ra âm thanh chuyên nghiệp nhất quán trên tất cả các mô- đun mà không cần ghi lại một từ nào bằng tay.

Nhắc IVR

Tạo tất cả các thông báo hệ thống điện thoại trong một gói. Tùy chọn thực đơn, tin nhắn chờ, lời chào sau giờ làm việc, và chuyển đổi bộ phận -- tạo ra hàng trăm thông báo với giọng nói và âm thanh đồng nhất.

Mô tả sản phẩm

Đổi danh mục sản phẩm của bạn thành mô tả âm thanh cho khả năng truy cập, loa thông minh, hoặc kiosk trong cửa hàng. Xuất sản phẩm CSV của bạn và tạo một tập tin âm thanh cho mỗi mục với tên tập tin tương ứng.

Địa phương hóa

Dịch các chuỗi giao diện người dùng hoặc nội dung của bạn sang nhiều ngôn ngữ, sau đó tạo âm thanh theo lô cho mỗi địa phương. Tốt cho các ứng dụng, trò chơi, và trang web cần lời nhắc giọng nói hoặc lời giải thích địa phương.

Catalogue âm thanh

Xây dựng thư viện âm thanh có thể tìm kiếm từ dữ liệu cấu trúc. Bảo tàng, thư viện và kho lưu trữ có thể chuyển đổi siêu dữ liệu, mô tả, hoặc bản ghi vào hướng dẫn âm thanh với xử lý theo lô.

Âm thanh thông báo

Tạo một tập hợp đầy đủ các thông báo, cảnh báo và lời nhắc xác nhận cho ứng dụng hoặc thiết bị của bạn. Tải lên một danh sách các tin nhắn ngắn và tải về một tập tin ZIP của các tập tin âm thanh sẵn sàng để tích hợp. Name

Tính năng xử lý hàng loạt

Mọi thứ bạn cần để xử lý khối lượng lớn văn bản thành lời nói một cách hiệu quả và đáng tin cậy.

Nhập CSV & XLSX

Tải lên một bảng tính với văn bản của bạn và hệ thống sẽ phân tích nó tự động. Cột đầu tiên là văn bản cần chuyển đổi, và các cột tùy chọn cho phép bạn chỉ ra một giọng nói và tên tập tin cho mỗi hàng. Hỗ trợ CSV tiêu chuẩn với dấu phẩy hoặc dấu chấm phẩy, cũng như các tập tin Excel XLSX. Các tiêu đề được tự động phát hiện nên thứ tự cột không quan trọng.

Điều khiển giọng nói từng hàng

Chỉ định một giọng nói khác cho mỗi hàng để có tính linh hoạt tối đa. Dùng cột giọng nói trong bảng tính hoặc hộp trượt trong chế độ nhập thủ công. Các hàng không có giọng nói được chỉ định sẽ tự động sử dụng giọng nói mặc định từ thiết lập hàng loạt của bạn. Trộn và kết hợp giọng nói trong một hàng để tạo ra các tập âm thanh đa dạng, có âm thanh tự nhiên.

Đánh dấu tiến trình

Xem thanh tiến độ thời gian thực và cập nhật trạng thái từng hàng khi bộ xử lý của bạn được xử lý. Mỗi hàng chuyển qua trạng thái xếp hàng, xử lý, hoàn thành và thất bại. Bảng kết quả cập nhật trực tiếp để bạn có thể bắt đầu xem trước các tập tin âm thanh hoàn thành trong khi phần còn lại của bộ vẫn đang tạo. Các mục thất bại hiển thị chi tiết lỗi và có thể thử lại.

Xuất ZIP

Tải về tất cả các tập tin âm thanh được tạo thành một tập tin lưu ZIP với một cú nhấn. Tập tin được đặt tên theo mẫu đặt tên bạn chọn: tên tập tin gốc từ bảng tính, số thứ tự (001. mp3, 002. mp3), hoặc tiền tố tùy chỉnh cộng với số. Tập tin ZIP bảo tồn thứ tự của các hàng nhập của bạn để dễ dàng gán lại dữ liệu nguồn của bạn.

Câu hỏi thường gặp

Quá trình xử lý hàng loạt cho phép bạn chuyển đổi nhiều văn bản thành giọng nói cùng một lúc. Tải lên một bảng tính CSV hoặc XLSX với văn bản của bạn, chọn giọng nói và thiết lập, và tạo âm thanh cho mỗi hàng. Tải về tất cả kết quả dưới dạng tập tin ZIP.

CSV của bạn nên có ít nhất một cột "text". Cột tùy chọn: "voice" (ID giọng nói), "filename" (tên tập tin xuất), "model" (mô hình TTS). Nếu giọng nói/model không được chỉ định trên hàng, các thiết lập mặc định sẽ được sử dụng.

Hơn 500 mục mỗi gói. Đối với các gói lớn hơn, chia CSV thành nhiều tập tin. Mỗi mục được xử lý độc lập, vì vậy lỗi trong một hàng không ảnh hưởng đến các hàng khác.

Đúng. Thêm cột "giọng nói" vào CSV của bạn với ID giọng nói cho mỗi hàng. Các hàng không có giọng nói sẽ dùng giọng nói mặc định từ thanh thiết lập hàng loạt.

Thời gian xử lý phụ thuộc vào tổng chiều dài văn bản và mô hình được sử dụng. Kokoro xử lý khoảng 100 hàng (500 ký tự mỗi hàng) trong khoảng 2 phút. Các mô hình chậm hơn như Tortoise sẽ mất nhiều thời gian hơn.

Có. Giao diện hiển thị thanh tiến độ và trạng thái mỗi hàng (đang xếp hàng, xử lý, hoàn thành, thất bại). Bạn có thể xem kết quả xuất hiện theo thời gian thực và bắt đầu tải về các tập tin hoàn thành trước khi quá trình tập hợp kết thúc.

Chọn MP3 hoặc WAV làm định dạng xuất. Tất cả tập tin trong tập tin dùng cùng định dạng. Tải về từng tập tin riêng lẻ hoặc tất cả kết quả như một tập tin lưu ZIP.

Mặc định, tập tin được đánh số theo thứ tự (001. mp3, 002. mp3,...). Bạn có thể chỉ ra tên tập tin tùy chỉnh qua cột CSV "filename", hoặc đặt mẫu tiền tố trong cài đặt.

Có. Gửi yêu cầu TTS riêng lẻ tới API của chúng tôi song song. Mỗi yêu cầu sẽ trả về một UUID để hỏi. Để tiện, công cụ web batch xử lý việc sắp xếp, song song và đóng gói ZIP cho bạn.

Truyện ngắn khóa học học trực tuyến (một hàng mỗi slide), hệ thống điện thoại IVR, âm thanh mô tả sản phẩm, âm thanh thông báo ứng dụng, nội dung đa ngôn ngữ và âm thanh truy cập cho thư viện nội dung lớn.

Cùng mức như TTS cá nhân. Các mẫu miễn phí (Kokoro, Piper) tốn 0 ký tự. Các mẫu tiêu chuẩn dùng 2x ký tự, và các mẫu cao cấp dùng 4x ký tự. Công cụ hàng loạt hiển thị tổng chi phí ước tính trước khi bắt đầu.

Có. Sau khi một tập hoàn thành, các hàng thất bại sẽ được đánh dấu bằng một thông điệp lỗi. Bạn có thể thử lại các mục thất bại riêng lẻ hoặc lọc để xử lý lại tất cả các lỗi với một cú nhấn.
5.0/5 (1)

Chúng tôi có thể cải thiện gì? phản hồi của bạn giúp chúng tôi khắc phục vấn đề.

Xử lý hàng trăm văn bản cùng một lúc

Tải lên một bảng tính và tạo âm thanh cho mỗi hàng. Tốt cho học trực tuyến, IVR, và bản địa hóa. Name