Convert MKV to Text

Convert MKV video files to text with AI. Transcribe movies and video files with subtitle export. Free online MKV transcription.

Tải lên âm thanh hoặc phim

Kéo và thả tập tin vào đây, hoặc duyệt

Hỗ trợ MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV. Tối đa 100MB.

file.mp3

0 MB
— hoặc ghi âm từ micro của bạn —
00:00

Thiết lập

1,000/min chữ cái Đăng ký to track usage

Bản dịch

Tải lên một tập tin âm thanh hoặc video và nhấn vào Phép chuyển để bắt đầu

Đang phiên âm... có thể mất một chút thời gian.

Đã phát hiện:

Nó hoạt động thế nào?

1. Tải lên âm thanh hoặc video

Tải lên tập tin âm thanh hoặc video của bạn. Chúng tôi hỗ trợ các định dạng MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV và MKV lên đến 100MB.

2. AI Transcribes

Mô hình AI của chúng tôi xử lý âm thanh của bạn, phát hiện ngôn ngữ, nhận dạng người nói, và tạo ra văn bản chính xác với dấu thời gian.

3. Lấy bản ghi chép của anh

Copy your transcript or download it as TXT or SRT subtitle format. Edit and refine as needed.

Tình huống sử dụng

Phiên dịch âm thanh cho mọi ngành công nghiệp và luồng công việc

Hội nghị

Tự động chuyển đổi Zoom, Teams, và Google Meet ghi âm. Đừng bao giờ bỏ lỡ một mục hành động nữa. Xuất khẩu như ghi chú cuộc họp hoặc phụ đề.

Phỏng vấn và báo chí

Transcript interviews for articles, research papers, and documentaries. Speaker diarization identify who said what for easy attribution.

Truyền thông và Podcast

Tạo bản ghi và hiển thị ghi chú cho các tập podcast. Tạo các kho lưu có thể tìm kiếm của nội dung âm thanh của bạn. Thêm phụ đề cho các podcast video.

Thuyết trình và giáo dục

Chuyển đổi các bài giảng ghi âm thành ghi chú học tập. Làm cho nội dung giáo dục dễ tiếp cận với các phụ đề chính xác. Hỗ trợ học sinh bị suy giảm thính giác.

Xã hộiName

Tạo phụ đề và phụ đề kín cho video YouTube, TikToks, và nội dung truyền thông xã hội. Tăng khả năng truy cập và SEO với bản ghi chính xác.

Luật và Y tế

Transcript statements, hearing, consultations, and dictation. Precise time stamps for reference. Export in formats suitable for documentation.

Định dạng được hỗ trợ

Transcript any audio or video file — we extract audio automatically

Định dạng âm thanh

MP3 WAV FLAC OGG M4A AAC WMA OPUS

Định dạng phim

MP4 WebM AVI MOV MKV WMV FLV M4V

Âm thanh được tự động trích xuất từ các tập tin video để phiên âm.

Mô hình phiên âm

Whisper

Mô hình nhận dạng giọng nói mạnh mẽ của OpenAI hỗ trợ 99 ngôn ngữ.

  • 99 ngôn ngữ
  • Dịch
  • Thời gian
  • Được bảo vệ khỏi tiếng ồn
OpenAI

Faster Whisper

Nhanh hơn 4 lần so với Whisper với tối ưu hóa CTranslate2, cùng độ chính xác.

  • Nhanh hơn 4 lần
  • Hạ bộ nhớ
  • Tất cả kích thước mô hình
  • Xử lý hàng loạt
  • Bộ lọc VAD
SYSTRAN

SenseVoice

Speech understanding model with emotion detection, 50+ languages (bằng tiếng Anh).

  • 50+ ngôn ngữ
  • Phát hiện cảm xúc
  • Sự kiện âm thanh
  • Phân tích loa
  • Siêu dữ liệu phong phú
Alibaba (FunAudioLLM)

Kế hoạch phiên âm

Bắt đầu miễn phí, nâng cấp khi cần nhiều hơn

Tự do
  • Giới hạn âm thanh 1 phút
  • Mô hình Whisper nhanh hơn
  • Phiên âm cơ bản
  • 100+ ngôn ngữ
Nổi tiếng nhất
Tài khoản miễn phí
  • Âm thanh 30 phút + 15.000 ký tự
  • Tất cả các mẫu STT
  • Thời gian cấp từ
  • Xuất phụ đề SRT & VTT
  • Tự động
Đăng ký miễn phí
Tốt
  • Tập tin âm thanh 2 giờ
  • Phiên âm hàng loạt
  • Xử lý ưu tiên
  • Truy cập API
  • Từ vựng tùy chỉnh
Cập nhật

Câu hỏi thường gặp

Tải lên tập tin âm thanh hoặc video của bạn (MP3, WAV, M4A, OGG, FLAC, hoặc định dạng video) và nhấn vào Transcribe. AI của chúng tôi xử lý âm thanh và trả lại văn bản chính xác trong vài giây. Không cần tải xuống phần mềm — mọi thứ chạy trong trình duyệt của bạn.

Chúng tôi hỗ trợ tất cả các định dạng âm thanh phổ biến bao gồm MP3, WAV, M4A, OGG, FLAC, WEBM, và hầu hết các định dạng video (MP4, AVI, MKV, MOV). Cỡ tập tin tối đa là 50MB. Công cụ này sẽ tự động trích âm thanh từ các tập tin video.

Phiên dịch AI của chúng tôi đạt được độ chính xác 95% + về giọng nói rõ ràng. Chúng tôi sử dụng Faster Whisper (nhanh hơn 4 lần so với Whisper gốc) và SenseVoice để đạt được kết quả tốt nhất. Độ chính xác phụ thuộc vào chất lượng âm thanh, tiếng ồn nền và ngôn ngữ.

Có, công cụ phiên dịch của chúng tôi hỗ trợ 99 ngôn ngữ. Faster Whisper tự động phát hiện ngôn ngữ nói, hoặc bạn có thể chỉ định nó bằng tay để chính xác hơn. Các ngôn ngữ phổ biến bao gồm tiếng Anh, Tây Ban Nha, Pháp, Đức, Nhật Bản, Trung Quốc và Ả Rập.

Người dùng miễn phí có thể phiên âm lên đến 5 phút âm thanh. Các gói trả phí hỗ trợ các tập tin lên đến 2 giờ. Đối với các bản ghi dài hơn, hãy dùng API của chúng tôi với xử lý theo lô để phiên âm nhiều giờ âm thanh một cách hiệu quả.

Vâng, tất cả các bản dịch bao gồm dấu thời gian cấp đoạn theo mặc định. Dấu thời gian cấp từ cũng có sẵn, cho thấy thời gian bắt đầu và kết thúc chính xác cho mỗi từ — hoàn hảo cho phụ đề và tiêu đề.

Có, kết quả phiên dịch bao gồm dấu thời gian có thể xuất thành tập tin phụ đề SRT, VTT, hoặc ASS. Điều này lý tưởng cho việc thêm phụ đề vào video YouTube, khóa học trực tuyến, podcast, và nội dung truyền thông xã hội.

Có, chế độ phiên âm cao cấp của chúng tôi hỗ trợ diarization của người nói — tự động nhận dạng và dán nhãn các người nói khác nhau trong âm thanh. Điều này hữu ích cho phiên âm cuộc họp, phỏng vấn, và cuộc nói chuyện nhiều người.

Bạn có thể tải về âm thanh từ một video YouTube và tải lên để phiên dịch. Công cụ của chúng tôi xử lý bất kỳ định dạng âm thanh hoặc video tiêu chuẩn nào. Để phiên dịch YouTube hàng loạt, hãy dùng API của chúng tôi cho các luồng công việc tự động.

Vâng, âm thanh tải lên được xử lý trên máy chủ GPU an toàn của chúng tôi và tự động xóa sau khi phiên dịch. Chúng tôi không bao giờ lưu, chia sẻ, hoặc sử dụng âm thanh của bạn để huấn luyện. Tất cả các chuyển giao được mã hóa thông qua HTTPS.

Faster Whisper xử lý âm thanh với tốc độ thời gian thực 4x - một bản ghi 10 phút được phiên âm trong khoảng 2,5 phút.

Phiên dịch miễn phí cho âm thanh lên đến 5 phút. Các kế hoạch trả tiền sử dụng các ký tự dựa trên thời lượng âm thanh: khoảng 1.000 ký tự mỗi phút. Các gói ký tự bắt đầu từ $5 cho 100.000 ký tự. Xem trang giá của chúng tôi để biết chi tiết về kế hoạch.
5.0/5 (1)

Chúng tôi có thể cải thiện gì? phản hồi của bạn giúp chúng tôi khắc phục vấn đề.

Transcribe Audio & Video with AI

Nhập 15,000 ký tự để bắt đầu.