Convert AVI to Text

Convert AVI video files to text with AI. Transcribe legacy video recordings to accurate text. Free online AVI transcription.

Tải lên âm thanh hoặc phim

Kéo và thả tập tin vào đây, hoặc duyệt

Hỗ trợ MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV. Tối đa 100MB.

file.mp3

0 MB
— hoặc ghi âm từ micro của bạn —
00:00

Thiết lập

1,000/min chữ cái Đăng ký to track usage

Bản dịch

Tải lên một tập tin âm thanh hoặc video và nhấn vào Phép chuyển để bắt đầu

Đang phiên âm... có thể mất một chút thời gian.

Đã phát hiện:

Nó hoạt động thế nào?

1. Tải lên âm thanh hoặc video

Tải lên tập tin âm thanh hoặc video của bạn. Chúng tôi hỗ trợ các định dạng MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV và MKV lên đến 100MB.

2. AI Transcribes

Mô hình AI của chúng tôi xử lý âm thanh của bạn, phát hiện ngôn ngữ, nhận dạng người nói, và tạo ra văn bản chính xác với dấu thời gian.

3. Lấy bản ghi chép của anh

Copy your transcript or download it as TXT or SRT subtitle format. Edit and refine as needed.

Tình huống sử dụng

Phiên dịch âm thanh cho mọi ngành công nghiệp và luồng công việc

Hội nghị

Tự động chuyển đổi Zoom, Teams, và Google Meet ghi âm. Đừng bao giờ bỏ lỡ một mục hành động nữa. Xuất khẩu như ghi chú cuộc họp hoặc phụ đề.

Phỏng vấn và báo chí

Transcript interviews for articles, research papers, and documentaries. Speaker diarization identify who said what for easy attribution.

Truyền thông và Podcast

Tạo bản ghi và hiển thị ghi chú cho các tập podcast. Tạo các kho lưu có thể tìm kiếm của nội dung âm thanh của bạn. Thêm phụ đề cho các podcast video.

Thuyết trình và giáo dục

Chuyển đổi các bài giảng ghi âm thành ghi chú học tập. Làm cho nội dung giáo dục dễ tiếp cận với các phụ đề chính xác. Hỗ trợ học sinh bị suy giảm thính giác.

Xã hộiName

Tạo phụ đề và phụ đề kín cho video YouTube, TikToks, và nội dung truyền thông xã hội. Tăng khả năng truy cập và SEO với bản ghi chính xác.

Luật và Y tế

Transcript statements, hearing, consultations, and dictation. Precise time stamps for reference. Export in formats suitable for documentation.

Định dạng được hỗ trợ

Transcript any audio or video file — we extract audio automatically

Định dạng âm thanh

MP3 WAV FLAC OGG M4A AAC WMA OPUS

Định dạng phim

MP4 WebM AVI MOV MKV WMV FLV M4V

Âm thanh được tự động trích xuất từ các tập tin video để phiên âm.

Mô hình phiên âm

Whisper

Mô hình nhận dạng giọng nói mạnh mẽ của OpenAI hỗ trợ 99 ngôn ngữ.

  • 99 ngôn ngữ
  • Dịch
  • Thời gian
  • Được bảo vệ khỏi tiếng ồn
OpenAI

Faster Whisper

Nhanh hơn 4 lần so với Whisper với tối ưu hóa CTranslate2, cùng độ chính xác.

  • Nhanh hơn 4 lần
  • Hạ bộ nhớ
  • Tất cả kích thước mô hình
  • Xử lý hàng loạt
  • Bộ lọc VAD
SYSTRAN

SenseVoice

Speech understanding model with emotion detection, 50+ languages (bằng tiếng Anh).

  • 50+ ngôn ngữ
  • Phát hiện cảm xúc
  • Sự kiện âm thanh
  • Phân tích loa
  • Siêu dữ liệu phong phú
Alibaba (FunAudioLLM)

Câu hỏi thường gặp

Tải lên tập tin AVI của bạn. Phần mềm phiên dịch của chúng tôi sẽ trích ra âm thanh từ thùng chứa a wide range of codecs (DivX, XviD, MJPEG, uncompressed) in a Microsoft AVI container, gửi nó đến Faster Whisper trên GPU, và trả lại một bản ghi có dấu thời gian cùng với xuất khẩu phụ đề SRT và VTT tùy chọn. Bạn không cần phải tự làm phân phối hoặc trích âm thanh — điều đó sẽ xảy ra ở bên máy chủ.

AVI là a wide range of codecs (DivX, XviD, MJPEG, uncompressed) in a Microsoft AVI container. nó thường được sản xuất bởi older Windows recordings, camcorder exports, and legacy video archives.

AVI có tính mất (a wide range of codecs (DivX, XviD, MJPEG, uncompressed) in a Microsoft AVI container), nhưng mất này xảy ra ở các băng âm thanh không mang nhiều thông tin nói. Faster Whisper phiên âm AVI ở highly variable — depends on the embedded codec trong khoảng ~1% độ chính xác WAV trên cùng một nguồn ghi âm. Độ chính xác thực sự là chất lượng ghi âm ban đầu (micro, phòng, độ rõ loa), không phải là codec AVI.

Tập tin AVI thường là 20-100 MB/min depending on codec vì vậy hầu hết các tải lên đều nằm dưới giới hạn 500 MB của chúng tôi. Tài khoản miễn phí có thể phiên dịch lên đến 5 phút mỗi lần tải lên. Các kế hoạch trả tiền có thể lên đến 2 giờ. Nếu bạn đang vượt qua giới hạn với các tập tin dài, xem công cụ audiobook / longform, nó xử lý phiên dịch nhiều giờ.

Có — Faster Whisper hỗ trợ 99 ngôn ngữ và tự động phát hiện ngôn ngữ nói trong tập tin AVI của bạn. Bạn cũng có thể buộc một ngôn ngữ nguồn cụ thể thông qua các thiết lập cao cấp nếu tự động phát hiện chọn sai ngôn ngữ (thường gặp với tiếng Anh có giọng điệu bị phân loại sai là ngôn ngữ mẹ đẻ của người nghe, hoặc với các đoạn phim rất ngắn).

Chúng tôi trả lại các tập tin phụ đề SRT và VTT cùng với bản ghi văn bản đơn giản. Để ghép chúng vào trong tập tin AVI của bạn, hãy dùng một công cụ như ffmpeg hoặc HandBrake để phân phối SRT/VTT thành một đoạn phụ đề mềm. Chúng tôi không mã hóa lại đoạn phim — điều đó sẽ gây mất dữ liệu.

Có. Bật ghi nhớ âm thanh loa trong cài đặt cao cấp và đường ống của chúng tôi chạy pyannote. audio trên Whisper để đánh dấu mỗi loa. Để có kết quả tốt nhất trên AVI, cho chúng tôi ít nhất 30 giây âm thanh để ghi nhớ có đủ mẫu để tập hợp dấu vân tay giọng nói. Ghi âm hai loa sẽ có đánh dấu chính xác nhất.

Không. Phần mềm phiên dịch của chúng tôi xử lý AVI trực tiếp — chuyển đổi sang MP4 trước sẽ thêm một bước mã hóa lại (có thể mất dữ liệu) và lãng phí thời gian của bạn. Một ngoại lệ là nếu tập tin AVI của bạn sử dụng một codec không thường thấy mà phần mềm giải mã của chúng tôi không nhận ra (hiếm); chúng tôi sẽ nói với bạn điều đó khi tải lên và bạn có thể chuyển đổi thông qua trình chuyển đổi âm thanh miễn phí của chúng tôi.

Vâng, đó là mô hình tải lên phổ biến nhất cho AVI. Faster Whisper xử lý các bản ghi sạch, những bản ghi ồn và nói giọng điệu — bạn không cần phải dọn dẹp âm thanh trước. Nếu độ chính xác không phải là điều bạn mong đợi, chạy tập tin qua Audio Enhancer (miễn phí cho một lần) để loại bỏ tiếng ồn nền, rồi thử phiên âm lại.

Phiên dịch miễn phí cho các tập tin dưới 5 phút. Các kế hoạch trả phí sử dụng ~1. 000 ký tự mỗi phút của AVI âm thanh. Một cuộc họp 60 phút phiên dịch cho 60. 000 ký tự; một ghi chú giọng nói 3 phút là miễn phí. Ghi chú đặc biệt cho AVI: nếu tập tin của bạn chủ yếu là im lặng (ví dụ như những đoạn nghỉ dài trong ghi âm cuộc họp), bật Kiểm tra hoạt động giọng nói để bỏ qua sự im lặng và chỉ trả tiền cho các phần nói.

Có. AVI tập tin đã tải lên được xử lý trên máy chủ GPU của chúng tôi và tự động xóa trong vòng 2 ngày. Chúng tôi không bao giờ lưu trữ âm thanh lâu dài, huấn luyện mô hình trên dữ liệu người dùng, hoặc chia sẻ với bên thứ ba. Bản ghi lại sẽ ở trong tài khoản của bạn cho đến khi bạn muốn.

Đúng. POST tập tin AVI của bạn đến /api/v1/transcribe/ như dữ liệu dạng nhiều phần. Điểm cuối chấp nhận video trực tiếp — không cần phải trích xuất âm thanh trước; ffmpeg xử lý demux bên máy chủ. Phản hồi bao gồm bản dịch, dấu thời gian, và một UUID công việc bạn có thể hỏi về URL xuất SRT/VTT.
5.0/5 (1)

Chúng tôi có thể cải thiện gì? phản hồi của bạn giúp chúng tôi khắc phục vấn đề.

Transcribe Audio & Video with AI

Nhập 15,000 ký tự để bắt đầu.