Convert OGG to Text

Convert OGG/Opus audio files to text with AI. Transcribe voice messages and audio recordings. Free online OGG to text tool.

Tải lên âm thanh hoặc phim

Kéo và thả tập tin vào đây, hoặc duyệt

Hỗ trợ MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV. Tối đa 100MB.

file.mp3

0 MB
— hoặc ghi âm từ micro của bạn —
00:00

Thiết lập

1,000/min chữ cái Đăng ký to track usage

Bản dịch

Tải lên một tập tin âm thanh hoặc video và nhấn vào Phép chuyển để bắt đầu

Đang phiên âm... có thể mất một chút thời gian.

Đã phát hiện:

Nó hoạt động thế nào?

1. Tải lên âm thanh hoặc video

Tải lên tập tin âm thanh hoặc video của bạn. Chúng tôi hỗ trợ các định dạng MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV và MKV lên đến 100MB.

2. AI Transcribes

Mô hình AI của chúng tôi xử lý âm thanh của bạn, phát hiện ngôn ngữ, nhận dạng người nói, và tạo ra văn bản chính xác với dấu thời gian.

3. Lấy bản ghi chép của anh

Copy your transcript or download it as TXT or SRT subtitle format. Edit and refine as needed.

Tình huống sử dụng

Phiên dịch âm thanh cho mọi ngành công nghiệp và luồng công việc

Hội nghị

Tự động chuyển đổi Zoom, Teams, và Google Meet ghi âm. Đừng bao giờ bỏ lỡ một mục hành động nữa. Xuất khẩu như ghi chú cuộc họp hoặc phụ đề.

Phỏng vấn và báo chí

Transcript interviews for articles, research papers, and documentaries. Speaker diarization identify who said what for easy attribution.

Truyền thông và Podcast

Tạo bản ghi và hiển thị ghi chú cho các tập podcast. Tạo các kho lưu có thể tìm kiếm của nội dung âm thanh của bạn. Thêm phụ đề cho các podcast video.

Thuyết trình và giáo dục

Chuyển đổi các bài giảng ghi âm thành ghi chú học tập. Làm cho nội dung giáo dục dễ tiếp cận với các phụ đề chính xác. Hỗ trợ học sinh bị suy giảm thính giác.

Xã hộiName

Tạo phụ đề và phụ đề kín cho video YouTube, TikToks, và nội dung truyền thông xã hội. Tăng khả năng truy cập và SEO với bản ghi chính xác.

Luật và Y tế

Transcript statements, hearing, consultations, and dictation. Precise time stamps for reference. Export in formats suitable for documentation.

Định dạng được hỗ trợ

Transcript any audio or video file — we extract audio automatically

Định dạng âm thanh

MP3 WAV FLAC OGG M4A AAC WMA OPUS

Định dạng phim

MP4 WebM AVI MOV MKV WMV FLV M4V

Âm thanh được tự động trích xuất từ các tập tin video để phiên âm.

Mô hình phiên âm

Whisper

Mô hình nhận dạng giọng nói mạnh mẽ của OpenAI hỗ trợ 99 ngôn ngữ.

  • 99 ngôn ngữ
  • Dịch
  • Thời gian
  • Được bảo vệ khỏi tiếng ồn
OpenAI

Faster Whisper

Nhanh hơn 4 lần so với Whisper với tối ưu hóa CTranslate2, cùng độ chính xác.

  • Nhanh hơn 4 lần
  • Hạ bộ nhớ
  • Tất cả kích thước mô hình
  • Xử lý hàng loạt
  • Bộ lọc VAD
SYSTRAN

SenseVoice

Speech understanding model with emotion detection, 50+ languages (bằng tiếng Anh).

  • 50+ ngôn ngữ
  • Phát hiện cảm xúc
  • Sự kiện âm thanh
  • Phân tích loa
  • Siêu dữ liệu phong phú
Alibaba (FunAudioLLM)

Câu hỏi thường gặp

Tải lên tập tin OGG của bạn trực tiếp — không cần chuyển đổi. Phần mềm phiên dịch của chúng tôi giải mã dòng Vorbis (open-source patent-free), gửi nó đến Faster Whisper trên GPU, và trả lại một bản dịch có dấu thời gian cùng với xuất khẩu phụ đề SRT và VTT tùy chọn.

OGG là Vorbis (open-source patent-free). nó thường được sản xuất bởi open-source applications, game engines, Wikipedia audio, and Linux-recorded files.

OGG có tính mất (Vorbis (open-source patent-free)), nhưng mất này xảy ra ở các băng âm thanh không mang nhiều thông tin nói. Faster Whisper phiên âm OGG ở 96-256 kbps Vorbis trong khoảng ~1% độ chính xác WAV trên cùng một nguồn ghi âm. Độ chính xác thực sự là chất lượng ghi âm ban đầu (micro, phòng, độ rõ loa), không phải là codec OGG.

Tập tin OGG thường là 1 MB/min at 128 kbps Vorbis vì vậy hầu hết các tải lên đều nằm dưới giới hạn 500 MB của chúng tôi. Tài khoản miễn phí có thể phiên dịch lên đến 5 phút mỗi lần tải lên. Các kế hoạch trả tiền có thể lên đến 2 giờ. Nếu bạn đang vượt qua giới hạn với các tập tin dài, xem công cụ audiobook / longform, nó xử lý phiên dịch nhiều giờ.

Có — Faster Whisper hỗ trợ 99 ngôn ngữ và tự động phát hiện ngôn ngữ nói trong tập tin OGG của bạn. Bạn cũng có thể buộc một ngôn ngữ nguồn cụ thể thông qua các thiết lập cao cấp nếu tự động phát hiện chọn sai ngôn ngữ (thường gặp với tiếng Anh có giọng điệu bị phân loại sai là ngôn ngữ mẹ đẻ của người nghe, hoặc với các đoạn phim rất ngắn).

Có — bản ghi chép bao gồm dấu thời gian phân đoạn và dấu thời gian cấp từ, được xuất thành SRT hoặc VTT cùng với phiên bản văn bản đơn giản. Cặp SRT với OGG gốc (hoặc MP4 đã chuyển đổi) và bạn sẽ có một đoạn phim phụ đề sẵn sàng để xuất bản.

Có. Bật ghi nhớ âm thanh loa trong cài đặt cao cấp và đường ống của chúng tôi chạy pyannote. audio trên Whisper để đánh dấu mỗi loa. Để có kết quả tốt nhất trên OGG, cho chúng tôi ít nhất 30 giây âm thanh để ghi nhớ có đủ mẫu để tập hợp dấu vân tay giọng nói. Ghi âm hai loa sẽ có đánh dấu chính xác nhất.

Không. Phần mềm phiên dịch của chúng tôi xử lý OGG trực tiếp — chuyển đổi sang MP3 trước sẽ thêm một bước mã hóa lại (có thể mất dữ liệu) và lãng phí thời gian của bạn. Một ngoại lệ là nếu tập tin OGG của bạn sử dụng một codec không thường thấy mà phần mềm giải mã của chúng tôi không nhận ra (hiếm); chúng tôi sẽ nói với bạn điều đó khi tải lên và bạn có thể chuyển đổi thông qua trình chuyển đổi âm thanh miễn phí của chúng tôi.

Vâng, đó là mô hình tải lên phổ biến nhất cho OGG. Faster Whisper xử lý các bản ghi sạch, những bản ghi ồn và nói giọng điệu — bạn không cần phải dọn dẹp âm thanh trước. Nếu độ chính xác không phải là điều bạn mong đợi, chạy tập tin qua Audio Enhancer (miễn phí cho một lần) để loại bỏ tiếng ồn nền, rồi thử phiên âm lại.

Phiên dịch miễn phí cho các tập tin dưới 5 phút. Các kế hoạch trả phí sử dụng ~1. 000 ký tự mỗi phút của OGG âm thanh. Một cuộc họp 60 phút phiên dịch cho 60. 000 ký tự; một ghi chú giọng nói 3 phút là miễn phí. Ghi chú đặc biệt cho OGG: nếu tập tin của bạn chủ yếu là im lặng (ví dụ như những đoạn nghỉ dài trong ghi âm cuộc họp), bật Kiểm tra hoạt động giọng nói để bỏ qua sự im lặng và chỉ trả tiền cho các phần nói.

Có. OGG tập tin đã tải lên được xử lý trên máy chủ GPU của chúng tôi và tự động xóa trong vòng 2 ngày. Chúng tôi không bao giờ lưu trữ âm thanh lâu dài, huấn luyện mô hình trên dữ liệu người dùng, hoặc chia sẻ với bên thứ ba. Bản ghi lại sẽ ở trong tài khoản của bạn cho đến khi bạn muốn.

Đúng. POST tập tin OGG của bạn đến /api/v1/transcribe/ như dữ liệu dạng nhiều phần với tập tin âm thanh trong trường `file`. Phản hồi bao gồm bản ghi, dấu thời gian phân đoạn, dấu thời gian tùy chọn ở cấp từ, và một UUID công việc bạn có thể hỏi về URL xuất khẩu SRT/VTT. Có sẵn trên tất cả các gói trả phí.
5.0/5 (1)

Chúng tôi có thể cải thiện gì? phản hồi của bạn giúp chúng tôi khắc phục vấn đề.

Transcribe Audio & Video with AI

Nhập 15,000 ký tự để bắt đầu.