Convert OGG to Text

Convert OGG/Opus audio files to text with AI. Transcribe voice messages and audio recordings. Free online OGG to text tool.

오디오 또는 비디오 업로드

여기에 파일을 드래그 앤 드롭하거나 찾아보기

음악 파일을 변환하는 데 사용되는 형식은 MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV 등이 있습니다.

음악 파일

0 MB
— 또는 마이크로폰으로 녹음하세요 —
00:00

설정

1,000/min 문자 가입하기 사용량 추적하기

녹음

오디오 또는 비디오 파일을 업로드하고 번역을 클릭하여 시작하십시오.

번역 중... 잠시 시간이 걸릴 수 있습니다.

감지됨:

어떻게 작동하는지

1. 오디오 또는 비디오 업로드

100MB까지의 오디오 또는 비디오 파일을 업로드하세요. MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV 형식을 지원합니다.

2. AI 번역

당사의 AI 모델은 오디오를 처리하고 언어를 감지하며, 발음자를 식별하고, 타임스탬프가 있는 정확한 텍스트를 생성합니다.

3. 귀하의 성적표를 얻을

녹음을 복사하거나 TXT 또는 SRT 자막 형식으로 다운로드하십시오. 필요에 따라 편집하고 정제하십시오.

사용 사례

모든 산업 및 워크플로우를 위한 오디오 녹음

회의 & 컨퍼런스

Zoom, Teams, Google Meet 녹음을 자동으로 녹음해 보세요. 다시는 작업 항목을 놓치지 마세요. 회의 메모 또는 자막으로 내보내기

인터뷰 & 저널리즘

기사, 연구 논문 및 다큐멘터리를 위한 인터뷰를 기록합니다. 발표자 날짜 기록은 누가 무엇을 말했는지 쉽게 식별합니다.

팟캐스트 & 미디어

팟캐스트 에피소드에 대한 녹음을 생성하고 메모를 표시합니다. 오디오 콘텐츠의 검색 가능한 아카이브를 생성합니다. 비디오 팟캐스트에 자막을 추가합니다.

강의 & 교육

녹음된 강의를 학습 노트로 변환할 수 있습니다. 정확한 자막으로 교육 콘텐츠를 쉽게 이해할 수 있도록 만들 수 있습니다.

유튜브 & 소셜 미디어

YouTube 동영상, TikTok 및 소셜 미디어 콘텐츠에 자막 및 폐쇄 자막을 생성합니다. 정확한 기록으로 접근성 및 SEO를 개선합니다.

법률 및 의료

증언, 청문회, 상담 및 독서를 기록합니다. 참조를 위해 정확한 타임스탬프를 추가합니다. 문서화에 적합한 형식으로 내보냅니다.

지원되는 형식

모든 오디오 또는 비디오 파일을 번역합니다 — 오디오를 자동으로 추출합니다

오디오 형식

MP3 WAV FLAC OGG M4A AAC WMA OPUS

비디오 포맷

MP4 WebM AVI MOV MKV WMV FLV M4V

오디오는 비디오 파일에서 자동으로 추출되어 변환됩니다.

변환 모델

Whisper

99개 언어를 지원하는 OpenAI의 강력한 음성 인식 모델.

  • 99개 언어
  • 번역
  • 시간 스탬프
  • 소음에 강한
OpenAI

Faster Whisper

CTranslate2 최적화로 Whisper보다 4배 빠르고 정확도도 동일합니다.

  • 4배 빠르게
  • 낮은 메모리
  • 모든 모델 크기
  • 일괄 처리
  • VAD 필터링
SYSTRAN

SenseVoice

감정 감지 기능이 있는 음성 이해 모델, 50개 이상의 언어 지원.

  • 50개 이상의 언어 지원
  • 감정 감지
  • 오디오 이벤트
  • 스피커 분석
  • 풍부한 메타데이터
Alibaba (FunAudioLLM)

자주 묻는 질문

변환이 필요 없이 OGG 파일을 직접 업로드하세요. 트랜스크립터는 Vorbis (open-source patent-free) 스트림을 디코딩하고 GPU의 Faster Whisper로 보내며 옵션으로 SRT 및 VTT 자막 내보내기와 함께 타임스탬프가 있는 트랜스크립트를 반환합니다.

OGG은 Vorbis (open-source patent-free)이며, open-source applications, game engines, Wikipedia audio, and Linux-recorded files가 가장 일반적으로 생산한다.

OGG is lossy (Vorbis (open-source patent-free)), but the loss happens in audio bands that do not carry much speech information. Faster Whisper transcribes OGG at 96-256 kbps Vorbis within ~1% of WAV accuracy on the same source recording. The real accuracy floor is original recording quality (mic, room, speaker clarity), not the OGG codec.

OGG 파일은 일반적으로 1 MB/min at 128 kbps Vorbis이므로 대부분의 업로드는 500 MB 허용 크기 이하입니다. 무료 계정은 업로드당 최대 5분까지 녹음할 수 있습니다. 유료 계정은 최대 2시간까지 녹음할 수 있습니다. 긴 파일에 허용 크기를 초과하는 경우, 오디오북 / 긴 형식 도구를 참조하십시오.

예 — Faster Whisper는 99개의 언어를 지원하고 OGG 파일에서 말하는 언어를 자동으로 감지합니다. 자동 감지가 잘못된 언어를 선택하면 고급 설정을 통해 특정 소스 언어를 강제로 설정할 수도 있습니다(듣는 사람의 모국어로 잘못 분류된 악센트가 있는 영어나 매우 짧은 클립에서 일반적입니다).

네, 녹음본에는 일반 텍스트 버전과 함께 SRT 또는 VTT로 내보내는 세그먼트 타임스탬프 및 단어 수준 타임스탬프가 포함됩니다. SRT를 원본 OGG(또는 변환된 MP4)과 페어링하면 자막이 있는 클립을 게시할 준비가 됩니다.

고급 설정에서 스피커 디아리제이션을 활성화하면 Whisper의 맨 위에 있는 우리의 파이프라인이 pyannote.audio를 실행하여 각 스피커에 라벨을 붙입니다. OGG에서 최상의 결과를 얻으려면, 최소한 30초의 오디오를 제공하여 디아리제이터가 음성 프린트를 클러스터링할 수 있도록 충분한 샘플을 갖도록 하십시오. 두 스피커 녹음은 가장 정확한 라벨링을 얻습니다.

아니요. 저희의 트랜스크립터는 OGG을 직접 처리합니다. MP3로 변환하는 것은 먼저 재인코딩 단계를 추가하는 것이므로 시간을 낭비할 수 있습니다. 예외는 OGG 파일이 디코더가 인식하지 못하는 특이한 코덱을 사용하는 경우입니다.

네, 이것이 OGG의 가장 일반적인 업로드 패턴입니다. Faster Whisper는 깨끗한 녹음, 시끄러운 녹음, 악센트가 있는 녹음을 모두 처리합니다. 먼저 오디오를 정리할 필요가 없습니다. 정확도가 원하는 것과 다르다면, 오디오 향상기(1회 무료)를 통해 파일을 실행하여 배경 소음을 제거한 다음 녹음을 다시 시도하십시오.

유료 플랜은 OGG 오디오의 분당 약 1,000자를 사용합니다. 60분의 회의는 60,000자를 녹음하며 3분의 음성 메모는 무료입니다. OGG 특정 참고: 파일이 대부분 침묵인 경우(예: 회의 녹음에서 긴 휴식), 음성 활동 감지를 활성화하여 침묵을 건너뛰고 음성 섹션에 대해서만 요금을 지불하십시오.

네, 업로드된 OGG개의 파일은 GPU 서버에서 처리되고 2일 이내에 자동으로 삭제됩니다. 오디오를 장기간 저장하거나, 사용자 데이터를 기반으로 모델을 훈련시키거나, 제3자와 공유하지 않습니다. 녹음본은 원하는 만큼 계정에 남아 있습니다.

네. OGG 파일을 다중 부분 양식 데이터로 /api/v1/transcribe/ 에 POST 하고 `file` 필드에 오디오 파일을 포함합니다. 응답에는 녹음본, 세그먼트 타임스탬프, 선택적 단어 수준 타임스탬프, SRT/VTT 내보내기 URL에 대해 폴링할 수 있는 작업 UUID가 포함됩니다. 모든 유료 플랜에서 사용 가능합니다.
5.0/5 (1)

개선할 수 있는 점은 무엇입니까? 고객님의 피드백이 문제를 해결하는 데 도움이 됩니다.

AI로 오디오 및 비디오를 변환

99개 언어로 정확한 번역을 받으세요. 무료로 가입하고 15 크레딧을 받아 시작하세요.