Convert MKV to Text

Convert MKV video files to text with AI. Transcribe movies and video files with subtitle export. Free online MKV transcription.

Envie áudio ou vídeo

Arraste e largue o seu arquivo aqui, ou navegar

Apoia MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV. Livre até 500 MB · Pro até 2 GB.

file.mp3

0 MB
— ou registo do seu microfone —
00:00

Configurações

1,000/min caracteres Inscrever-se para acompanhar o uso

Transcrição

Carregue um arquivo de áudio ou vídeo e clique Transcribe para começar

Isso pode demorar um momento.

Detectado:

Como funciona

1. Envie áudio ou vídeo

Envie seu arquivo de áudio ou vídeo. Nós suportamos MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV e formatos MKV até 100MB.

2. AI Transcrições

Nossos modelos de IA processam o seu áudio, detectando linguagem, identificando alto-falantes e gerando texto preciso com selos de tempo.

3. Obtenha o seu transcrito

Copie sua transcrição ou baixe-a como formato de subtítulo TXT ou SRT. Edite e refine conforme necessário.

Casos de utilização

Transcrição de áudio para cada indústria e fluxo de trabalho

Reuniões e Conferências

Transcriba automaticamente Zoom, Teams e Google Meet as gravações. Nunca mais perca um item de ação. Exportar como notas de reunião ou legendas.

Entrevistas e Jornalismo

Transcriba entrevistas para artigos, trabalhos de pesquisa e documentários. Diarização do orador identifica quem disse o que para fácil atribuição.

Podcasts e mídias

Gerar transcrições e mostrar notas para episódios de podcast. Criar arquivos pesquisáveis de seu conteúdo de áudio. Adicionar legendas para podcasts de vídeo.

Conferências & Educação

Converta palestras gravadas em notas de estudo. Torne o conteúdo educacional acessível com legendas precisas. Apoiar os alunos com deficiência auditiva.

YouTube & Redes Sociais

Gere legendas e legendas fechadas para vídeos do YouTube, TikToks e conteúdo das mídias sociais. Melhore acessibilidade e SEO com transcrições precisas.

Legal & Médico

Transcriba deposições, audições, consultas e dicionários. Tempos precisos para referência. Exportação em formatos adequados para documentação.

Formatos Suportados

Transcriba qualquer arquivo de áudio ou vídeo — extraimos o áudio automaticamente

Formatos de áudio

MP3 WAV FLAC OGG M4A AAC WMA OPUS

Formatos de vídeo

MP4 WebM AVI MOV MKV WMV FLV M4V

O áudio é automaticamente extraído dos arquivos de vídeo para transcrição.

Modelos de transcrição

Whisper

O robusto modelo de reconhecimento de fala da OpenAI apoia 99 línguas.

  • 99 línguas
  • Tradução
  • Selos de tempo
  • Robusto ao barulho
OpenAI

Faster Whisper

4x mais rápido do que Whisper com otimização CTranslate2, a mesma precisão.

  • 4x mais rápido
  • Memória inferior
  • Todos os tamanhos dos modelos
  • Processamento de lote
  • Filtragem VAD
SYSTRAN

SenseVoice

Modelo de compreensão da fala com detecção de emoções, 50+ línguas.

  • Mais de 50 idiomas
  • Detecção de emoções
  • Eventos de áudio
  • Análise dos oradores
  • Metadados ricos
Alibaba (FunAudioLLM)

Perguntas Frequentes

Carregue o seu arquivo MKV. Nosso transcriber extrai a faixa de áudio do recipiente a flexible Matroska container that can hold multiple audio tracks and subtitles alongside H.264/H.265 video, envia-o para o Faster Whisper em uma GPU, e retorna uma transcrição marcada com as exportações opcionais de subtítulos SRT e VTT. Você não precisa de demux ou extrair áudio você mesmo — que acontece ao lado do servidor.

MKV é a flexible Matroska container that can hold multiple audio tracks and subtitles alongside H.264/H.265 video. É mais comumente produzido por high-resolution video releases, Blu-ray rips, and multi-track downloads.

MKV é perdido (a flexible Matroska container that can hold multiple audio tracks and subtitles alongside H.264/H.265 video), mas a perda acontece em bandas de áudio que não carregam muita informação de fala. Mais rápido Whisper transcribe MKV a 2-20 Mbps total dentro ~1% da acurácia WAV na mesma gravação de fonte. O chão de precisão real é a qualidade de gravação original (mic, sala, clareza do alto-falante), não o codec MKV.

MKV arquivos são tipicamente 10-50 MB/min, often with selectable audio languages, então a maioria dos uploads terra bem sob o nosso teto de 500 MB. Contas gratuitas podem transcribir até 5 minutos por upload. Planos pagos vão até 2 horas. Se você está chocando o teto em arquivos longos, veja a ferramenta audiobook/longform que manuseia transcrição multi-hora.

Sim — O Whisper mais rápido suporta 99 idiomas e detecta automaticamente a língua falada no seu arquivo MKV. Você também pode forçar uma linguagem de fonte específica através das configurações avançadas se a autodetecção escolhe a errada (comum com o inglês acentuado mal classificado como a língua materna ou com clipes muito curtos).

Devolvemos arquivos de subtítulos SRT e VTT ao lado da transcrição de texto simples. Para insertá-los dentro do seu arquivo MKV, use uma ferramenta como ffmpeg ou HandBrake para mux o SRT/VTT como uma pista de subtítulo suave. Não recodificamos o vídeo em si — isso seria perverso.

MKV podem transportar várias faixas de áudio, mas para a diarização de alto-falantes nós misturamos-las para uma única faixa primeiro. Se seu MKV tem faixas de áudio separadas por alto-falante (para fora da produção profissional), o fluxo de trabalho mais limpo é extrair cada faixa para MP3, transcribe individualmente, e fusionar as transcrições — que é 100% alto-falante-exactício sem necessidade de diarização.

Não. Nosso transcriber maneja MKV diretamente — a conversão para MP4 primeiro adicionaria um passo de recodificação (potencialmente perdas) e perca seu tempo. A única exceção é se o seu arquivo MKV usa um codec incomum nosso decodificador não reconhece (rare); vamos dizer-lhe que no upload e você pode converter através do nosso Conversor de Áudio gratuito.

Sim, esse é o padrão de upload mais comum para MKV. Mais rápido Whisper maneja gravações limpas, ruidosas e fala acentuada — você não precisa limpar o áudio primeiro. Se a precisão não é o que você espera, execute o arquivo através do nosso Enhancedor de áudio (livre para um passe) para remover o ruído de fundo, então tentar a transcrição.

Os planos pagos usam ~1.000 caracteres por minuto de MKV áudio. Uma reunião de 60 minutos transcribe para 60.000 caracteres; um memo de voz de 3 minutos é gratuito. 88.000 nota específica: se o seu arquivo é principalmente silêncio (por exemplo, pausas longas em uma gravação de reunião), permitir a detecção de atividade de voz para saltar o silêncio e pagar apenas para as seções de fala.

Sim. Enviado MKV arquivos são processados em nossos servidores GPU e automaticamente apagados dentro de 2 dias. Nunca armazenamos os modelos de áudio a longo prazo, treinamos em dados de usuário ou compartilhamos com terceiros. A transcrição permanece em sua conta durante o tempo que você deseja.

Sim. POST seu arquivo MKV para /api/v1/transcribe/ como dados multipart form. O endpoint aceita o vídeo diretamente — não precisa extrair áudio primeiro; ffmpeg maneja o lado do servidor demux. A resposta inclui a transcrição, selos de tempo e um trabalho UUID você pode pesquisar por URLs de exportação SRT/VTT.
5.0/5 (1)

O que podemos melhorar? Seu feedback nos ajuda a resolver problemas.

Transcriba áudio e vídeo com IA

Obtenha transcrições precisas em 99 idiomas. Inscreva-se livre e obtenha 15.000 caracteres para começar.