Convert MKV to Text

Convert MKV video files to text with AI. Transcribe movies and video files with subtitle export. Free online MKV transcription.

Subir audio o vídeo

Arrastre y suelte su archivo aquí, o navegar

Soporta MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV. Libre hasta 500 MB · Pro hasta 2 GB.

file.mp3

0 MB
— o grabar desde su micrófono —
00:00

Configuración

1,000/min caracteres Inscríbete para rastrear el uso

Transcripción

Cargar un archivo de audio o vídeo y haga clic en Transcribir para empezar

Transcribir... esto puede tomar un momento.

Detectado:

Cómo funciona

1. Subir audio o vídeo

Carga su archivo de audio o vídeo. Soportamos formatos MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV y MKV de hasta 100MB.

2. Transcripciones de AI

Nuestros modelos de IA procesan su audio, detectan lenguaje, identifican altavoces y generan texto preciso con marcas de tiempo.

3. Obtenga su transcripción

Copie su transcripción o descárguela como formato de subtítulos TXT o SRT. Edite y refine según sea necesario.

Casos de uso

Transcripción de audio para cada industria y flujo de trabajo

Reuniones y conferencias

Transcribe automáticamente las grabaciones de Zoom, Teams y Google Meet. Nunca te pierdas un elemento de acción de nuevo. Exporta como notas de reunión o subtítulos.

Entrevistas y periodismo

Transcribir entrevistas para artículos, trabajos de investigación y documentales. Diarización del orador identifica quién dijo qué para la fácil atribución.

Podcasts y medios de comunicación

Genera transcripciones y muestra notas para los episodios de podcast. Crea archivos de tu contenido de audio que se puedan buscar. Añade subtítulos a los podcasts de vídeo.

Conferencias y educación

Convierta las conferencias grabadas en notas de estudio. Haga que el contenido educativo sea accesible con subtítulos precisos.

YouTube y redes sociales

Genera subtítulos y subtítulos cerrados para vídeos de YouTube, TikToks y contenido de redes sociales. Mejora la accesibilidad y el SEO con transcripciones precisas.

Servicios jurídicos y médicos

Transcribir deposiciones, audiencias, consultas y dictados. Marcas de tiempo precisas para referencia. Exportar en formatos adecuados para documentación.

Formatos soportados

Transcribir cualquier archivo de audio o vídeo — extraemos el audio automáticamente

Formatos de audio

MP3 WAV FLAC OGG M4A AAC WMA OPUS

Formatos de vídeo

MP4 WebM AVI MOV MKV WMV FLV M4V

El audio se extrae automáticamente de los archivos de vídeo para su transcripción.

Modelos de transcripción

Whisper

El robusto modelo de reconocimiento del habla de OpenAI soporta 99 idiomas.

  • 99 idiomas
  • Traducción
  • Marcas de tiempo
  • Robusto al ruido
OpenAI

Faster Whisper

4x más rápido que Whisper con optimización CTranslate2, la misma precisión.

  • 4 veces más rápido
  • Memoria inferior
  • Todos los tamaños del modelo
  • Procesamiento por lotes
  • Filtrado VAD
SYSTRAN

SenseVoice

Modelo de comprensión del habla con detección de emociones, más de 50 idiomas.

  • Más de 50 idiomas
  • Detección de emociones
  • Eventos de audio
  • Análisis del altavoz
  • Metadatos ricos
Alibaba (FunAudioLLM)

Preguntas frecuentes

Sube tu archivo MKV. Nuestro transcriptor extrae la pista de audio del contenedor a flexible Matroska container that can hold multiple audio tracks and subtitles alongside H.264/H.265 video, la envía a Faster Whisper en una GPU, y devuelve una transcripción con timestamped junto con las exportaciones opcionales de subtítulos SRT y VTT. No necesitas demux o extraer audio por ti mismo, eso sucede en el lado del servidor.

MKV es a flexible Matroska container that can hold multiple audio tracks and subtitles alongside H.264/H.265 video. Es más comúnmente producido por high-resolution video releases, Blu-ray rips, and multi-track downloads.

MKV es de pérdida (a flexible Matroska container that can hold multiple audio tracks and subtitles alongside H.264/H.265 video), pero la pérdida ocurre en las bandas de audio que no llevan mucha información del habla. Faster Whisper transcribe MKV a 2-20 Mbps total dentro de ~1% de la precisión de WAV en la misma grabación de la fuente. El piso de precisión real es la calidad de grabación original (mic, sala, claridad del altavoz), no el códec MKV.

MKV archivos son típicamente 10-50 MB/min, often with selectable audio languages por lo que la mayoría de las cargas aterrizan bien bajo nuestro techo de 500 MB. Las cuentas gratuitas pueden transcribir hasta 5 minutos por carga. Los planes pagados van hasta 2 horas. Si usted está chocando el techo en archivos largos, vea la herramienta de audiolibro / longform que maneja la transcripción de varias horas.

Sí — Faster Whisper admite 99 idiomas y autodetecta el idioma hablado en su archivo MKV. También puede forzar un idioma fuente específico a través de la configuración avanzada si el autodetectar elige el incorrecto (común con el inglés acentuado mal clasificado como lengua materna del oyente, o con clips muy cortos).

Devolvemos los archivos de subtítulos SRT y VTT junto con la transcripción de texto plano. Para incrustarlos dentro de su archivo MKV, utilice una herramienta como ffmpeg o HandBrake para mux el SRT/VTT como una pista de subtítulos blandos. No codificamos el vídeo en sí mismo — eso sería una pérdida.

MKV puede llevar múltiples pistas de audio, pero para la diarización de altavoz los mezclamos a una sola pista primero. Si su MKV tiene pistas de audio separadas por altavoz (raramente fuera de la producción profesional), el flujo de trabajo más limpio es extraer cada pista a MP3, transcribir individualmente, y fusionar las transcripciones, que es 100% exacto para el altavoz sin necesidad de diarización.

No. Nuestro transcriptor maneja MKV directamente — convertir a MP4 en primer lugar añadiría un paso de re-codificación (potencialmente con pérdidas) y perder el tiempo. La única excepción es que si su archivo MKV utiliza un códec inusual nuestro decodificador no reconoce (rara); le diremos que al subir y usted puede convertir a través de nuestro convertidor de audio gratuito.

Sí, ese es el patrón de carga más común para MKV. Faster Whisper maneja grabaciones limpias, ruidosas y voz acentuada — no es necesario limpiar el audio primero. Si la precisión no es lo que espera, ejecute el archivo a través de nuestro Audio Enhancer (gratis para un pase) para eliminar el ruido de fondo, luego vuelva a intentar la transcripción.

La transcripción es gratuita para archivos de menos de 5 minutos. Los planes de pago utilizan ~1.000 caracteres por minuto de MKV audio. Una reunión de 60 minutos transcribe para 60.000 caracteres; un memo de voz de 3 minutos es gratuito. Nota específica de MKV: si su archivo es mayormente silencio (por ejemplo, largas pausas en una grabación de reunión), permita que la detección de actividad de voz omita el silencio y pague sólo por las secciones de discurso.

Sí. Los archivos cargados MKV se procesan en nuestros servidores GPU y se eliminan automáticamente en un plazo de 2 días. Nunca almacenamos el audio a largo plazo, entrenamos modelos en datos de usuario o compartimos con terceros. La transcripción permanece en su cuenta durante el tiempo que lo desee.

Sí. POST su archivo MKV a /api/v1/transcribir/ como datos de formulario multiparte. El punto final acepta el vídeo directamente — no es necesario extraer audio primero; ffmpeg maneja el lado del servidor demux. La respuesta incluye la transcripción, marcas de tiempo y un trabajo UUID puede hacer una encuesta para SRT/VTT Exportar URLs.
5.0/5 (1)

¿Qué podríamos mejorar? Sus comentarios nos ayudan a solucionar problemas.

Transcribir audio y vídeo con IA

Obtenga transcripciones precisas en 99 idiomas. Inscríbase gratis y obtenga 15.000 caracteres para comenzar.