Convert MKV to Text

Convert MKV video files to text with AI. Transcribe movies and video files with subtitle export. Free online MKV transcription.

Non o facemos. Vender a túa voz

Enviar o son ou vídeo

Arrastre e solte o ficheiro aquí, ou navegar

Soporta MP3, WAV, FLAC, OGG, M4A, MP4, WebM. Máximo 100MB. Name

ficheiro.mp3

0 MB
— ou gravar co seu micrófono —
00:00

Configuración

1,000/min caracteres Inscríbete to track usage

Transcrición

Envíe un ficheiro de son e prema en Transcribir para comezar

A transcreber o son... Isto pode tardar un momento.

Detectado:

Como funciona

1. Enviar o son

Envíe o seu ficheiro de son ou vídeo. Soportamos os formatos MP3, WAV, FLAC, OGG, M4A, MP4 e WebM de ata 100 MB.

2. AI Transcribes

Os nosos modelos de IA procesan o seu audio, detectando a linguaxe, identificando os falantes e xerando texto preciso con marcas de tempo.

3. Obter a súa transcripción

Copie a súa transcrición ou descarguea como formato de subtítulos TXT ou SRT. Edite e refine segundo sexa preciso.

Casos de uso

Transcrición de son para cada industria e fluxo de traballo

Reunións e conferencias

Transcríbense automaticamente as gravacións de Zoom, Teams e Google Meet. Nunca máis se perda un elemento de acción. Exportar como notas ou subtítulos de reunións.

Entrevistas e xornalismo

Transcríbanse entrevistas para artigos, traballos de investigación e documentais. A diarización do orador identifica quen dixo que para facilitar a atribución.

Podcasts e medios

Xere transcricións e mostre notas para episodios de podcasts. Cree arquivos pesquisábeis do seu contido de son. Engadir subtítulos aos podcasts de vídeo.

Lecturas e educación

Converta as conferencias gravadas en notas de estudo. Faga accesible o contido educativo con subtítulos precisos. Apoie aos estudantes con discapacidades auditivas.

Medios sociais

Xere subtítulos e subtítulos pechados para vídeos de YouTube, TikToks e contidos de redes sociais. Mellore a accesibilidade e o SEO con transcricións precisas.

Legal e médicoName

Transcríbense declaracións, audiencias, consultas e ditados. Marcas de tempo precisas para referencia. Exportación en formatos axeitados para documentación.

Formatos soportados

Transcríbe calquera ficheiro de son ou vídeo: extraemos o son automaticamente

Formatos de son

MP3 WAV FLAC OGG M4A AAC WMA OPUS

Formatos de vídeo

MP4 WebM AVI MOV MKV WMV FLV M4V

O son é extraído automaticamente dos ficheiros de vídeo para a transcrición.

Modelos de transcrición

Whisper

O robusto modelo de recoñecemento de voz de OpenAI admite 99 linguas.

  • 99 linguas
  • Tradución
  • Marcas de data/ hora
  • Robusto ao ruído
OpenAI

Faster Whisper

4 veces máis rápido que Whisper con optimización de CTranslate2, mesma precisión.

  • 4x máis rápido
  • Reducir a memoria
  • Todos os tamaños de modelo
  • Procesamento por lotes
  • Filtrado VAD
SYSTRAN

SenseVoice

Modelo de comprensión da fala con detección de emocións, máis de 50 linguas.

  • Mais de 50 linguas
  • Detección de emocións
  • Eventos de son
  • Análise do falante
  • Metadatos ricos
Alibaba (FunAudioLLM)

Preguntas frecuentes

Envíe o seu ficheiro MKV. O noso transcribidor extrae a pista de son do contedor a flexible Matroska container that can hold multiple audio tracks and subtitles alongside H.264/H.265 video, envíaa a Faster Whisper nunha GPU e devolve unha transcrición con data e hora xunto con exportacións opcionais de subtítulos SRT e VTT. Non precisa desmultiplicar ou extraer o son por si mesmo, isto faise no servidor.

MKV é a flexible Matroska container that can hold multiple audio tracks and subtitles alongside H.264/H.265 video. É producido máis comunmente polo high-resolution video releases, Blu-ray rips, and multi-track downloads.

O MKV é con perdas (a flexible Matroska container that can hold multiple audio tracks and subtitles alongside H.264/H.265 video), pero a perda ocorre en bandas de son que non levan moita información de voz. Faster Whisper transcríbeo ao 2-20 Mbps total cun ~1% de precisión WAV na mesma gravación de orixe. O nivel real de precisión é a calidade da gravación orixinal (micro, sala, claridade do altofalante), non o códec MKV.

Os ficheiros MKV son normalmente 10-50 MB/min, often with selectable audio languages, polo que a maioría dos envíos caen ben por baixo do noso límite de 500 MB. As contas gratuítas poden transcribir ata 5 minutos por envío. Os plans de pago poden transcribir ata 2 horas. Se está a superar o límite con ficheiros longos, consulte a ferramenta audiolibro / formato longo que xestiona a transcrición de varias horas.

Si, Faster Whisper admite 99 linguas e detecta automaticamente a lingua falada no seu ficheiro MKV. Tamén pode forzar unha lingua de orixe específica mediante a configuración avanzada se a detección automática escolle a incorrecta (común co inglés acentuado mal clasificado como lingua materna do oínte, ou con clipes moi curtos).

Devolvemos os ficheiros de subtítulos SRT e VTT xunto coa transcrición de texto simple. Para incorporalos no seu ficheiro MKV, use unha ferramenta como ffmpeg ou HandBrake para agrupar os SRT/ VTT como pista de subtítulos. Non recodificamos o vídeo en si, isto sería con perdas.

O MKV pode levar varias pistas de son, pero para a diarización dos altofalantes primeiro mestúrase unha soa pista. Se o MKV ten pistas de son separadas por altofalante (raro fóra da produción profesional), o fluxo de traballo máis limpo é extraer cada pista a MP3, transcribila individualmente e fusionar as transcricións, isto é, 100% preciso para o altofalante sen precisar diarización.

Non. O noso transcriptor xestiona o MKV directamente — converter primeiro a MP4 engadiria un paso de recodificación (potencialmente con perdas) e perdería o seu tempo. A única excepción é se o seu ficheiro MKV usa un códec pouco común que o noso descodificador non recoñece (raro); dirémosllo ao enviar e pode converter mediante o noso conversor de son gratuito.

Si, ese é o patrón de envío máis común para MKV. O Suspirar máis rápido xestiona gravacións limpas, ruidosas e fala acentuada - non precisa limpar o son primeiro. Se a precisión non é o que espera, execute o ficheiro co noso Mellorador de son (gratuito por unha pasada) para eliminar o ruído de fondo e logo tente de novo a transcrición.

A transcrición é gratuíta para ficheiros de menos de 5 minutos. Os plans de pago usan ~1. 000 caracteres por minuto de MKV sons. Unha reunión de 60 minutos transcríbese para 60. 000 caracteres; unha nota de voz de 3 minutos é gratuíta. Nota específica de MKV: se o seu ficheiro é principalmente silencio (por ex. pausas longas nunha gravación dunha reunión), active a Detección de Actividade de Voz para saltar o silencio e pague só polas seccións de voz.

Si. Os MKV ficheiros enviados son procesados nos nosos servidores de GPU e eliminados automaticamente no prazo de 2 días. Nunca almacenamos o son a longo prazo, adestramos modelos con datos de usuario ou compartimos con terceiros. A transcrición permanece na súa conta o tempo que queira.

Si. POST o seu ficheiro MKV a / api/ v1/ transcribe / como datos de formulario multiparte. O punto final acepta o vídeo directamente — non hai necesidade de extraer o son primeiro; ffmpeg xestiona o demux do lado do servidor. A resposta inclúe a transcrición, os selos de data/ hora e un UUID de tarefa que pode consultar para URLs de exportación SRT/ VTT.
5.0/5 (1)

Que podemos mellorar? Os seus comentarios axúdannos a corrixir os problemas.

Transcreba son con IA

Obteña transcricións precisas en 99 idiomas. Inscríbase de balde e obtén 15 créditos para comezar.