Convert MKV to Text

Convert MKV video files to text with AI. Transcribe movies and video files with subtitle export. Free online MKV transcription.

Audio oder Video hochladen

Drag & Drop Ihre Datei hier, oder durchsuchen

Unterstützt MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV, MKV. Frei bis zu 500 MB · Pro bis zu 2 GB.

Datei.mp3

0 MB
— oder von Ihrem Mikrofon aufnehmen —
00:00

Einstellungen

1,000/min Zeichen Melden Sie sich an Um die Nutzung zu verfolgen

Text

Laden Sie eine Audio- oder Videodatei hoch und klicken Sie auf Transcribe, um loszulegen

Transkription... das kann einen Moment dauern.

Getrennt:

Wie es funktioniert

1. Audio oder Video hochladen

Wir unterstützen MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV und MKV Formate bis zu 100MB.

2. KI-Transkribieren

Unsere KI-Modelle verarbeiten Ihr Audio, erkennen Sprache, identifizieren Lautsprecher und erzeugen präzisen Text mit Zeitstempeln.

3. Holen Sie sich Ihren Text

Kopieren Sie Ihr Transkript oder laden Sie es als TXT- oder SRT-Untertitelformat herunter. Bearbeiten und verfeinern Sie bei Bedarf.

Anwendungsfälle

Audio-Transkription für jede Branche und Workflow

Tagungen & Konferenzen

Automatische Transkription von Zoom, Teams und Google Meet-Aufnahmen. Verpassen Sie nie wieder ein Action-Element. Exportieren Sie als Notizen oder Untertitel.

Interviews & Journalismus

Transcribe Interviews für Artikel, Forschungsarbeiten und Dokumentationen. Speaker Diarization identifiziert, wer sagte, was für eine einfache Zuschreibung.

Podcasts & Medien

Erstellen Sie Transkripte und zeigen Sie Notizen für Podcast-Episoden. Erstellen Sie durchsuchbare Archive Ihres Audioinhalts. Fügen Sie Untertitel zu Video-Podcasts hinzu.

Vorträge & Bildung

Konvertieren Sie aufgezeichnete Vorlesungen in Studiennotizen. Machen Sie pädagogische Inhalte mit genauen Bildunterschriften zugänglich. Unterstützen Sie Studenten mit Hörbehinderungen.

YouTube & Soziale Medien

Erzeugen von Untertiteln und geschlossenen Untertiteln für YouTube-Videos, TikToks und Social Media-Inhalte. Verbessern Sie die Zugänglichkeit und SEO mit präzisen Transkripten.

Recht & Medizin

Transcribe Aussagen, Anhörungen, Konsultationen und Diktat. Genaue Zeitstempel als Referenz. Export in Formate geeignet für Dokumentation.

Unterstützte Formate

Transcribe jede Audio- oder Videodatei — wir extrahieren das Audio automatisch

Audioformate

MP3 WAV FLAC OGG M4A AAC WMA OPUS

Videoformate

MP4 WebM AVI MOV MKV WMV FLV M4V

Audio wird automatisch aus Videodateien zur Transkription extrahiert.

Transkriptionsmodelle

Whisper

Das robuste Spracherkennungsmodell von OpenAI unterstützt 99 Sprachen.

  • 99 Sprachen
  • Übersetzung
  • Zeitstempel
  • Robust gegen Lärm
OpenAI

Faster Whisper

4x schneller als Whisper mit CTranslate2-Optimierung, gleiche Genauigkeit.

  • 4x schneller
  • Unterer Speicher
  • Alle Modellgrößen
  • Batch-Verarbeitung
  • VAD-Filterung
SYSTRAN

SenseVoice

Sprachverständnis Modell mit Emotionserkennung, 50+ Sprachen.

  • 50+ Sprachen
  • Emotionserkennung
  • Audio-Ereignisse
  • Speakeranalyse
  • Reiche Metadaten
Alibaba (FunAudioLLM)

Häufig gestellte Fragen

Laden Sie Ihre MKV-Datei hoch. Unser Transkriber extrahiert den Audiotrack aus dem a flexible Matroska container that can hold multiple audio tracks and subtitles alongside H.264/H.265 video-Container, sendet ihn an Faster Whisper auf einer GPU und gibt ein zeitgestempeltes Transkript zusammen mit optionalen SRT- und VTT-Untertitelexporten zurück. Sie müssen Audio nicht selbst demuxen oder extrahieren – das passiert serverseitig.

MKV ist a flexible Matroska container that can hold multiple audio tracks and subtitles alongside H.264/H.265 video. Es wird am häufigsten von high-resolution video releases, Blu-ray rips, and multi-track downloads produziert.

MKV ist verlustig (a flexible Matroska container that can hold multiple audio tracks and subtitles alongside H.264/H.265 video), aber der Verlust geschieht in Audio-Bands, die nicht viel Sprachinformationen tragen. Schneller Whisper transkribiert MKV bei 2-20 Mbps total innerhalb ~1% der WAV-Genauigkeit auf der gleichen Quelle Aufnahme. Die reale Genauigkeit Boden ist ursprüngliche Aufnahmequalität (Mischung, Raum, Lautsprecher Klarheit), nicht die MKV Codec.

MKV Dateien sind in der Regel 10-50 MB/min, often with selectable audio languages, so dass die meisten Uploads landen gut unter unserer 500 MB Decke. Kostenlose Konten können transkribieren bis zu 5 Minuten pro Upload. Bezahlte Pläne gehen bis zu 2 Stunden. Wenn Sie die Decke auf langen Dateien stoßen, sehen Sie das Hörbuch / Longform-Tool, das mehrstündige Transkription behandelt.

Ja — Schnellere Whisper unterstützt 99 Sprachen und erkennt automatisch die gesprochene Sprache in Ihrer MKV-Datei. Sie können auch eine bestimmte Quellsprache über die erweiterten Einstellungen erzwingen, wenn Auto-detect die falsche wählt (üblich mit akzentuiertem Englisch als Muttersprache des Hörers oder mit sehr kurzen Clips).

Wir geben SRT- und VTT-Untertiteldateien neben dem Klartext-Transkript zurück. Um sie in Ihre MKV-Datei einzubetten, verwenden Sie ein Tool wie ffmpeg oder HandBrake, um den SRT/VTT als Soft-Subtitle-Track zu muxieren.

MKV kann mehrere Audiospuren tragen, aber für die Lautsprecherdiarisierung mischen wir sie zuerst auf einen einzelnen Track. Wenn Ihr MKV separate Audiospuren pro Lautsprecher hat (selten außerhalb der professionellen Produktion), ist der sauberste Workflow, jeden Track auf MP3 zu extrahieren, einzeln zu transkribieren und die Transkripte zusammenzufassen – das ist 100% Lautsprecherakkurat ohne Diarisierung.

Nein. Unser Transkriber verarbeitet MKV direkt — zuerst auf MP4 umzuwandeln würde einen Re-Encoding Schritt (potentially verlusty) hinzufügen und Ihre Zeit verschwenden. Die eine Ausnahme ist, wenn Ihre MKV Datei einen ungewöhnlichen Codec verwendet, den unser Decoder nicht erkennt (selten); wir werden Ihnen sagen, dass beim Upload und Sie über unseren kostenlosen Audio Converter konvertieren können.

Ja, das ist das häufigste Upload-Muster für MKV. Schnellere Whisper verarbeitet saubere Aufnahmen, laute und akzentuierte Sprache – Sie müssen das Audio nicht zuerst säubern. Wenn Genauigkeit nicht das ist, was Sie erwarten, führen Sie die Datei durch unseren Audio Enhancer (kostenlos für einen Pass), um Hintergrundgeräusche zu entfernen, dann wiederholen Transkription.

Die Transkription ist kostenlos für Dateien unter 5 Minuten. Bezahlte Pläne verwenden ~1.000 Zeichen pro Minute von MKV Audio. Eine 60-Minuten-Sitzung transkribiert für 60.000 Zeichen; ein 3-Minuten-Stimme-Memo ist kostenlos. MKV-spezifische Anmerkung: Wenn Ihre Datei ist meist Stille (z.B. lange Pausen in einer Sitzung Aufzeichnung), ermöglichen Voice Activity Detection, um die Stille zu überspringen und zahlen nur für die Sprachabschnitte.

Ja. Hochgeladene MKV Dateien werden auf unseren GPU-Servern verarbeitet und automatisch innerhalb von 2 Tagen gelöscht. Wir speichern die Audio-Langzeit, trainieren Modelle auf Benutzerdaten oder teilen sie mit Dritten. Das Transkript bleibt so lange in Ihrem Konto, wie Sie es wünschen.

Ja. POST Ihre MKV-Datei auf /api/v1/transcribe/ als mehrteilige Formdaten. Der Endpunkt akzeptiert das Video direkt — keine Notwendigkeit, Audio zuerst zu extrahieren; ffmpeg behandelt die demux-Server-Seite. Die Antwort enthält das Transkript, Zeitstempel und einen Job UUID, den Sie für SRT/VTT-Export-URLs abfragen können.
5.0/5 (1)

Was könnten wir verbessern? Ihr Feedback hilft uns, Probleme zu beheben.

Transcribe Audio & Video mit KI

Erhalten Sie genaue Transkriptionen in 99 Sprachen. Melde dich kostenlos an und erhalte 15.000 Zeichen zum Starten.