Tale til tekst

Transskribér lyd og video til tekst med AI. Understøtter 99 sprog, tidsstempler og højttalerdetektering.

Upload lyd

Træk & slip din fil her, eller gennemse

Supports MP3, WAV, FLAC, OGG, M4A, MP4, WebM. Max 100MB.

file.mp3

0 MB
Optag eller optag fra din mikrofon
00:00

Indstillinger

1 credits Sign up to track usage

Engelsk translitteration

Upload en lydfil og klik på Transcribe for at komme i gang

Det kan tage et øjeblik.

Detekteret@ info: whatsthis:

Hvordan det virker

1. Upload lyd

Upload din lyd- eller videofil. Vi understøtter MP3, WAV, FLAC, OGG, M4A, MP4, og WebM formater op til 100MB.

2. AI Transcribes

Vores AI-modeller behandler din lyd, registrerer sprog, identificerer højttalere og genererer præcis tekst med tidsstempler.

3. Få din tekst

Kopier din transskription eller hent den som TXT eller SRT undertekstformat. Rediger og forfin efter behov.

Brugstilfælde

Tale til tekst for hver branche og arbejdsgang

Møder og konferencer

Transskriber automatisk Zoom, Teams og Google Meet optagelser. Gå aldrig glip af et handlingselement igen. Eksportér som mødenoter eller undertekster.

Interview & journalistik

Transskriber interviews til artikler, forskning papirer, og dokumentarfilm. Højttaler diarization identificerer, hvem der sagde, hvad for nem tildeling.

Podcasts & medie

Generer udskrifter og vis noter til podcast episoder. Opret søgbare arkiver for dit lydindhold. Tilføj undertekster til video podcasts.

Foredrag og undervisning

Konverter indspillede foredrag til studienoter. Gør undervisningsindhold tilgængeligt med nøjagtige billedtekster. Support studerende med hørehæmmede.

Medicinsk diktering

Transskriber læge-patient konsultationer, kliniske noter, og medicinsk diktering. Gem timers manuel dokumentation med AI-drevet nøjagtighed.

Juridiske spørgsmål

Transskriber aflejringer, høringer og klientmøder. Nøjagtige tidsstempler til juridisk reference. Eksporter i formater egnet til retsdokumentation.

Sammenligning af STT-model

Whisper

OpenAI's robust speech recognition model supporting 99 languages.

  • 0 sprog
  • 99 languages
  • Translation
  • Timestamps
  • Robust to noise
OpenAI

Faster Whisper

4x faster than Whisper with CTranslate2 optimization, same accuracy.

  • 0 sprog
  • 4x faster
  • Lower memory
  • All model sizes
  • Batch processing
  • VAD filtering
SYSTRAN

SenseVoice

Speech understanding model with emotion detection, 50+ languages.

  • 0 sprog
  • 50+ languages
  • Emotion detection
  • Audio events
  • Speaker analysis
  • Rich metadata
Alibaba (FunAudioLLM)

Ofte stillede spørgsmål

Speech to text (STT), also called automatic speech recognition (ASR), converts spoken language into written text. Our models use AI to accurately transcribe audio from meetings, interviews, podcasts, lectures, and more.

Faster Whisper is recommended for most use cases — it's 4x faster than the original Whisper while maintaining the same accuracy. Use SenseVoice if you need emotion detection or audio event detection alongside transcription.

Vi understøtter MP3, WAV, M4A, OGG, FLAC, WEBM, og mest almindelige lyd / video-formater. Maksimal filstørrelse er 50MB. For større filer, overveje at opdele lyden først.

Free users can transcribe up to 5 minutes of audio. Paid plans support audio files up to 2 hours. For longer recordings, use our API with batch processing.

Our models achieve 95%+ accuracy on clear English speech. Accuracy varies by language, audio quality, and background noise. Faster Whisper and Whisper support 99 languages with varying accuracy levels.

Yes, our advanced transcription modes can identify and label different speakers in the audio. Speaker diarization is especially useful for meeting transcripts, interviews, and multi-person podcasts where you need to know who said what.

Real-time streaming transskription er tilgængelig via vores API ved hjælp af hurtigere Whisper. Audio behandles i stykker, som det ankommer, levere delvise udskrifter med lav latenstid. Dette er ideelt til live billedtekster og real-time note-tage.

Yes, our transcription output includes word-level timestamps that can be exported as SRT, VTT, or ASS subtitle files. This is perfect for adding captions to YouTube videos, online courses, and social media content.

Yes, all transcription results include segment-level timestamps by default. Word-level timestamps are also available, showing the exact start and end time for each word in the audio.

Hurtigere Whisper er uddannet på forskellige lyd og håndterer moderat baggrundsstøj godt. For meget støjende optagelser, anbefaler vi at køre lyden gennem vores Audio Enhancer først for at forbedre klarhed før transskription.

Ja, uploadede lydfiler behandles på vores sikre GPU-servere og slettes automatisk efter transskription er færdig. Vi gemmer, deler eller bruger ikke din lyd til træningsformål. Alle overførsler krypteres.

Free users can transcribe up to 5 minutes of audio at no cost. Paid plans use credits based on audio duration: approximately 1 credit per minute of audio. Check our pricing page for detailed plan information and credit bundles.
5.0/5 (1)

Transskribér lyd med AI

Få nøjagtige transskriptioner på 99 sprog. Tilmeld dig gratis og få 50 credits til at starte.