Opplesning til tekst

Transcribe lyd og video til tekst med AI. Støtter 99 språk, tidsstempler og høyttalerdeteksjon.

Last opp lyd

Dra og slipp fila her, eller bla

Supports MP3, WAV, FLAC, OGG, M4A, MP4, WebM. Max 100MB.

file.mp3

0 MB
— eller registrere fra mikrofonen —
00:00

Innstillinger

1 credits Sign up to track usage

Transmisjon

Last opp en lydfil og trykk Transcribe for å starte

Transkriber lyd... Dette kan ta et øyeblikk.

Oppdaget:

Hvordan det fungerer

1. Last opp lyd

Last opp lyd- eller videofila di. Vi støtter MP3, WAV, FLAC, OGG, M4A, MP4 og WebM formater opp til 100 MB.

2. AI Trancribes

Våre AI modeller behandler din lyd, oppdager språk, identifiserer høyttalere og genererer nøyaktig tekst med tidsstempler.

3. Hent teksten

Kopier utskrifta din eller last den ned som TXT eller SRT- tekstformat. Rediger og forfin om nødvendig.

Brukstilfeller

Uttalelse til tekst for hver næring og arbeidsflyt

Møter og konferanser

Skriv automatisk over Zoom, Teams og Google Meet- opptak. Gløym aldri et handlingselement igjen. Eksporter som møtenotater eller undertekster.

Intervjuer og journalistikk

Abonner på intervjuer for artikler, forskningspapirer og dokumentarfilmer. Spesifisererens diarisering identifiserer hvem som sa hva som var lett å tilskrive.

Podkaster & media

Lag utskrifter og vis notater for podkastepisoder. Lag søkbare arkiver av lydinnholdet ditt. Legg til undertekster til videopodkaster.

Øvelser og utdanning

Gjør innspillte foredrag tilgjengelige med nøyaktige tekster. Støtte studenter med nedsatt hørsel.

Medisinsk diktasjon

Transkriber lege- pasient- konsultasjoner, kliniske notater og medisinsk diktasjon. Lagre timer med manuell dokumentasjon med AI-krefter nøyaktighet.

Rettssak

Abonner på innskudd, høringer og kundemøter. Nøyaktige tidsstempler for juridisk referanse. Eksporter i formater som egner seg for domstolsdokumenter.

STT- modellsammenlikning

Whisper

OpenAI's robust speech recognition model supporting 99 languages.

  • 0 språk
  • 99 languages
  • Translation
  • Timestamps
  • Robust to noise
OpenAI

Faster Whisper

4x faster than Whisper with CTranslate2 optimization, same accuracy.

  • 0 språk
  • 4x faster
  • Lower memory
  • All model sizes
  • Batch processing
  • VAD filtering
SYSTRAN

SenseVoice

Speech understanding model with emotion detection, 50+ languages.

  • 0 språk
  • 50+ languages
  • Emotion detection
  • Audio events
  • Speaker analysis
  • Rich metadata
Alibaba (FunAudioLLM)

Speech-to-Text Plans

Start free, upgrade when you need more

Free
  • 1-minute audio limit
  • Faster Whisper model
  • Basic transcription
  • 100+ languages
Most Popular
Free Account
  • 30-minute audio + 50 credits
  • All STT models
  • Word-level timestamps
  • SRT & VTT subtitle export
  • Speaker diarization
Sign Up Free
Pro
  • 2-hour audio files
  • Batch transcription
  • Priority processing
  • API access
  • Custom vocabulary
Upgrade

Ofte stilte spørsmål

Speech to text (STT), also called automatic speech recognition (ASR), converts spoken language into written text. Our models use AI to accurately transcribe audio from meetings, interviews, podcasts, lectures, and more.

Faster Whisper is recommended for most use cases — it's 4x faster than the original Whisper while maintaining the same accuracy. Use SenseVoice if you need emotion detection or audio event detection alongside transcription.

Vi støtter MP3, WAV, M4A, OGG, FLAC, WEBM og de vanligste lyd/ video- formatene. Maksimal filstørrelse er 50 MB. For større filer, tenk på å dele lyd først.

Free users can transcribe up to 5 minutes of audio. Paid plans support audio files up to 2 hours. For longer recordings, use our API with batch processing.

Our models achieve 95%+ accuracy on clear English speech. Accuracy varies by language, audio quality, and background noise. Faster Whisper and Whisper support 99 languages with varying accuracy levels.

Yes, our advanced transcription modes can identify and label different speakers in the audio. Speaker diarization is especially useful for meeting transcripts, interviews, and multi-person podcasts where you need to know who said what.

Vår API kan skrive i sanntid ved hjelp av Viskere. Lyden behandles i blokker etter hvert som den ankommer, og gir delvise utskrifter med lav latenstid. Dette er ideelt for levende teksting og sanntidslapping.

Yes, our transcription output includes word-level timestamps that can be exported as SRT, VTT, or ASS subtitle files. This is perfect for adding captions to YouTube videos, online courses, and social media content.

Yes, all transcription results include segment-level timestamps by default. Word-level timestamps are also available, showing the exact start and end time for each word in the audio.

Hurtigere Whisper er trent på forskjellige lydnivåer og håndterer moderat bakgrunnsstøy godt. For svært støyende opptak, anbefaler vi å kjøre lyden gjennom vår Audio Enhancer først for å forbedre klarheten før transkriptering.

Ja, opplastede lydfiler behandles på våre sikre GPU- tjenere og slettes automatisk etter at transkripteringen er fullført. Vi lagrer ikke, deler eller bruker din lyd for treningsformål. Alle overføringer er krypterte.

Free users can transcribe up to 5 minutes of audio at no cost. Paid plans use credits based on audio duration: approximately 1 credit per minute of audio. Check our pricing page for detailed plan information and credit bundles.
5.0/5 (1)

Transcribe lyd med AI

Få nøyaktige utskrifter på 99 språk, meld deg gratis og få 50 poeng til å begynne.