Report Bug / Feature Request

Opplesning til tekst

Transcribe lyd og video til tekst med AI. Støtter 99 språk, tidsstempler og høyttalerdeteksjon.

Last opp lyd eller video

Dra og slipp fila her, eller bla

Støtter MP3, WAV, FLAC, OGG, M4A, MP4, WebM. Max 100MB.

file.mp3

0 MB
— eller registrere fra mikrofonen —
00:00

Innstillinger

1,000/min tegn Registrer deg for å spore bruk

Transmisjon

Last opp en lydfil og trykk Transcribe for å starte

Transkriber lyd... Dette kan ta et øyeblikk.

Oppdaget:

Hvordan det fungerer

1. Last opp lyd

Last opp lyd- eller videofila di. Vi støtter MP3, WAV, FLAC, OGG, M4A, MP4 og WebM formater opp til 100 MB.

2. AI Trancribes

Våre AI modeller behandler din lyd, oppdager språk, identifiserer høyttalere og genererer nøyaktig tekst med tidsstempler.

3. Hent teksten

Kopier utskrifta din eller last den ned som TXT eller SRT- tekstformat. Rediger og forfin om nødvendig.

Brukstilfeller

Uttalelse til tekst for hver næring og arbeidsflyt

Møter og konferanser

Skriv automatisk over Zoom, Teams og Google Meet- opptak. Gløym aldri et handlingselement igjen. Eksporter som møtenotater eller undertekster.

Intervjuer og journalistikk

Abonner på intervjuer for artikler, forskningspapirer og dokumentarfilmer. Spesifisererens diarisering identifiserer hvem som sa hva som var lett å tilskrive.

Podkaster & media

Lag utskrifter og vis notater for podkastepisoder. Lag søkbare arkiver av lydinnholdet ditt. Legg til undertekster til videopodkaster.

Øvelser og utdanning

Gjør innspillte foredrag tilgjengelige med nøyaktige tekster. Støtte studenter med nedsatt hørsel.

Medisinsk diktasjon

Transkriber lege- pasient- konsultasjoner, kliniske notater og medisinsk diktasjon. Lagre timer med manuell dokumentasjon med AI-krefter nøyaktighet.

Rettssak

Abonner på innskudd, høringer og kundemøter. Nøyaktige tidsstempler for juridisk referanse. Eksporter i formater som egner seg for domstolsdokumenter.

STT- modellsammenlikning

Whisper

OpenAIs robuste talegjenkjenningsmodell som støtter 99 språk.

  • 99 språk
  • Oversettelse
  • Tidsstempler
  • Robust til støy
OpenAI

Faster Whisper

4 ganger raskere enn Whisper med CTranslate2-optimering, samme nøyaktighet.

  • 4 ganger raskere
  • Lavere minne
  • Alle modellstørrelser
  • Partibehandling
  • VAD- filtrering
SYSTRAN

SenseVoice

Taleforståelsesmodell med følelsespåvisning, 50+ språk.

  • 50+ språk
  • Følelsesdeteksjon
  • Lydhendelser
  • Høyttaleranalyse
  • Rike metadata
Alibaba (FunAudioLLM)

Tale- til- tekst- planer

Start ledig, oppgrader når du trenger mer

Ledig
  • 1- minutters lydgrense
  • Hurtigere Whisper-modell
  • Grunnleggende transkription
  • 100+ språk
Mest populære
Fri konto
  • 30- minutters lyd + 15 000 tegn
  • Alle STT-modeller
  • Tidsstempler for ordnivå
  • Eksport av SRT & VTT- undertekster
  • Høyttaler- diarisering
Registrer deg gratis
Pro
  • 2- timers lydfiler
  • Partikopiering
  • Prioritetsbehandling
  • API- tilgang
  • Selvvalgt glosesamling
Oppgradering

Ofte stilte spørsmål

Opplesning til tekst (STT), også kalt automatisk talegjenkjenning (ASR), konverterer snakket språk til skriftlig tekst. Våre modeller bruker AI til nøyaktig å transkribere lyd fra møter, intervjuer, podkaster, forelesninger og mer.

Hurtigere Whisper anbefales for de fleste tilfeller – det er 4 ganger raskere enn den opprinnelige Whisper samtidig som den samme nøyaktigheten opprettholdes. Bruk SenseVoice hvis du trenger å oppdage følelser eller høre hendelser sammen med transkriptionen.

Vi støtter MP3, WAV, M4A, OGG, FLAC, WEBM og de vanligste lyd/ video- formatene. Maksimal filstørrelse er 50 MB. For større filer, tenk på å dele lyd først.

Gratis brukere kan transkribere opptil 5 minutters lyd. Betalingsplaner støtter lydfiler i opptil 2 timer. Bruk vårt API med satsvis behandling for lengre opptak.

Våre modeller oppnår 95%+ nøyaktighet på klar engelsk tale. Nøyaktighet varierer etter språk, lydkvalitet og bakgrunnsstøy. Hurtigere Whisper og Whisper støtter 99 språk med varierende nøyaktighetsnivå.

Ja, vår avanserte transkription kan identifisere og merke forskjellige høyttalere i lyden. Talerdiarisering er spesielt nyttig for å møte transkripter, intervjuer og flerpersonspodkaster der du trenger å vite hvem som sa hva.

Vår API kan skrive i sanntid ved hjelp av Viskere. Lyden behandles i blokker etter hvert som den ankommer, og gir delvise utskrifter med lav latenstid. Dette er ideelt for levende teksting og sanntidslapping.

Ja, vår utskrift inneholder tidsstempler på ordnivå som kan eksporteres som SRT, VTT eller ASS tekstfiler. Dette er perfekt for å legge til tekster til YouTube-videoer, nettkurs og innhold i sosiale medier.

Ja, alle utskriftsresultater inkluderer som standard tidsstempler på segmentnivå. Tidsstempler på ordnivå er også tilgjengelige, som viser nøyaktig start - og slutt- tid for hvert ord i lyden.

Hurtigere Whisper er trent på forskjellige lydnivåer og håndterer moderat bakgrunnsstøy godt. For svært støyende opptak, anbefaler vi å kjøre lyden gjennom vår Audio Enhancer først for å forbedre klarheten før transkriptering.

Ja, opplastede lydfiler behandles på våre sikre GPU- tjenere og slettes automatisk etter at transkripteringen er fullført. Vi lagrer ikke, deler eller bruker din lyd for treningsformål. Alle overføringer er krypterte.

Gratis brukere kan uten kostnad transskrinere opp til 5 minutters lyd. Betalingsplaner bruker tegn basert på lydvarighet: omtrent 1000 tegn per minutt lyd. Se på prissiden for detaljert planinformasjon og tegnpakker.
5.0/5 (1)

Hva kan vi forbedre? din tilbakemelding hjelper oss med å løse problemer.

Transcribe lyd med AI

Få nøyaktige utskrifter på 99 språk. Bli gratis og få 15 000 tegn å starte.