Rapportér fejl / funktionsanmodning

Tale til tekst

Transskribér lyd og video til tekst med AI. Understøtter 99 sprog, tidsstempler og højttalerdetektering.

Tilmeld dig gratis

Upload lyd eller video

Træk & slip din fil her, eller gennemse

Understøtter MP3, WAV, FLAC, OGG, M4A, MP4, WebM. Gratis op til 500 MB · Pro op til 2 GB.

Optag eller optag fra din mikrofon

00:00

Indstillinger

Model

Sprog

Inkludér tidsstempler

Speaker diarization

1,000/min tegn — Tilmeld dig at spore brugen

Engelsk translitteration

Upload en lydfil og klik på Transcribe for at komme i gang

Hvordan det virker

1. Upload lyd

Upload din lyd- eller videofil. Vi understøtter MP3, WAV, FLAC, OGG, M4A, MP4, og WebM formater op til 100MB.

2. AI Transcribes

Vores AI-modeller behandler din lyd, registrerer sprog, identificerer højttalere og gener præcis tekst med tidsstempler.

3. Få din tekst

Kopier din transskription eller hent den som TXT eller SRT undertekstformat. Rediger og forfin efter behov.

Brugstilfælde

Tale til tekst for hver branche og arbejdsgang

Møder og konferencer

Transskriber automatisk Zoom, Teams og Google Meet optagelser. Gå aldrig glip af et handlingselement igen. Eksportér som mødenoter eller undertekster.

Interview & journalistik

Transskriber interviews til artikler, forskning papirer, og dokumentarfilm. Højttaler diarization identificerer, hvem der sagde, hvad for nem tildeling.

Podcasts & medie

Generer udskrifter og vis noter til podcast episoder. Opret søgbare arkiver for dit lydindhold. Tilføj undertekster til video podcasts.

Foredrag og undervisning

Konverter indspillede foredrag til studienoter. Gør undervisningsindhold tilgængeligt med nøjagtige billedtekster. Support studerende med hørehæmmede.

Medicinsk diktering

Transskriber læge-patient konsultationer, kliniske noter, og medicinsk diktering. Gem timers manuel dokumentation med AI-drevet nøjagtighed.

Juridiske spørgsmål

Transskriber aflejringer, høringer og klientmøder. Nøjagtige tidsstempler til juridisk reference. Eksporter i formater egnet til retsdokumentation.

Sammenligning af STT-model

Whisper

OpenAI's robuste talegenkendelsesmodel understøtter 99 sprog.

99 sprog
Oversættelse
Tidsstempler
Robust til støj

OpenAI

Faster Whisper

4x hurtigere end hvisken med CTranslate2 optimering, samme nøjagtighed.

4x hurtigere
Lavere hukommelse
Alle modelstørrelser
Batchforarbejdning
VAD-filtrering

SYSTRAN

SenseVoice

Taleforståelsesmodel med følelsesmæssig påvisning, 50+ sprog.

50+ sprog
Følelsesdetektion
Lydbegivenheder
Højttaleranalyse
Rige metadata

Alibaba (FunAudioLLM)

Tale- til- tekst- planer

Start gratis, opgradere når du har brug for mere

Fri

1-minutters audio limit
Hurtigere hvisken model
Grundlæggende transskription
100+ sprog

Mest populære

Gratis konto

30 minutters lyd + 15.000 tegn
Alle STT-modeller
Tidsstempler på ordniveau
SRT & VTT undertekst eksport
Speaker diarization

Tilmeld dig gratis

Pro

To timers lydfiler
Batch- transskription
Prioriteret behandling
API- adgang
Brugerdefineret ordforråd

Opgradering

Ofte stillede spørgsmål

Tale til tekst (STT), også kaldet automatisk talegenkendelse (ASR), konverterer talte sprog til skriftlig tekst. Vores modeller bruger AI til præcist at transskribere lyd fra møder, interviews, podcasts, foredrag og meget mere.

Hurtigere Whisper anbefales til de fleste brug tilfælde! Det er 4x hurtigere end den oprindelige Whisper samtidig bevare den samme nøjagtighed. Brug SenseVoice hvis du har brug for emotion detection eller audio begivenhed afsløring sammen transskription.

Vi understøtter MP3, WAV, M4A, OGG, FLAC, WEBM, og mest almindelige lyd / video-formater. Maksimal filstørrelse er 50MB. For større filer, overveje at opdele lyden først.

Gratis brugere kan transskribere op til 5 minutters lyd. Betalte planer understøtter lydfiler op til 2 timer. Brug vores API med batchbehandling til længere optagelser.

Vores modeller opnår 95%+ nøjagtighed på klar engelsk tale. Nøjagtighed varierer efter sprog, lydkvalitet og baggrundsstøj. Hurtigere hvisker og hvisker understøtter 99 sprog med varierende nøjagtighedsniveauer.

Ja, vores avancerede transskriptionstilstande kan identificere og mærke forskellige højttalere i lyden. Højttalerdiarisering er især nyttig til mødeudskrifter, interviews og multi-person podcasts, hvor du skal vide, hvem der sagde hvad.

Real-time streaming transskription er tilgængelig via vores API ved hjælp af hurtigere Whisper. Audio behandles i stykker, som det ankommer, levere delvise udskrifter med lav latenstid. Dette er ideelt til live billedtekster og real-time note-tage.

Ja, vores transskription output omfatter word-level tidsstempler, der kan eksporteres som SRT, VTT, eller ASS undertekster filer. Dette er perfekt til at tilføje billedtekster til YouTube videoer, online kurser, og sociale medier indhold.

Ja, alle transskriptions resultater omfatter segment-niveau tidsstempler som standard. Word-niveau tidsstempler er også tilgængelige, viser den nøjagtige start- og sluttid for hvert ord i lyden.

Hurtigere Whisper er uddannet på forskellige lyd og håndterer moderat baggrundsstøj godt. For meget støjende optagelser, anbefaler vi at køre lyden gennem vores Audio Enhancer først for at forbedre klarhed før transskription.

Ja, uploadede lydfiler behandles på vores sikre GPU-servere og slettes automatisk efter transskription er færdig. Vi gemmer, deler eller bruger ikke din lyd til træningsformål. Alle overførsler krypteres.

Gratis brugere kan transskribere op til 5 minutters lyd uden omkostninger. Betalte planer bruge tegn baseret på audio varighed: ca. 1.000 tegn pr minut af lyd. Tjek vores prissætning side for detaljerede planoplysninger og tegnpakker.

5.0/5 (1)

Transskribér lyd med AI

Få nøjagtige transskriptioner på 99 sprog. Tilmeld dig gratis og få 15.000 tegn til at starte.

Tilmeld dig gratis Vis priser

Tale til tekst

Upload lyd eller video

Indstillinger

Engelsk translitteration

Hvordan det virker

1. Upload lyd

2. AI Transcribes

3. Få din tekst

Brugstilfælde

Møder og konferencer

Interview & journalistik

Podcasts & medie

Foredrag og undervisning

Medicinsk diktering

Juridiske spørgsmål

Sammenligning af STT-model

Whisper

Faster Whisper

SenseVoice

Tale- til- tekst- planer

Ofte stillede spørgsmål

Hvad er tale til tekst (STT)?

Hvilken transskriptionsmodel er bedst?

Hvilke lydformater kan jeg uploade?

Er der en tidsfrist for transskription?

Hvor nøjagtig er transskriptionen?

Støtter tale til tekst højttalerdiarisering?

Kan jeg få real-time transskription?

Kan jeg generere undertekster eller SRT-filer?

Inkluderer transskriptionen tidsstempler?

Hvordan håndterer værktøjet baggrundsstøj?

Er mine lyddata holdt private?

Hvor meget koster tale til tekst?

Transskribér lyd med AI