Rapporteer bug / feature request

Toespraak naar tekst

Schrijf audio en video in op tekst met AI. Ondersteunt 99 talen, tijdstempels en luidsprekerdetectie.

Gratis aanmelden

Audio of video uploaden

Sleep uw bestand hierheen, of Bladeren

Ondersteunt MP3, WAV, FLAC, OGG, M4A, MP4, WebM. Gratis tot 500 MB · Pro tot 2 GB.

[Translation temporarily unavailable. Please try again.]

00:00

Instellingen

Model

Taal

Tijdstempels invoegen

Diaratie van de luidspreker

1,000/min tekens — Aanmelden om het gebruik te volgen

Omschrijving

Upload een audiobestand en klik op Transcribe om aan de slag te gaan

Hoe het werkt

1. Audio uploaden

Upload uw audio- of videobestand. Wij ondersteunen MP3, WAV, FLAC, OGG, M4A, MP4, en WebM formaten tot 100MB.

2. AI Transcribes

Onze AI-modellen verwerken uw audio, detecteren taal, identificeren luidsprekers en genereren nauwkeurige tekst met tijdstempels.

3. Krijg je tekst

Kopieer uw transcriptie of download het als TXT of SRT ondertitel formaat. Bewerken en verfijnen indien nodig.

Cases gebruiken

Toespraak naar tekst voor elke industrie en workflow

Vergaderingen en conferenties

Automatisch inschrijven Zoom, Teams en Google Meet opnames. Mis nooit meer een actie-item. Exporteer als meeting notes of ondertitels.

Interviews en journalistiek

Transcribe interviews voor artikelen, research papers en documentaires. Speaker diarization identificeert wie zei wat voor een gemakkelijke toeschrijving.

Podcasts & media

Genereer transcripten en toon notities voor podcast afleveringen. Maak doorzoekbare archieven van uw audio-inhoud. Voeg ondertitels toe aan video podcasts.

Lezingen & onderwijs

Converteer opgenomen lezingen in studienotities. Maak educatieve inhoud toegankelijk met nauwkeurige bijschriften. Steun studenten met gehoorstoornissen.

Medical Dictation

Overschrijven arts-patiënt consulten, klinische notities, en medische dictee. Bespaar uren handmatige documentatie met AI-aangedreven nauwkeurigheid.

Juridische procedures

Transcribe verklaringen, hoorzittingen, en klantenvergaderingen. Nauwkeurige tijdstempels voor juridische referentie. Exporteren in formaten geschikt voor de rechtbank documentatie.

STT-modelvergelijking

Whisper

OpenAI's robuuste spraakherkenningsmodel ondersteunt 99 talen.

99 talen
Vertaling
Tijdstempels
Robuust aan lawaai

OpenAI

Faster Whisper

4x sneller dan Whisper met CTranslate2 optimalisatie, dezelfde nauwkeurigheid.

4x sneller
Onder geheugen
Alle modelmaten
Batchverwerking
VAD-filtering

SYSTRAN

SenseVoice

Speech begrijpen model met emotie detectie, 50+ talen.

50+ talen
Emotiedetectie
Audio-evenementen
Analyse van de luidsprekers
Rijke metadata

Alibaba (FunAudioLLM)

Spraak-naar-tekstplannen

Start gratis, upgrade wanneer je meer nodig hebt

Vrij

Audiolimiet van 1 minuut
Sneller Whisper model
Fundamentele transcriptie
100+ talen

Meest populair

Gratis account

30 minuten audio + 15.000 tekens
Alle STT-modellen
Tijdstempels op woordniveau
SRT & VTT-ondertitel export
Diaratie van de luidspreker

Gratis aanmelden

Pro

2-uurs audiobestanden
Batch transcriptie
Prioritaire verwerking
API-toegang
Aangepaste woordenschat

Upgrade

Veelgestelde vragen

Speech to text (STT), ook wel automatische spraakherkenning (ASR) genoemd, zet gesproken taal om in geschreven tekst. Onze modellen gebruiken AI om audio nauwkeurig te transcriberen van vergaderingen, interviews, podcasts, lezingen en meer.

Sneller Whisper wordt aanbevolen voor de meeste use cases, het is 4x sneller dan de oorspronkelijke Whisper met behoud van dezelfde nauwkeurigheid. Gebruik SenseVoice als je emotiedetectie of audio-event detectie naast transcriptie nodig hebt.

Wij ondersteunen MP3, WAV, M4A, OGG, FLAC, WEBM, en de meest voorkomende audio / video formaten. Maximale bestandsgrootte is 50MB. Voor grotere bestanden, overwegen het splitsen van de audio eerst.

Gratis gebruikers kunnen tot 5 minuten audio transcriberen. Betaalde plannen ondersteunen audiobestanden tot 2 uur. Voor langere opnames, gebruik onze API met batchverwerking.

Onze modellen bereiken 95% meer nauwkeurigheid op duidelijke Engelse spraak. Nauwkeurigheid varieert per taal, audiokwaliteit en achtergrondgeluid. Sneller Whisper en Whisper ondersteunen 99 talen met verschillende nauwkeurigheidsniveaus.

Ja, onze geavanceerde transcriptie modi kunnen identificeren en labelen verschillende luidsprekers in de audio. Speaker diarization is vooral nuttig voor het ontmoeten van transcripten, interviews, en multi-persoon podcasts waar je moet weten wie wat zei.

Real-time streaming transcriptie is beschikbaar via onze API met behulp van Sneller Whisper. Audio wordt verwerkt in brokken als het aankomt, het leveren van gedeeltelijke transcripten met een lage latentie. Dit is ideaal voor live ondertiteling en real-time note-taking.

Ja, onze transcriptie-uitvoer bevat tijdstempels op woordniveau die kunnen worden geëxporteerd als SRT-, VTT- of ASS-ondertitelbestanden. Dit is perfect voor het toevoegen van bijschriften aan YouTube-video's, online cursussen en social media-inhoud.

Ja, alle transcriptie resultaten omvatten segment-niveau timestamps standaard. Word-level timestamps zijn ook beschikbaar, het tonen van de exacte start en eindtijd voor elk woord in de audio.

Sneller Whisper is getraind op diverse audio en verwerkt matige achtergrondgeluid goed. Voor zeer luidruchtige opnames, raden we het uitvoeren van de audio door onze Audio Enhancer eerst om de duidelijkheid te verbeteren voordat transcriptie.

Ja, geüploade audiobestanden worden verwerkt op onze beveiligde GPU-servers en automatisch verwijderd nadat transcriptie voltooid is. Wij slaan, delen of gebruiken uw audio niet voor trainingsdoeleinden. Alle transfers worden versleuteld.

Gratis gebruikers kunnen maximaal 5 minuten audio zonder kosten overschrijven. Betaalde plannen gebruiken tekens op basis van audioduur: ongeveer 1.000 tekens per minuut audio. Controleer onze prijspagina voor gedetailleerde planinformatie en karakterpakketten.

5.0/5 (1)

Audio met AI overschrijven

Krijg nauwkeurige transcripties in 99 talen. Schrijf je gratis in en krijg 15.000 tekens om te beginnen.

Gratis aanmelden Prijzen bekijken

Toespraak naar tekst

Audio of video uploaden

Instellingen

Omschrijving

Hoe het werkt

1. Audio uploaden

2. AI Transcribes

3. Krijg je tekst

Cases gebruiken

Vergaderingen en conferenties

Interviews en journalistiek

Podcasts & media

Lezingen & onderwijs

Medical Dictation

Juridische procedures

STT-modelvergelijking

Whisper

Faster Whisper

SenseVoice

Spraak-naar-tekstplannen

Veelgestelde vragen

Wat is spraak op tekst (STT)?

Welk transcriptiemodel is het beste?

Welke audioformaten kan ik uploaden?

Is er een tijdslimiet voor transcriptie?

Hoe nauwkeurig is de transcriptie?

Steunt speech to text speaker diarization?

Kan ik real-time transcriptie krijgen?

Kan ik ondertitels of SRT-bestanden genereren?

Bevat de transcriptie tijdstempels?

Hoe gaat de tool om met achtergrondgeluid?

Worden mijn audiogegevens privé gehouden?

Hoeveel kost spraak op tekst?

Audio met AI overschrijven