报告错误/功能要求

记录音频和视频

将音频和视频文件发送到 AI. 上传 MP3、 MP4、 WAV、 MOV 或任何媒体文件的文本。支持 99 种语言、时间戳和语音探测。

签署自由

上传音频或视频

拖放您的文件到这里( D), 或者浏览

支持MP3、WAV、FLAC、OGG、M4A、MP4、WebM、AVI、MOV、MKV的MP3、WAV、FLAC、OGG、M4A、MP4、WebM、AVI、MOV、MKV。

- 或记录从你的麦克风 -

00:00

设置

型

语言

包含时间戳

议长对角

1,000/min 字符 — 签名跟踪使用

脚本

上传一个音频或视频文件, 并单击 Transcrip 开始

如何运作

1. 上传音频或视频

上传您的音频或视频文件。我们支持 MP3, WAV, FLAC, OGG, M4A, MP4, WebM, AVI, MOV 和 MKV 格式, 最多可达 100MB 。

2. 大赦国际

我们的人工智能模型处理你的音频,探测语言,识别发言者,用时间戳生成准确的文字。

3. 获取你的脚本

复制您的笔录或以 TXT 或 SRT 字幕格式下载。需要时编辑和精细。

使用案例

每个行业和工作流程的音频转录

会议和会议

自动改写 Zom、团队和 Google 的录音。永远不要再错过一个动作项目。以会议笔记或字幕导出。

采访和新闻

将采访写成文章、研究论文和纪录片,

播客和媒体

为播客节目生成记录誊本和显示笔记。创建您音频内容的可搜索档案。在视频播客中添加字幕。

讲座和教育

将已录制的讲座转换成学习笔记; 以准确的字幕提供教育内容无障碍; 支持有听力障碍的学生。

YouTube与社会媒体

制作YouTube视频、TikToks和社交媒体内容的字幕和封闭字幕。

法律和医疗

记录证词、听证、磋商和传说。准确的参考时间戳。出口适合文件的格式。

支持格式

记录任何音频或视频文件——我们自动提取音频

音频格式

MP3 WAV FLAC OGG M4A AAC WMA OPUS

视频格式

MP4 WebM AVI MOV MKV WMV FLV M4V

从视频文件中自动提取音频进行转录。

翻译模型

Whisper

OpenAI的强力语音识别模式支持99种语言。

99种语言
笔译
时标
强烈到噪音

OpenAI

Faster Whisper

4x比耳语速度快具有C Translate2优化, 精确度相同。

加速 4x 速度
较低内存
所有模型大小
批次处理
VAD 过滤

SYSTRAN

SenseVoice

语音理解模式,情感检测,50+语言。

50岁以上语言
情感检测
音音音活动
议长分析
丰富元数据

Alibaba (FunAudioLLM)

翻译计划

开始免费, 需要时升级

自由

1分钟录音限制
快速耳语模式
基本转录
100+语言

最受欢迎的

自由帐户

30分钟音频+15 000个字符
所有STT 模型
单词级时间戳
SRT & VTT 字幕导出
议长对角

签署自由

职业

2小时2小时音频文件
批次转录
优先处理事项处理
API 访问
自定义词汇表

升级

常问问题

上传您的音频或视频文件( MP3, WAV, M4A, OGG, FLAC, 或视频格式) 并单击 Transcrip 。我们的 AI 在秒内处理音频并返回准确的文本。不需要软件下载 — — 所有文件都在您的浏览器中运行。

我们支持所有通用的音频格式,包括MP3、WAV、M4A、OGG、FLAC、WEBM和大多数视频格式(MP4、AVI、MKV、MOV),最大文件大小为5000MB。该工具自动从视频文件中提取音频。

我们的AI转录在清晰的演讲中达到了95的准确度。我们使用快速耳语(比原耳语更快4x)和SenseVoice来取得最佳效果。准确性取决于音质、背景噪音和语言。

是的,我们的抄录工具支持99种语言。更快的耳语自动检测口语,或者您可以手动指定,以便更准确。流行语言包括英语、西班牙语、法语、德语、日语、中文和阿拉伯语。

免费用户可以输入最多5分钟的音频。付费计划支持文件长达2小时。对于更长的录音, 使用批量处理的我们的 API 来有效记录音频时数。

是的,所有抄录都包含部分级的默认时间戳。单词级的时间戳也可用, 显示每个单词的确切开始和结束时间, 即字幕和字幕的完美时间。

是的, 转录输出包括可以作为 SRT、 VTT 或 ASS 字幕文件出口的时间戳。这是在YouTube 视频、在线课程、播客和社交媒体内容中添加字幕的理想选择。

是的,我们先进的笔录模式支持发言者的对称——自动识别和标注音频中不同的发言者,这对会议记录、访谈和多人对话很有用。

您可以从YouTube视频下载音频, 并上传供转录。我们的工具可以处理任何标准的音频或视频格式。对于大宗YouTube转录, 请使用我们的 API 进行自动工作流程。

是的, 上传的音频会在我们的安全 GPU 服务器上处理, 并在转录后自动删除。我们从不存储、共享或使用您的音频进行培训。所有传输都通过 HTTPS 加密。

快速耳语以4x实时速度处理音频——大约2.5分钟内录制10分钟的录音记录,短片(1分钟以下)通常以秒完成。

音频可免费发送5分钟。付费计划使用基于音频持续时间的字符: 每分钟约1,000个字符。字符包以5美元开始, 100 000个字符。请查看我们的定价页面, 了解完整的计划细节。

5.0/5 (1)

与 AI 连接音频和视频

获得99种语言的准确抄本。免费签名, 并获得 15,000 个字符启动。

签署自由视图定价

记录音频和视频

上传音频或视频

设置

脚本

如何运作

1. 上传音频或视频

2. 大赦国际

3. 获取你的脚本

使用案例

会议和会议

采访和新闻

播客和媒体

讲座和教育

YouTube与社会媒体

法律和医疗

支持格式

音频格式

视频格式

翻译模型

Whisper

Faster Whisper

SenseVoice

翻译计划

常问问题

我如何将音频转换为文字?

我能改写什么音频格式?

笔录的准确性如何?

我能用其他语言抄录音频吗?

音频转录是否有时间限制?

我能在笔录里印上时间印吗?

我能把笔录作为字幕出口吗?

它是否支持发言者的身份识别?

我能抄录一个YouTube视频吗?

我的音频数据是私密的吗?

转录速度有多快?

音频转录要花多少钱?

与 AI 连接音频和视频