免费 AI 音频转写
在浏览器中直接将语音转换为 99 种语言的文字。拖入音频或视频文件,获得带时间戳的转写文本,并下载为 .txt、.srt 或 .vtt。无需上传。无需注册。无大小限制。
拖入音频或视频文件
or 点击浏览选择. Best with files under 30 min on most browsers. Cap at 60 min — split longer files first with our 音频分割.
没有文件?用我们的录音工具录一个,试试转写效果。
100% 在你的浏览器中完成。音频始终留在你的设备上。Whisper AI 模型从公共 CDN 下载一次(约 40 MB),此后每次转写都在本地运行。我们无法访问你的音频,因为它从不离开你的电脑。隐私政策。
在您的浏览器中免费运行。 请保持此标签页打开 while it runs — 如果你切换标签页,我们会发出提示音。 模型在首次下载后会被缓存。 Need translation? Use the dedicated 音频翻译.
Transcript
免费、私密的 AI 音频转写 — 工作原理
SnipSound 的转写工具使用 OpenAI 的开源 Whisper 语音识别模型,完全通过 WebAssembly 在你的浏览器中运行。当你第一次点击 开始转写 时,浏览器会从公共 CDN 下载一个约 40 MB 的模型文件;此后每次转写都完全在本地进行。你的音频文件永远不会上传到任何服务器——不会上传到我们的,也不会上传到 OpenAI 的,更不会上传到任何人的。
它擅长什么
- 转写播客访谈、会议录音、语音备忘录、讲座,或任何语音清晰的音频。
- 为视频生成字幕——下载带精确时间戳的 .srt 和 .vtt,可直接导入 YouTube、Vimeo 或任意编辑器。
- 为不想为 Otter 或 Rev 付费的记者、研究人员、学生和内容创作者快速生成粗略转写。
- 不想放到第三方服务器上的隐私敏感音频——心理咨询记录、机密访谈、内部会议。
它不太擅长什么
- 强烈的背景噪音、人声后的音乐,或多人重叠说话——tiny 版 Whisper 在这些情况下表现吃力。
- 浓重口音或非主流方言——更大的 Whisper 模型处理得更好,但对浏览器来说太重了。
- 说话人分离(“谁说了什么”)——Whisper-tiny 不支持。
- 时长超过 60 分钟的文件——我们限制输入时长,以控制浏览器内存。
将音频翻译成英文
勾选 "Translate to 英语",Whisper 就会把任何非英语音频转写为英文文本。西班牙语播客 → 英文转写。普通话采访 → 英文笔记。如果翻译是你的主要需求,这里有专用的 音频翻译 工具。