我的音频会被上传吗？

不会。音频始终留在你的浏览器中。AI 模型从我们的服务器下载一次后即在本地运行。你的音频永远不会离开你的设备。

免费 AI 音频转写

在浏览器中直接将语音转换为 99 种语言的文字。拖入音频或视频文件，获得带时间戳的转写文本，并下载为 .txt、.srt 或 .vtt。无需上传。无需注册。无大小限制。

拖入音频或视频文件

or 点击浏览选择. Best with files under 30 min on most browsers. Cap at 60 min — split longer files first with our 音频分割.

MP3WAVOGGFLACAACM4AWEBMMP4MOV

没有文件？用我们的录音工具录一个，试试转写效果。

100% 在你的浏览器中完成。音频始终留在你的设备上。Whisper AI 模型从我们的服务器下载一次（约 40 MB），此后每次转写都在本地运行。我们无法访问你的音频，因为它从不离开你的电脑。隐私政策。

file.mp3

—

音频是什么语言？

在您的浏览器中免费运行。 请保持此标签页打开 while it runs — 如果你切换标签页，我们会发出提示音。模型在首次下载后会被缓存。 Need translation? Use the dedicated 音频翻译.

Loading model… 0%

Transcript

Send file to: Translator Trimmer 静音移除语音录音机

免费、私密的 AI 音频转写 — 工作原理

SnipSound 的转写工具使用 OpenAI 的开源 Whisper 语音识别模型，完全通过 WebAssembly 在你的浏览器中运行。当你第一次点击 开始转写 时，浏览器会从我们的服务器下载一个约 40 MB 的模型文件；此后每次转写都完全在本地进行。你的音频文件永远不会上传到任何服务器——不会上传到我们的，也不会上传到 OpenAI 的，更不会上传到任何人的。

它擅长什么

转写播客访谈、会议录音、语音备忘录、讲座，或任何语音清晰的音频。
为视频生成字幕——下载带精确时间戳的 .srt 和 .vtt，可直接导入 YouTube、Vimeo 或任意编辑器。
为不想为 Otter 或 Rev 付费的记者、研究人员、学生和内容创作者快速生成粗略转写。
不想放到第三方服务器上的隐私敏感音频——心理咨询记录、机密访谈、内部会议。

它不太擅长什么

强烈的背景噪音、人声后的音乐，或多人重叠说话——tiny 版 Whisper 在这些情况下表现吃力。
浓重口音或非主流方言——更大的 Whisper 模型处理得更好，但对浏览器来说太重了。
说话人分离（“谁说了什么”）——Whisper-tiny 不支持。
时长超过 60 分钟的文件——我们限制输入时长，以控制浏览器内存。

将音频翻译成英文

勾选 "Translate to 英语"，Whisper 就会把任何非英语音频转写为英文文本。西班牙语播客 → 英文转写。普通话采访 → 英文笔记。如果翻译是你的主要需求，这里有专用的音频翻译工具。

常见问题

这真的是免费的吗？ ▼

是的。无需账户、无需银行卡、无使用限制。转写在你的浏览器中运行，使用的是 OpenAI 的开源 Whisper 模型。

Does my audio get uploaded anywhere? ▼

不会。你的音频文件始终留在浏览器中。AI 模型从我们的服务器下载一次并在本地缓存——此后转写完全离线进行。

支持哪些语言？ ▼

99 种语言，包括英语、西班牙语、普通话、印地语、阿拉伯语、法语、葡萄牙语、俄语、日语、德语、韩语、意大利语等。自动检测会根据开头几秒识别语言。

它能把音频翻译成英文吗？ ▼

可以。勾选 "Translate to 英语"，Whisper 就会把任何非英语音频转写为英文文本。或使用专用的音频翻译。

转写的准确度如何？ ▼

适合清晰的英语语音。在浓重口音、背景音乐、多人重叠说话或嘈杂环境下，准确度会下降。若需专业级准确度，付费的服务器工具（Otter、Rev）表现更好——但它们每月收费 10–30 美元，并且会上传你的音频。

我能为视频生成字幕吗？ ▼

可以——下载带时间戳的 .srt 或 .vtt。适用于 YouTube、Vimeo 及大多数视频编辑器。直接把视频文件拖到这里——我们会自动提取音频。

有时长限制吗？ ▼

每个文件 60 分钟。较长的文件会占用过多浏览器内存。请先用我们的音频剪辑裁剪，或用音频分割拆分。