免费音频翻译器
直接在浏览器中将 99 种语言的音频翻译成英文文本。拖入西班牙语播客、普通话采访或法语讲座 — 获得带时间戳的英文文本。可下载为 .txt、.srt 或 .vtt。无需上传,无需注册。
拖入音频或视频文件
or 点击浏览选择. Any of 99 languages. Best with files under 30 min on most browsers. Cap at 60 min — split longer files first with our 音频分割.
没有文件?用我们的录音器录制一段,测试翻译效果。
100% 在你的浏览器中运行。音频会留在你的设备上。Whisper AI 模型只从公共 CDN 下载一次(约 40 MB),之后每次翻译都在本地运行。我们无法访问你的音频,因为它从不离开你的电脑。隐私政策。
Best with clear speech. Uncheck 翻译 to 英语 for source-language transcription. 请保持此标签页打开 — 如果你切换标签页,我们会发出提示音。 模型在首次下载后会被缓存。 模型对比 →
Translation
将音频翻译成英文 — 免费、私密、基于浏览器
SnipSound 的音频翻译器使用 OpenAI 的开源语音翻译模型 Whisper,通过 WebAssembly 完全在你的浏览器中运行。上传西班牙语播客、普通话采访、法语讲座或阿拉伯语语音备忘 — Whisper 会将其转换为带有精确时间戳的英文文本。首次点击翻译时,你的浏览器会从公共 CDN 下载一个约 40 MB 的 AI 模型;之后每次翻译都在本地完成。
适用场景
- 为外语视频制作英文字幕。拖入你下载的外语片段,获得一个可上传到 YouTube 的英文字幕 .srt 文件。
- 外语采访的英文文字稿,适合记者、研究人员和分析师。
- 理解语音消息,即你收到的、用你不会说的语言录制的消息。
- 学习外语音频以学习语言 — 在源语言视图和英文视图之间切换。
- 涉及隐私的内容 — 心理治疗记录、机密采访、用其他语言录制的内部会议。
它不太擅长的场景
- 强烈的背景噪音、人声背后的音乐、多人声音重叠。
- 低资源语言 — 质量差异很大。老挝语、毛利语、意第绪语可以使用,但比西班牙语/普通话粗糙。
- 习语 / 特定文化的表达 — 小型模型只能给出字面翻译。
- 时长超过 60 分钟的文件 — 为保护浏览器内存而有上限。
- 翻译成英文以外的其他语言 — Whisper 仅翻译成英文。请先转写为源语言,再用 Google 翻译 或 DeepL 完成第二步翻译。
与 Cockatoo、Otter、Rev 的对比
Cockatoo、Otter、Rev、Trint、Sonix 都在自己的服务器上运行更大的 Whisper 变体。质量明显更高 — 尤其是在浓重口音、多人说话和低资源语言方面。它们收费 10-30 美元/月或 1 美元/分钟,因为 GPU 服务器需要成本。SnipSound 的优势:免费、无需注册、无需上传。当隐私 / 成本比最高准确度更重要时,请使用它。
需要的是转写而不是翻译?
取消勾选翻译成英文即可获得源语言转写,或使用专门的音频转写工具。