很多 Mac 用户在观看外语视频、参加跨国会议或收听海外课程时,都会遇到实时字幕缺失的问题。传统翻译软件通常依赖麦克风采集声音,环境噪音、扬声器回声以及音质衰减都会影响识别准确率。尤其是在 YouTube 视频、线上会议或直播场景中,字幕延迟和翻译错误会进一步影响理解效率。
AirTranslate 的定位并不是传统意义上的文本翻译软件,而是一款专门针对 macOS 系统音频设计的实时转写与翻译工具。它能够直接捕获 Mac 内部正在播放的音频流,并将识别结果实时生成悬浮字幕,避免了以往需要配置虚拟声卡、手动切换音频通道等复杂步骤。对于经常接触英文会议、海外教程、外语播客和直播内容的用户来说,这类“系统音频直连”的方案会比传统麦克风录音方式更稳定,也更适合长时间使用。
AirTranslate是什么?
AirTranslate 是一款面向 macOS 平台的开源实时音频转写与翻译工具,主要用于捕获系统内部播放的音频内容,并实时输出字幕、翻译结果以及双语悬浮显示。它基于 macOS 的 ScreenCaptureKit 框架实现系统级音频抓取,不需要额外安装 BlackHole 等虚拟声卡工具即可工作。
与传统字幕软件不同,AirTranslate 更强调“边播放边翻译”的实时体验。用户可以在观看视频、参加线上会议或听播客时,直接在桌面看到实时字幕层,并根据需要切换 Apple 本地模式或 GPT 模式,以平衡翻译质量、隐私与 API 成本。

核心功能
AirTranslate 的重点并不在复杂功能堆叠,而是降低 Mac 系统音频实时翻译的使用门槛。它更适合需要长期处理外语音频内容的用户,包括开发者、跨国协作团队、学生以及海外内容观看者。
- 系统音频直接捕获——无需虚拟声卡即可获取 Mac 正在播放的声音内容。
- 实时语音转写——播放中的视频、会议或播客可以同步生成字幕文本。
- 双语悬浮字幕——支持边听边看翻译结果,减少频繁切换窗口。
- Apple 本地模式——调用 macOS 原生 Speech 与 Translation 框架完成识别与翻译。
- GPT 实时翻译模式——可接入 OpenAI Realtime 模型提升复杂语境下的翻译效果。
- 转写历史保存——支持将字幕与转写记录导出为 .txt 文件。
- 本地数据管理——历史记录可在本机查看、编辑与删除。
- 开源结构——适合对数据透明度和可控性有要求的用户。
使用场景
AirTranslate 更适合处理“正在播放”的外语音频内容。相比传统字幕工具,它的优势在于不需要提前下载视频或手动生成字幕文件,适合临时翻译与实时理解场景。
| 人群/角色 | 场景描述 | 推荐指数 |
|---|---|---|
| 海外视频观看用户 | 在 YouTube 或海外课程平台实时查看双语字幕 | ★★★★★ |
| 跨国会议参与者 | 会议过程中同步查看英文语音转写与翻译 | ★★★★★ |
| 开发者 | 收听英文技术分享、线上发布会或开发教程 | ★★★★☆ |
| 留学生 | 听英文课程、公开课或学术讲座时辅助理解 | ★★★★☆ |
| 播客听众 | 收听英文播客时降低理解门槛 | ★★★★☆ |
| 内容创作者 | 临时整理采访或视频音频内容 | ★★★☆☆ |
| 普通办公用户 | 偶尔翻译会议或短视频内容 | ★★★☆☆ |
操作指南
AirTranslate 的整体上手难度不高,但首次使用时需要完成系统权限配置。对于大多数 Mac 用户来说,几分钟内即可开始实时字幕翻译。
- 打开 AirTranslate 官方页面并下载安装应用。
- 首次启动后,进入 macOS 系统设置授权「屏幕录制」权限。
- 按提示开启「语音识别」与系统音频相关权限。
- 在应用中选择「Apple 模式」或「GPT 模式」。
- 如果使用 GPT 模式,进入设置填写自己的 OpenAI API Key。
- 打开需要翻译的视频、会议或直播内容。
- 点击「开始转写」即可生成实时悬浮字幕。
- 如需保存内容,可使用「导出记录」功能生成 .txt 文件。(建议定期清理敏感会议记录)
注意事项:
- GPT 模式会产生 OpenAI API 调用费用。
- 部分语言需要提前在 macOS 中下载对应语言包。
支持平台
AirTranslate 目前主要面向 macOS 平台使用,依赖 Apple 提供的 ScreenCaptureKit、Speech 与 Translation 等系统框架运行。由于需要较新的系统级音频捕获能力,因此仅支持较新版本的 macOS 环境。当前暂无官方 iOS、Windows 或 Android 版本。
产品定价
AirTranslate 本身采用开源与免费下载模式,基础 Apple 模式可直接使用,不需要额外订阅费用,属于 免费 工具。
如果用户开启 GPT 模式,则需要自行提供 OpenAI API Key。此部分费用由 OpenAI API 实际调用量决定,适合对翻译准确率与复杂语境处理要求更高的用户。
常见问题
Q:AirTranslate 是否必须连接 OpenAI?
不是。默认情况下,AirTranslate 使用 macOS 自带的语音识别与翻译框架即可运行。只有在开启 GPT 模式时,才需要填写自己的 OpenAI API Key。
Q:实时字幕会上传到云端吗?
Apple 模式更偏向本地处理,但具体行为仍与 macOS 语言包和系统服务有关。GPT 模式则会将音频相关数据发送至 OpenAI API,因此涉及会议、客户资料或敏感内容时,需要提前评估数据流向与隐私要求。
Q:AirTranslate 是否收费?
软件本身可以免费下载和使用。普通用户使用 Apple 模式时通常不会产生额外费用;如果接入 GPT 模式,则会根据 OpenAI API 的实际调用量产生成本。
开发者小结
AirTranslate 更像是一款“实用型工具”,重点解决的是 Mac 用户长期以来系统音频实时翻译配置复杂的问题。相比传统依赖麦克风采集的翻译软件,它通过系统内部音频捕获提升了字幕稳定性,也减少了虚拟声卡配置带来的学习成本。
它适合经常观看外语视频、参加国际会议、听英文播客或学习海外课程的用户,尤其适合作为临时实时字幕工具使用。如果只是偶尔翻译简单内容,Apple 模式已经能够满足基础需求;而对专业会议、长篇口语或复杂表达要求较高的用户,则可以考虑 GPT 模式。需要注意的是,旧版 macOS 用户可能无法完整兼容,同时涉及隐私与会议内容时,也需要关注本地存储与第三方 API 的数据管理问题。
