很多开发者、运营、客服和 AI 重度用户,已经习惯把日志、报错、会议纪要甚至客户反馈直接粘进 ChatGPT、Claude 或工单系统里解决问题。真正容易被忽略的风险,并不是“内容能不能分析”,而是这些文本里经常混着邮箱、手机号、Token、数据库连接参数甚至 API Key。
问题在于,一旦内容发出去,就意味着数据已经离开原本的控制范围。很多人以为自己已经检查过,但面对几百行日志、复杂截图或者聊天记录,人工逐条删除敏感字段不仅费时间,还很容易遗漏。
Privacy Filter 的价值,就在于它把“隐私检查”这一步提前放到了本地浏览器里完成。它会自动识别文本和截图中的 PII(个人敏感信息),包括姓名、电话、邮箱、地址、账号、URL、日期以及开发者最容易泄露的密钥和 Token,并自动替换成占位符。
相比很多在线脱敏网站,它更重要的一点是:识别过程主要在本地设备完成,而不是把数据上传到云端处理。对于经常需要向 AI 工具、论坛、GitHub Issue 或外部团队分享内容的人来说,它更像一个“发出去之前的数据清洗步骤”。
Privacy Filter是什么?
Privacy Filter 是一个基于浏览器运行的本地隐私脱敏工具,主要用于识别并隐藏文本或截图中的 PII(Personally Identifiable Information,个人可识别信息)。
它基于 OpenAI 开源的 privacy-filter 模型,并结合 Transformers.js 在浏览器本地完成推理。用户无需安装客户端,即可在网页中直接处理日志、截图、聊天记录或 AI Prompt 内容。
工具支持识别姓名、邮箱、电话、地址、日期、URL、账号以及 API Key、Token 等敏感字段,并自动替换为统一占位符。同时还支持 OCR 图片识别,对截图中的隐私内容进行本地脱敏处理。

核心功能
Privacy Filter 的重点,并不只是简单的查找替换,而是通过上下文识别敏感信息,并尽量保留原始文本结构与可读性。
- PII 自动识别——检测姓名、电话、邮箱等隐私字段。
- API Key 检测——识别开发中常见 Token 与密钥信息。
- 日志脱敏——清理服务器日志与错误报告中的敏感参数。
- 截图 OCR 识别——支持图片文字提取与敏感词检测。
- 自动占位符替换——统一生成 [EMAIL]、[KEY] 等标记。
- 浏览器本地处理——文本无需上传云端即可完成识别。
- WebGPU 加速——支持浏览器 GPU 本地推理。
- 开源可部署——支持自行部署内部脱敏页面。
使用场景
Privacy Filter 更适合需要频繁向外部系统共享文本、截图或日志的人群。它的价值在于降低“无意泄露敏感信息”的概率。
| 人群/角色 | 场景描述 | 推荐指数 |
|---|---|---|
| 开发者 | 提交 Bug 日志与 GitHub Issue 前脱敏 | ★★★★★ |
| 运维人员 | 清理服务器日志中的 Token 与账号信息 | ★★★★★ |
| AI 高频用户 | 向 ChatGPT 或 Claude 提交资料前检查隐私 | ★★★★★ |
| 客服人员 | 处理聊天记录与订单截图脱敏 | ★★★★☆ |
| 行政与运营 | 清理表格、反馈与联系方式信息 | ★★★★☆ |
| 企业安全团队 | 替代完整 DLP 系统 | ★★☆☆☆ |
操作指南
Privacy Filter 基本不需要学习成本,首次打开网页后等待模型加载完成即可直接使用。
- 打开 Privacy Filter 页面。
- 等待浏览器首次下载模型文件。
- 粘贴需要检查的文本内容。
- 或上传聊天截图、日志图片等文件。
- 系统自动识别 PII 敏感字段。
- 点击生成脱敏结果。
- 检查占位符替换是否合理。
- 再将处理后的内容发送给 AI、论坛或外部系统。
注意事项:
- (首次加载模型可能需要下载约 50MB 文件)
- (高敏感数据仍建议人工复核一次)
支持平台
Privacy Filter 主要基于浏览器运行,因此支持:
- macOS
- Windows
- Linux
- iPadOS
- Android 平板
- 主流现代浏览器
技术层面支持:
- WebGPU
- WebAssembly
- Transformers.js
- Tesseract.js OCR
同时可部署到:
- Cloudflare Pages
- Vercel
- 其他静态网页平台
产品定价
Privacy Filter 当前为免费开源工具。
普通用户无需注册即可直接使用基础脱敏功能。由于主要采用本地浏览器推理,因此不存在传统 SaaS 那种按调用次数收费的模式。
如果团队需要内部部署,则主要成本来自:
- 静态托管服务
- 浏览器兼容维护
- 模型文件缓存与更新管理
常见问题
Q1:Privacy Filter 会把我的文本上传到服务器吗?
主要识别过程发生在本地浏览器中。
首次打开时会下载模型文件,之后的文本与图片处理通常在本地完成,不需要把内容发送到云端进行推理。
Q2:它能完全替代企业级数据防泄漏系统吗?
不能。
Privacy Filter 更适合作为日常共享前的辅助检查工具,而不是完整的 DLP(数据防泄漏)解决方案。
Q3:为什么有时会漏掉部分敏感字段?
因为它依赖模型识别与上下文判断。
面对非标准格式、自定义密钥、口语化表达或复杂多语言混排时,依然可能出现误报或漏报,因此高敏感内容仍建议人工复查。
开发者小结
Privacy Filter 的定位其实非常明确:它不是完整的数据安全平台,而是“内容发出去之前的最后一道本地检查步骤”。对于经常把日志、截图、客户反馈或内部资料发给 AI 工具、论坛和第三方平台的人来说,它最大的价值是降低了手滑泄露敏感信息的概率。
相比传统查找替换,它更适合处理大量杂乱文本,尤其是服务器日志、报错信息和截图内容。通过上下文识别,它能够保留文本结构,同时隐藏真正敏感的数据字段,这比单纯手动删减效率更高。
不过它的边界也很明确。它依然只是模型识别工具,不可能做到百分百准确。面对生产环境密码、财务数据、核心合同等高敏感内容,自动脱敏不能替代人工审核,更不能替代企业级 DLP 与权限体系。对于普通开发者、AI 用户和跨团队协作场景来说,它更适合作为一种低门槛的隐私保护习惯。
