• OpenAI 发布了 Privacy Filter,这是一个开源模型,旨在数据上传到云端之前检测并删除个人身份信息 (PII),从而降低 AI 中的数据泄露风险。
  • 该模型拥有 15 亿个参数,但每次处理仅激活 5000 万个,从而优化了性能,使其能够在笔记本电脑或网页浏览器上运行。
  • 它采用稀疏专家混合架构 (Sparse MoE) 和 12.8 万个 Token 的上下文窗口,能够处理法律合同等长文档而不丢失上下文。
  • 应用带有 BIOES 标签的 Viterbi 解码器,以确保在删除数据时仍保持准确的语义结构。
  • 支持识别 8 类 PII,包括个人姓名、联系信息、数字标识符,以及 API 密钥或密码等机密信息。
  • 允许企业在本地(设备端)处理数据,满足 GDPR 和 HIPAA 合规标准。
  • 该模型基于 Apache 2.0 许可证发布,允许商业使用、定制,且不要求开源产品源代码。
  • 社区高度评价这一“小而强大”的模型,认为其非常适合低成本的实际 AI 流水线。

📌 Privacy Filter 标志着 OpenAI 重返开源领域的一大步,该模型虽然有 15 亿参数,但优化到每次运行仅需 5000 万参数,支持 12.8 万 Token 处理和 8 种敏感数据类型。该工具可帮助企业遵守 GDPR、HIPAA,并从流水线源头降低泄露风险。然而,OpenAI 提醒这仅是一个辅助工具,不能保证绝对安全,特别是在医疗或法律等敏感领域。

Share.
VIET NAM CONSULTING AND MEASUREMENT JOINT STOCK COMPANY
联系方式

电子邮件: info@vietmetric.vn
地址:河内市安和坊陈维兴街91巷34号

© 2026 Vietmetric
Exit mobile version