• OpenAI công bố Privacy Filter, một mô hình nguồn mở giúp phát hiện và xóa thông tin nhận dạng cá nhân (PII) trước khi dữ liệu được gửi lên cloud, giảm nguy cơ rò rỉ dữ liệu trong AI.
  • Mô hình có 1,5 tỷ tham số nhưng chỉ kích hoạt 50 triệu mỗi lần xử lý, giúp tối ưu hiệu suất và chạy được trên laptop hoặc trình duyệt web.
  • Sử dụng kiến trúc Sparse Mixture-of-Experts và cửa sổ ngữ cảnh 128.000 token, cho phép xử lý tài liệu dài như hợp đồng pháp lý mà không bị mất ngữ cảnh.
  • Áp dụng bộ giải mã Viterbi với nhãn BIOES để đảm bảo việc xóa dữ liệu vẫn giữ cấu trúc ngữ nghĩa chính xác.
  • Hỗ trợ nhận diện 8 loại PII gồm tên cá nhân, thông tin liên hệ, định danh số, và cả secrets như API key hoặc mật khẩu.
  • Cho phép doanh nghiệp xử lý dữ liệu ngay tại chỗ (on-device), đáp ứng tiêu chuẩn GDPR và HIPAA.
  • Phát hành dưới giấy phép Apache 2.0, cho phép sử dụng thương mại, tùy chỉnh và không yêu cầu mở mã nguồn sản phẩm.
  • Cộng đồng đánh giá cao mô hình “nhỏ nhưng mạnh”, phù hợp cho pipeline AI thực tế với chi phí thấp.

📌 Privacy Filter đánh dấu bước tiến lớn khi OpenAI quay lại nguồn mở với mô hình 1,5 tỷ tham số nhưng tối ưu chỉ dùng 50 triệu mỗi lần chạy, hỗ trợ xử lý 128.000 token và 8 loại dữ liệu nhạy cảm. Công cụ giúp doanh nghiệp tuân thủ GDPR, HIPAA và giảm rủi ro rò rỉ dữ liệu ngay từ đầu pipeline. Tuy nhiên, OpenAI cảnh báo đây chỉ là công cụ hỗ trợ, không đảm bảo tuyệt đối, đặc biệt trong các lĩnh vực nhạy cảm như y tế hoặc pháp lý.

Tổng hợp.

Share.
CÔNG TY CỔ PHẦN TƯ VẤN VÀ ĐO LƯỜNG VIỆT NAM
Liên hệ:

Địa chỉ: Số 34 Ngõ 91 Đường Trần Duy Hưng, Phường Yên Hòa, Thành phố Hà Nội, Việt Nam

© 2026 Vietmetric
Exit mobile version