• OpenAI는 데이터가 클라우드로 전송되기 전에 개인 식별 정보(PII)를 감지하고 삭제하여 AI의 데이터 유출 위험을 줄이는 오픈 소스 모델인 Privacy Filter를 발표했다.
  • 이 모델은 15억 개의 매개변수를 가지고 있지만 처리 시마다 5,000만 개만 활성화하여 성능을 최적화하고 노트북이나 웹 브라우저에서도 실행 가능하다.
  • Sparse Mixture-of-Experts 아키텍처와 128,000 토큰의 컨텍스트 창을 사용하여 법적 계약서와 같은 긴 문서를 문맥 손실 없이 처리할 수 있다.
  • 데이터 삭제 후에도 정확한 의미 구조를 유지하기 위해 BIOES 태깅이 적용된 비터비(Viterbi) 디코더를 사용한다.
  • 개인 이름, 연락처, 수치 식별자, API 키나 비밀번호와 같은 비밀 정보를 포함한 8가지 유형의 PII 식별을 지원한다.
  • 기업이 데이터를 기기 내부(On-device)에서 처리할 수 있게 하여 GDPR 및 HIPAA 준수 표준을 충족한다.
  • Apache 2.0 라이선스로 배포되어 상업적 이용 및 맞춤 설정이 가능하며, 제품의 소스 코드를 공개할 필요가 없다.
  • 커뮤니티는 저비용으로 실제 AI 파이프라인에 적합한 ‘작지만 강력한’ 모델이라고 높게 평가하고 있다.

📌 Privacy Filter는 OpenAI가 오픈 소스로 복귀하는 중요한 발걸음으로, 15억 개의 매개변수 모델이지만 실행 시 5,000만 개로 최적화되었으며, 128,000 토큰과 8가지 민감 데이터 유형을 지원한다. 이 도구는 기업이 GDPR, HIPAA를 준수하고 파이프라인 초기 단계부터 유출 위험을 줄이는 데 도움을 준다. 다만, OpenAI는 이것이 보조 도구일 뿐이며 특히 의료나 법률과 같은 민감한 분야에서 절대적인 보장을 하지는 않는다고 경고했다.

Share.
VIET NAM CONSULTING AND MEASUREMENT JOINT STOCK COMPANY
연락처

이메일: info@vietmetric.vn
주소: 베트남 하노이시 옌호아 동 쩐주이흥 거리 91번 골목 34번

© 2026 Vietmetric
Exit mobile version