1. 개인정보보호위원회, 비정형데이터 가명처리 기준 발표
구분 | 설명 |
개요 | - 개인정보위, 「가명정보 처리 가이드라인」 개정하여 새로운 기준 제시- 의료·교통·챗봇 등 분야별 7종 시나리오 통해 가명정보 활용 전 과정 상세 안내- 인공지능 개발·활용 시 기업·연구자의 안전한 데이터 활용 확대 기대 |
배경 | - (비정형데이터 수요 확대) 인공지능 기술 등의 발달로 전세계 활용 데이터 중 이미지, 영상, 음성, 텍스트 등 비정형데이터가 최대 90%를 차지(IDC, '23)- (기존 가명정보 처리 가이드라인 한계) 기존 가이드라인은 정형데이터에 대한 처리 기준만 제시하여비정형데이터에 대해서는 적합한 가명처리 방법이나 수준 파악의 어려움 존재 |
기대효과 | - 비정형데이터 가명처리 및 활용 과정의 개인정보 식별 위험 사전 통제 가능- 의료(MRI, CT, X-ray 등), CCTV 영상, 음성 대화/상담 등 각 분야의 다양한 사례 및 시나리오 제공 통해 현장 적용 용이 |
- 비정형데이터는
① 데이터 유형별로 판단 기준이 달라질 수 있고 데이터 내에 존재하는 개인정보를 완벽하게
② 처리/탐지할 수 있는 기술이 아직 부재하며, AI 및 데이터 복원 기술의 발달로
③ 개인 재식별 공격 위험성이 증가한다는 특징을가지고 있어 이를 고려한 가명처리 방안 적용 필요
2. 비정형데이터 가명처리 기본 원칙(주요내용)
구분 | 설명 |
데이터 처리 목적에 따른안전성 확보 | - 데이터 처리목적 및 환경, 민감도 등을 종합적으로 고려하여 개인식별 위험성이 있는 정보를 판단하고, 합리적인 처리 방법/수준 설정- 연구목적 외 정보에 대한 가명처리 수준 높이거나 접근권한 통제, 식별에 악용될수 있는 SW 반입 제한, 보안서약서 징구 등 |
가명처리 기술의 한계 보완 | - 가명처리 기술 적용에 따른 적절성/신뢰성 근거를 작성, 보관하고 자체 검수 진행 - 외부전문가 통한 가명처리 적정성 검토- 가명정보 활용 기관의 내부 통제 강화- 처리 목적 달성 시 가명정보 신속히 파기 |
데이터 복원 및 재결합 방지 | - 원본 복원에 활용될 수 있는 추가정보 분리 보관- 가명처리된 비정형데이터 활용 시 복원 관련 SW 접근 및 사용 제한- 인공지능 서비스 제공 과정에서도 개인식별 위험 모니터링 |
- 비정형데이터는 유형, 활용 분야마다 가명처리 기준 및 방법이 다양하여 수많은 유즈케이스 축적이 중요- 이후, 개보위는 생성형AI와 관련한 '공개된 개인정보 처리 가이드라인' 등 다양한 기준을 순차 발표 예정
3. 비정형데이터 가명처리 단계별 고려사항
구분 | 설명 |
1. 사전준비 단계 | - 비정형데이터 내 개인식별 가능성 항목을 도출하고, 목적 달성에 필요한 항목의 종류의범위를 명확히 하여 가명처리 대상 선정 |
2. 위험성 검토 단계 | - 비정형데이터의 특성을 고려하여 '데이터 자체 식별 위험성'과 '처리 환경의 식별 위험성'을 종합적으로 검토하여 가명처리 방법/수준을 결정 |
3. 가명처리 단계 | - 가명처리 기술 적용 시, 해당 기술의 적절성/신뢰성 평가하고 관련 근거 작성하여 보관및 자체 검수 |
4. 적정성 검토 단계 | - 외부전문가를 포함한 적정성 평가 위원회 등을 구성하여 처리 목적의 적합성, 위험성 검토 결과의 적정성, 가명처리 결과의 적정성, 목적 달성 가능성 등을 검토 |
5. 안전한 관리 단계 | - 가명정보 활용 과정에서 재식별 가능성 등을 모니터링 및 관리 |
- 「가명정보 처리 가이드라인」의 단계별 절차를 동일하게 따르되, 비정형데이터의 특수성을 반영한 개인식별 위험성 검토 및 안전조치 사항을 추가적으로 고려하여 시행할 것을 권고
4. 비정형데이터 가명처리 기술 예시
- 개보위는 상기 기술에 대하여 단순 참고일 뿐, 데이터 활용 분야 및 상황 등에 맞게 자유롭게 다양한 기술을 적용할 수 있음을 밝힘
https://cafe.naver.com/bigupitpe/38635
https://www.etnews.com/20240202000127
https://zdnet.co.kr/view/?no=20240204130616
https://www.pipc.go.kr/np/cop/bbs/selectBoardArticle.do?bbsId=BS217&mCode=D010030000&nttId=9900
'12. 메일진' 카테고리의 다른 글
Hugging Face, OpenAI의 커스텀 GPTs에 대항하는 오픈 소스 AI 어시스턴트 메이커 출시 (0) | 2024.02.07 |
---|---|
▲[2024/01/29 ~ 02/04] 이번 주의 주요 ML 논문 (Top ML Papers of the Week) (0) | 2024.02.06 |
ITFIND 메일진 제1154호 산업분야별 정보메일 (발행 : 2024-02-02 ) (0) | 2024.02.05 |
▲Apple이 iCloud에 수십억 개의 데이터베이스를 저장할 수 있게 구축한 방법 (0) | 2024.02.05 |
[2024/01/22 ~ 01/28] 이번 주의 주요 ML 논문 (Top ML Papers of the Week) (0) | 2024.01.30 |