728x90
반응형
(개념) 분산된 환경에서 사용자의 데이터를 중앙 서버에서 학습하지 않고 개인의 휴대폰에서 모델을 학습하고, 학습된 결과를 중앙 서버에서 취합 후 개선된 공통 모델을 생성하는 기술 (분산환경 내 모델 학습 가능)

-  분산 시스템에서 사용되는 머신러닝 방법으로 여러 기기가 클라이언트에서 데이터를 수집하고 로컬에서 모델을 학습시킨 후 중앙 서버로 업로드하여 전체적인 모델을 개선하는 방법

 

 

(배경)  AI 모델 학습시 데이터를 통합·이동하면서 발생할 수 있는 개인정보보호 이슈의 부담을 완화할 수 있는 연합학습 개념이 부상
 
- 데이터 공유 및 활용이 증가함에 따라, 민감한 정보에서의 개인정보보호 이슈로 인한 데이터 활용의 제약이 생길 수 있으며 이러한 제약은 AI 성능 향상의 한계를 초래
 
- 연합학습은 데이터를 중앙에 모아서 학습하는 기존의 통합학습과 달리 각 기관(기기)에서 학 습한 모델의 가중치만 취합하는 방식
 
 
(특징)  데이터 프라이버시 향상커뮤니케이션 효율성
 
(학습방식)
- 중앙 집중형 연합 학습 (Centralized Federated Learning)
- 분산형 연합 학습 (Decentralized Federated Learning)
- 이종 연합 학습 (Heterogeneous Federated Learning)
 
(기술)  고성능 중앙 서버 대신에 성능이 부족하지만 여러 대의 컴퓨팅 자원을 활용해서 알고리즘을 학습한 뒤, 각각의 컴퓨팅 자원에서 학습된 결과를 통합하여 최종 학습 모델을 만드는 방법
 
▶(연합학습의 의의) 데이터 유출에 대한 우려 없이 협업 기계학습을 가능하게 함
▶(시사점) 최근 연합학습 연구의 폭발적 증가와 전 세계적인 인기에도 불구하고, 한국의 상황은 그렇지 않음. 올해 초 데이터 3법 개정에 힘입어 연합학습의 기틀이 마련된 만큼 한국의 학계와 산업계 모두에게 융복합적인 연구와 기술사업화 노력이 요구됨
 

 

(활용)
 
데이터 공유가 어려운 기관 간(Cross-Silo) 또는 디바이스(Cross-Device) 간 데이터 공유 없이 모델의 성능을 향상하기 위해 주로 활용되고 있음
 
- (Cross-Silo) 지리적으로 원거리에 있는 기관(데이터 센터) 간 데이터의 공유 없이 연합학습을 하는 방법이며, 2-100개 수준 등의 기관이 참여 가능
 
- (Cross-device) 차량, 스마트폰 등 각종 디바이스를 보유하고 있는 개인·기관이 연합학습에 참여하는 개념이며, 복잡도가 높음
 
 
데이터의 공유가 어려운 도메인에서 실증이 활발히 진행되고 있으며, 일부는 모델 갱신 주기가 짧거나, 통신 효율성을 위해 활용
 
- (개인정보) 의료, 신약개발 등을 중심으로 개인정보가 다수 포함된 기관 간 연합학습을 통해 실증이 활발히 추진되고 있음
 
- (기업 민감정보) 기업의 경쟁력 확보를 위해 AI 모델은 필요하나, 대량의 데이터 확보가 어려운 경우 기업 간 협업을 통해 모델 구축 및 성능 개선
 
- (효율적인 모델개선 등) 데이터를 중앙 데이터센터로 이동해서 학습하는 것 보다 각 디바이스에서 학습하는 것이 비용·시간적으로 효과적인 경우 연합학습 활용
 
 
 
프라이버시 보존 머신러닝

 
(활용)  ○ 구글, Nvidia 등 세계적인 기업들이 적극적으로 기술 도입 중
- 구글의 G-Board는 사용자의 타이핑 패턴을 분석하고, 자동완성 기능 등을 학습할 때 개별 사 용자의 데이터 통합없이 분산 학습
- NVIDIA 클라라 플랫폼은 각 병원에서 보유하고 있는 헬스케어 데이터를 통합과정 없이 분산 환경에서 학습

(기대효과) 개인 정보 보호 문제와 학습에 많은 시간이 소요되는 단점을 해결할 수 있는 방법
의료전문가들은 임상 데이터를 직접 공유할 필요없이 공유 모델에 대해 협업할 수 있다.
 

 

 

https://www.nia.or.kr/site/nia_kor/ex/bbs/View.do?cbIdx=82618&bcIdx=25632&parentSeq=25632 

 

https://www.nia.or.kr/site/nia_kor/ex/bbs/View.do?bcIdx=25632&cbIdx=82618&parentSeq=25632

[THE AI REPORT 2023-6] 연합학습의 이해와 주요 응용사례 분석 2023.06.09 조회수 173 우상근 AI-미래전략센터 [THE AI REPORT 2023-6] 연합학습의 이해와 주요 응용사례 분석 ​ㅁ 목 차   1. 연합학습 도입 배경

www.nia.or.kr

[AI_REPORT_2023-6]_연합학습의_이해와_주요_응용사례_분석.pdf
7.94MB

728x90
Posted by Mr. Slumber
,