728x90
반응형

https://arxiv.org/abs/2511.20686

https://huggingface.co/datasets/TTA01/AssurAI

 

(개념) 한국정보통신기술협회(TTA)이 KAIST 등과 함께 발표한 멀티모달 생성형 AI 위험 평가용 데이터셋

- 과기정통부가 추진한 ‘생성형 AI 안전성 평가기반 마련’ 사업의 주요 성과

생성형 AI의 안전성을 진단하기 위해 개발된 한국어 멀티모달 데이터셋인 AssurAI의 구축 과정과 그 의의를 학술적으로 설명하고 있습니다. 연구진은 기존 데이터셋이 영어권에 편향되어 한국 특유의 사회문화적 맥락을 반영하지 못한다는 점에 주목하여, 전문가 집단과 함께 35가지의 핵심 위험 요소를 정의하고 텍스트를 포함한 이미지, 오디오, 비디오 등 11,480개의 방대한 데이터를 확보하였습니다. 특히 데이터의 신뢰성을 높이기 위해 전문가의 초기 설계와 크라우드소싱을 결합한 2단계 구축 전략 및 엄격한 품질 관리 프로세스를 도입한 것이 특징입니다. 결과적으로 이 프로젝트는 한국 사회에 최적화된 안전성 평가 기준을 제시함으로써, 더욱 책임감 있고 신뢰할 수 있는 AI 시스템 개발을 지원하는 것을 목적으로 합니다.

 

728x90
Posted by Mr. Slumber
,