728x90
반응형
AI 시스템의 잠재적인 취약점, 유해하거나 편향된 결과, 보안 문제 등을 식별하기 위해 의도적으로 다양한 공격을 시도하고 시스템의 한계를 시험하는 탐색적·공격적 테스팅 방법. 실제 발생 가능한 위협을 사전에 발견하고 방어 체계를 강화하는 것을 목표로 한다.
국제표준인 ISO/IEC 42119-7 (Red teaming): AI 레드팀 테스팅에 대한 용어, 절차, 방법들을 정의한 AI 레드팀에 대한 최초의 국제 공통 표준. 2025년 4월 표준 개발을 시작하였고, 2027년 12월 제정을 목표로 개발 중
728x90
'13.일상다반사' 카테고리의 다른 글
[용어] 교차 일반화(cross-model generalizability) 현상 (0) | 2025.08.23 |
---|---|
[용어] 신뢰성 사실 라벨 (Trustworthiness Fact Labels, TFL), ISO/IEC 42117 (0) | 2025.08.22 |
[용어] Chain-of-Layers(CoLa) 기법 (2) | 2025.08.16 |
[용어] 오메가 규칙(Ω-rule) (0) | 2025.08.13 |
[용어] 프롬 스크래치(from scratch) (3) | 2025.08.13 |