728x90
반응형
AI Agents in Action: Foundations for Evaluation and Governance
(AI 에이전트의 실제 활용: 평가 및 거버넌스의 기초)
목차
Foreword 4
Executive summary 5
Introduction 6
1 Evolving technical foundations of AI agents 8
1.1 The software architecture of an AI agent 8
1.2 Communication protocols and interoperability 10
1.3 Cybersecurity considerations 12
2 Foundations for AI agent evaluation and governance 13
2.1 Classification 14
2.2 Evaluation 19
2.3 Risk assessment 22
2.4 Governance considerations for AI agents: a progressive approach 25
3 Looking ahead: multi-agent ecosystems 29
Conclusion 30
Contributors 31
Endnotes 34

728x90
'12. 메일진 > 5. AI 벤치마크' 카테고리의 다른 글
| 성과측정 - AI 검증 및 평가 - AI 에이전트 SWE-CI, EvoScore (0) | 2026.03.28 |
|---|---|
| 성과측정 - AI 검증 및 평가 - AI 에이전트 스킬 평가 및 테스트 실무 가이드 (0) | 2026.03.28 |
| 성과측정 - AI 검증 및 평가 - AI 에이전트 SWE-rebench (0) | 2026.03.08 |
| LLM - 성능 - 벤치마크 - 데이터셋 가이드 (0) | 2026.02.20 |
| LLM - 성능 - 벤치마크 - 데이터 누수(Data Leakage) (0) | 2026.02.18 |


