728x90
반응형










728x90
'12. 메일진 > 5. AI 벤치마크' 카테고리의 다른 글
| 성과측정 - AI 검증 및 평가 - AI 에이전트의 실제 활용 : 평가 및 거버넌스 (0) | 2026.03.28 |
|---|---|
| 성과측정 - AI 검증 및 평가 - AI 에이전트 SWE-rebench (0) | 2026.03.08 |
| LLM - 성능 - 벤치마크 - 데이터 누수(Data Leakage) (0) | 2026.02.18 |
| LLM - 성능 - 벤치마크 - 벤치마크 데이터셋 현황 분석 및 정부 주도의 벤치마크 마련 필요성 (0) | 2026.02.14 |
| LLM - 성능 - 벤치마크 - Extended NYT Connections (0) | 2025.12.12 |


