728x90
반응형
(개념) OpenAI가 STEM(Science/과학, Technology/기술, Engineering/공학, Math/수학) 영역에 특화된 공개 소형 추론 모델
- 이전 모델인 o1-mini보다 응답 속도가 24%가량 빨라지고
- 첫 번째 토큰 출력 속도도 2,500ms 향상되어 더욱 빠른 AI 경험을 제공
- 함수 호출, 구조화된 출력, 개발자 메시지 등의 기능을 지원
(특징)
- STEM(수학, 과학, 코딩) 특화 성능
- 빠른 응답 속도 (o1-mini 대비 24% 향상)
- 저렴한 비용 & 낮은 지연 시간
- 함수 호출, 구조화된 출력, 개발자 메시지 지원
- 세 가지 추론 모드 (Low/Medium/High) 지원
(벤치마크 결과)
수학(AIME 2024, FrontierMath), 과학(GPQA Diamond), 공학(Codeforces, SWE-bench, LiveBench Coding)을 비롯한 일반 지식(MMLU, MGSM, SimpleQA) 등
Competition Math (AIME 2024)

PhD-level Science Questions (GPQA Diamond)

FrontierMath

Competition Code (Codeforces)

Software Engineering (SWE-bench Verified)

LiveBench Coding

General knowledge

Human Preference Evaluation


Disallowed content evaluations

Jailbreak Evaluations

728x90
'07.AI' 카테고리의 다른 글
기초 모델 (FM, Foundation Model) - 사후 학습(Post-training) - 지도학습 기반 미세 조정(SFT, Supervised Fine-tuning) (0) | 2025.02.08 |
---|---|
기초 모델 (FM, Foundation Model) - 사후 학습(Post-training) - 강화학습(RL, Reinforcement Learning) (0) | 2025.02.08 |
SW 테스트 - 정적 테스트 - 코드 리뷰 (Review) - AI Code Reviewer (0) | 2025.01.31 |
LLM - SLM(Small Language Model) (1) | 2025.01.31 |
인공지능 - 인공지능 에이전트 (Agent) - AI 에이전트 시대, AI 활용 패러다임 변화 (0) | 2025.01.21 |