07.AI
LLM - Open AI, OpenAI o3 mini
Mr. Slumber
2025. 2. 8. 15:11
728x90
반응형
(개념) OpenAI가 STEM(Science/과학, Technology/기술, Engineering/공학, Math/수학) 영역에 특화된 공개 소형 추론 모델
- 이전 모델인 o1-mini보다 응답 속도가 24%가량 빨라지고
- 첫 번째 토큰 출력 속도도 2,500ms 향상되어 더욱 빠른 AI 경험을 제공
- 함수 호출, 구조화된 출력, 개발자 메시지 등의 기능을 지원
(특징)
- STEM(수학, 과학, 코딩) 특화 성능
- 빠른 응답 속도 (o1-mini 대비 24% 향상)
- 저렴한 비용 & 낮은 지연 시간
- 함수 호출, 구조화된 출력, 개발자 메시지 지원
- 세 가지 추론 모드 (Low/Medium/High) 지원
(벤치마크 결과)
수학(AIME 2024, FrontierMath), 과학(GPQA Diamond), 공학(Codeforces, SWE-bench, LiveBench Coding)을 비롯한 일반 지식(MMLU, MGSM, SimpleQA) 등
Competition Math (AIME 2024)

PhD-level Science Questions (GPQA Diamond)

FrontierMath

Competition Code (Codeforces)

Software Engineering (SWE-bench Verified)

LiveBench Coding

General knowledge

Human Preference Evaluation


Disallowed content evaluations

Jailbreak Evaluations

728x90