728x90
반응형

(개념) OpenAI가  STEM(Science/과학, Technology/기술, Engineering/공학, Math/수학) 영역에 특화된  공개 소형 추론 모델

- 이전 모델인 o1-mini보다 응답 속도가 24%가량 빨라지고

- 첫 번째 토큰 출력 속도도 2,500ms 향상되어 더욱 빠른 AI 경험을 제공

- 함수 호출, 구조화된 출력, 개발자 메시지 등의 기능을 지원

 

(특징)

  • STEM(수학, 과학, 코딩) 특화 성능
  • 빠른 응답 속도 (o1-mini 대비 24% 향상)
  • 저렴한 비용 & 낮은 지연 시간
  • 함수 호출, 구조화된 출력, 개발자 메시지 지원
  • 세 가지 추론 모드 (Low/Medium/High) 지원

(벤치마크 결과)

수학(AIME 2024, FrontierMath), 과학(GPQA Diamond), 공학(Codeforces, SWE-bench, LiveBench Coding)을 비롯한 일반 지식(MMLU, MGSM, SimpleQA) 등

 

Competition Math (AIME 2024)

 

 

PhD-level Science Questions (GPQA Diamond)

 

FrontierMath

 

 

 

Competition Code (Codeforces)

 

 

Software Engineering (SWE-bench Verified)

 

LiveBench Coding

 

 

General knowledge

 

 

Human Preference Evaluation

 

 

Disallowed content evaluations

Jailbreak Evaluations

 

 

https://openai.com/index/openai-o3-mini/

728x90
Posted by Mr. Slumber
,