728x90
반응형
(개념) OpenAI가 공개한 ‘안전성(또는 정책) 분류용’ 오픈-웨이트(reasoning) 모델 세트
- 개발자가 직접 제공한 정책(policy) 을 모델이 추론(체인-오브-토트 포함)으로 해석해 메시지/완성/대화를 분류하도록 설계되어 있고, 정책을 바꿔서 내 재량의 기준으로 분류를 수행 가능


주요 모델/사양
gpt-oss-safeguard-120b — 고추론·프로덕션용 (약 117B 파라미터, 활성 파라미터 수 표시 포함). 단일 80GB급 GPU(예: NVIDIA H100, AMD MI300X)에서 운용 가능하도록 설계.
gpt-oss-safeguard-20b — 저지연·로컬/경량용(약 21B). 16GB급 VRAM 환경에서 돌려볼 수 있다는 안내가 있습니다.
라이선스: Apache-2.0(오픈소스). 모델·가이드·예시 정책 등이 GitHub/Hugging Face에 공개되어 있습니다.


728x90
'07.AI' 카테고리의 다른 글
| 컨텍스트 엔지니어링 - [2510.26493] Context Engineering 2.0 (0) | 2025.11.05 |
|---|---|
| 인공지능 뉴로모픽 반도체 기술 동향 (0) | 2025.11.04 |
| 인공지능 - 인공지능 에이전트 (Agent) (15) | 2025.11.02 |
| 생성형 AI - 월드 모델 (World Model) - 공동 임베딩 예측 아키텍처(JEPA) (0) | 2025.10.28 |
| 인공지능 - 안전성 - AI Alignment(인공지능 정렬) (0) | 2025.10.26 |


