Char :: 생성형 AI - 추론 ‘inference’ 비용 - 모델 학습의 숨겨진 비용

생성형 AI - 추론 ‘inference’ 비용 - 모델 학습의 숨겨진 비용

12. 메일진/3.AI 비용 2026. 5. 21. 16:03

728x90

현대 언어 모델 개발은 사전 학습 단계를 훨씬 넘어 확장되고 있지만, 환경 영향 보고는 여전히 단일 최종 모델 학습 비용에만 국한되어 있습니다. 본 연구에서는 명령 추종형과 추론형 두 가지 변형으로 구성된 70억 및 320억 파라미터 모델 제품군인 Olmo 3에 대해 사전 학습부터 지도 미세 조정, 선호도 최적화, 강화 학습에 이르는 전체 모델 개발 파이프라인의 환경 영향을 최초로 상세하게 분석합니다. 분석 결과, 추론형 모델은 강화 학습 배포로 인해 데이터센터 에너지 소비 측면에서 명령 추종형 모델보다 사후 학습 비용이 17배 더 높은 것으로 나타났습니다. 개발 비용(실험, 실패한 실행, 제거 포함)은 전체 컴퓨팅 비용의 82.2%를 차지하며, 이는 이전 연구에서 보고된 사전 학습 중심 파이프라인의 약 50%보다 약 65% 증가한 수치입니다. 총체적으로, 모델 개발 과정에서 약 12.3GWh의 데이터센터 에너지가 소비되었고, 4,251톤의 이산화탄소 상당량이 배출되었으며, 15,887kL의 물이 소비된 것으로 추산됩니다. 여기서 물 소비는 데이터센터 냉각이 아닌 전력 생산 시설에서 발생한 것입니다. 모델 개발자들이 거의 보고하지 않는 이러한 비용은 학습 후 파이프라인이 더욱 복잡해짐에 따라 빠르게 증가하고 있으며, 환경 보고 기준 및 AI의 환경 영향 감소를 위해 노력하는 연구 커뮤니티에서 반드시 고려해야 할 사항입니다.

표 2: Olmo 3 7B 및 32B의 최종 학습 실행 비용 요약입니다. Think 및 Instruct 변형 모두에서 공유 기본 모델(Thinking SFT를 통한 사전 학습)이 사용됩니다. 32B Think 모델의 사후 학습에는 다음과 같은 비용이 소요됩니다.

728x90

저작자표시 (새창열림)

'12. 메일진 > 3.AI 비용' 카테고리의 다른 글

2026 - 모델 랩(Model Lab) - 앤트로픽(Anthropic)의 비공개 벨류에이션 및 구조적 패러다임 변화 (0)	2026.05.23
인공지능 - AI 반도체 - 글로벌 AI 칩 소유 현황 [프론티어 랩] (0)	2026.05.23
비즈니스 - 토큰 경제 - 토큰 이코노미 가이드 (0)	2026.05.18
비즈니스 - 토큰 경제 - AI 에이전트는 토큰을 어떻게 쓰고 있는가 (0)	2026.05.06
AI - 기술 스택 - 추론 서빙 SW (0)	2026.05.02

Posted by Mr. Slumber

Char

생성형 AI - 추론 ‘inference’ 비용 - 모델 학습의 숨겨진 비용

'12. 메일진 > 3.AI 비용' 카테고리의 다른 글

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

글 보관함

달력

링크

티스토리툴바