728x90
반응형
https://arxiv.org/pdf/2605.01158
현대 언어 모델 개발은 사전 학습 단계를 훨씬 넘어 확장되고 있지만, 환경 영향 보고는 여전히 단일 최종 모델 학습 비용에만 국한되어 있습니다. 본 연구에서는 명령 추종형과 추론형 두 가지 변형으로 구성된 70억 및 320억 파라미터 모델 제품군인 Olmo 3에 대해 사전 학습부터 지도 미세 조정, 선호도 최적화, 강화 학습에 이르는 전체 모델 개발 파이프라인의 환경 영향을 최초로 상세하게 분석합니다. 분석 결과, 추론형 모델은 강화 학습 배포로 인해 데이터센터 에너지 소비 측면에서 명령 추종형 모델보다 사후 학습 비용이 17배 더 높은 것으로 나타났습니다. 개발 비용(실험, 실패한 실행, 제거 포함)은 전체 컴퓨팅 비용의 82.2%를 차지하며, 이는 이전 연구에서 보고된 사전 학습 중심 파이프라인의 약 50%보다 약 65% 증가한 수치입니다. 총체적으로, 모델 개발 과정에서 약 12.3GWh의 데이터센터 에너지가 소비되었고, 4,251톤의 이산화탄소 상당량이 배출되었으며, 15,887kL의 물이 소비된 것으로 추산됩니다. 여기서 물 소비는 데이터센터 냉각이 아닌 전력 생산 시설에서 발생한 것입니다. 모델 개발자들이 거의 보고하지 않는 이러한 비용은 학습 후 파이프라인이 더욱 복잡해짐에 따라 빠르게 증가하고 있으며, 환경 보고 기준 및 AI의 환경 영향 감소를 위해 노력하는 연구 커뮤니티에서 반드시 고려해야 할 사항입니다.
















728x90
'07.AI' 카테고리의 다른 글
| LLM - Gemma 4 to DeepSeek V4 - 내부 구조 및 아키텍처 설계 (0) | 2026.05.17 |
|---|---|
| LLM - Ethernet - OpenAI, MRC(Multipath Reliable Connection) (0) | 2026.05.16 |
| 생성형 AI - 상호작용 모델(Interaction Models) (0) | 2026.05.16 |
| LLM - 성능 - OpenAI, 고블린 데이터 오염 (0) | 2026.05.12 |
| LLM - 성능 - 벤치마크 - Perplexity AI, Opik 멀티모달 대형 언어 모델(MLLM) 개발자 가이드 (0) | 2026.05.12 |


