[용어] 오메가 규칙(Ω-rule)

13.일상다반사 2025. 8. 13. 15:51

728x90

(개념) 2025년 공개된 구글/제휴 연구팀의 ATLAS(“Learning to Optimally Memorize the Context at Test Time”)에서 제안된 순환 계열 모델의 메모리 업데이트 원리

- ATLAS의 메모리 업데이트 규칙

“잠깐만, 최근 'c'개의 토큰들(예를 들어 최근 50개)을 살펴보고
이것들을 모두 함께 활용해서 메모리 상태를 최적화하자"

- 토큰을 하나씩 보면서 급행(online, greedy)으로 상태를 갱신하던 기존 규칙을 버리고, 최근 'c' 개 토큰으로 이루어진 슬라이딩 윈도우 전체를 한 번에 고려하여 메모리를 최적화(optimization-based) 방식으로 갱신

논문을 보면, 이런 접근법이 특히 BABILong 같이 ‘아주 긴 문서에 흩어져 있는 사실을 바탕으로 언어 모델이 얼마나 장기 추론이나 정보 검색을 잘 하는지 평가하는 테스트’에서 실제로 좋은 성과를 보여주는데, 무려 1천만 토큰까지 이어지는 시퀀스에서 강력한 성능을 보여준다고 해요.

https://arxiv.org/html/2505.23735v1

728x90

저작자표시 (새창열림)

'13.일상다반사' 카테고리의 다른 글

에이전트 디자인 패턴(무료 책) (0)	2025.09.11
가스라이팅 드리븐 개발(Gaslight-Driven Development, GDD) (2)	2025.08.26
솔로 프리너(Solopreneur) (0)	2025.08.08
현시 비교 우위 지수(RCA), 대칭적 현시 비교우위 지수(RSCA)(Revealed Symmetric Comparative Advantage Index) (0)	2025.05.24
무역특화지수(TSI: Trade Specialization Index) (0)	2025.05.24