728x90
반응형

https://arxiv.org/pdf/2604.22750

이 연구는 에이전트 기반 코딩 작업에서 발생하는 토큰 소비 패턴을 최초로 체계적으로 분석하여 AI 에이전트 운영의 경제성을 조명합니다. 연구진은 에이전트가 일반적인 채팅이나 추론 작업보다 천 배 이상의 토큰을 사용하며, 특히 이미 처리된 맥락을 반복해서 읽어 들이는 입력 토큰이 전체 비용의 핵심 동인이라는 사실을 밝혀냈습니다. 실험 결과에 따르면 동일한 과제 내에서도 에이전트의 토큰 사용량은 매우 가변적이고 확률적이며, 비용을 더 많이 들인다고 해서 반드시 정확도가 높아지는 것이 아니라 오히려 특정 지점 이후에는 불필요한 반복과 탐색으로 인해 효율이 저하되는 양상이 나타났습니다. 또한, 현재의 최첨단 모델들은 작업 수행 전에 자신의 토큰 비용을 예측하는 데 어려움을 겪고 있으며 실제 소비량을 체계적으로 저평가하는 경향이 있음이 확인되었습니다. 결과적으로 이 논문은 에이전트 시스템의 비용 투명성과 지속 가능한 가격 모델을 구축하기 위해 더 정교한 동작 제어와 예측 능력이 필요함을 강조합니다.

 

728x90
Posted by Mr. Slumber
,