728x90
반응형
(개념) LLM이 추론과 행동을 번갈아 수행하면서 외부 도구를 쓰는 에이전트 패턴
- 2023년 Google 연구진이 제안한 프롬프트 기반 에이전트 설계 방식
기존 프롬프트 기법과의 차이
| 방식 | 특징 | 한계 |
| Chain-of-Thought | 추론 과정만 생성 | 행동 불가 |
| Toolformer | 도구 호출 학습 | 동적 계획 부족 |
| ReAct | 추론 + 행동 결합 | 반복 루프 관리 필요 |
즉 ReAct는 “생각만 하는 LLM” → “행동하는 LLM”으로의 전환점이다.
728x90
'13.일상다반사' 카테고리의 다른 글
| 바닥부터 구현하는 LLM 추론 모델 학습 가이드 - Preview (0) | 2026.02.25 |
|---|---|
| [용어] ai;dr (0) | 2026.02.22 |
| [용어] 골드 플레이팅(gold plating) (0) | 2026.02.20 |
| CS146S: The Modern Software Developer Korean Edition • 한국어판 (0) | 2026.01.27 |
| [용어] 보일러플레이트(boilerplate) (0) | 2026.01.17 |


