728x90
반응형
당신의 상대를 전혀 모르는 경우 상대방이 최선의 게임을한다고 가정하면 지불금을 극대화하는 미니 맥스 라고하는 매우 급진적 인 전략이 있습니다. A와 B 사이의 두 사람 유한 제로섬 순차 게임에서 (A는 유틸리티를 최대화하고 B는이를 최소화하려고 시도 함) 미니 맥 알고리즘 은 다음과 같은 재귀 공식으로 설명 될 수 있습니다.
상대방이 보상을 최소화하려고 할 때 최대의 보상을 받게됩니다 (최대화). 그러므로 이름 미니 맥스 . 이것은 거의 좋은 것 같습니다. 우리가 필요로 하는 것은 전체 게임 트리를 확장하고 우리의 재귀 수식에 의해 주어진 규칙과 관련하여 값을 역 전파하는 것입니다.

https://int8.io/monte-carlo-tree-search-beginners-guide/
Monte Carlo Tree Search - beginners guide
Monte Carlo Tree Search - the beginners guide with python code and references to monte carlo tree search application for Deepmind's AlphaGo
int8.io
728x90
'08.Algorithm' 카테고리의 다른 글
스택 (Stack) (0) | 2020.06.01 |
---|---|
알고리즘 평가 (1) | 2020.06.01 |
B-Tree (0) | 2020.06.01 |
문자열 검색 알고리즘 (0) | 2020.06.01 |
AVL 트리 (Adelson-Velskii and Landis tree) (0) | 2020.06.01 |