728x90
반응형
복잡한 다차원 상황에서 멀티 에이전트들이 나눠서 협업과 경쟁을 통해 강화학습 수행하는 알고리즘
주어진 환경에서 높은 보상을 얻을 수 있는 행동이나 전략을 구상하라는 간단한 목적만 부여받은 여러 개의 AI(에이전트)들이 협업과 경쟁을 통해 학습할 수 있도록 한 알고리즘
[한계 개선]
지금까지 나온 AI들은 스타크래프트처럼 자원 수집, 건설, 전투유닛 생산과 제어는 물론 상대방의 정보를 토대로 전략을 끊임없이 수정하는 등의 복잡한 사항들을 실시간으로 수행하는 데는 한계
[활용]
“AI가 실제로 활용될 것으로 예상되는 개인 비서, 자율주행차, 로봇 등 분야에서는 스타크래프트에서처럼 불완전한 정보로 최적의 답을 찾거나 실시간 결정을 해야 하는 상황에 맞닥뜨리게 된다”며 “이번 연구에서 보여 준 알파스타의 성공은 특정 분야가 아니라 모든 분야에서 활용할 수 있는 범용 AI 알고리즘이 실제 문제에서도 적용될 수 있다는 것을 보여 준다”
https://news.v.daum.net/v/20191031050804468
728x90
'07.AI' 카테고리의 다른 글
유사도(Similarity) 계산 방식 (0) | 2020.07.27 |
---|---|
딥러닝 - RNN (순환신경망, Recurrent Neural Network) (0) | 2020.07.16 |
딥러닝 - DNN (Deep Neural Network) (0) | 2020.07.13 |
표준 - DIN SPEC 92001:2019 (0) | 2020.07.13 |
표준 (0) | 2020.07.13 |