728x90
반응형

복잡한 다차원 상황에서 멀티 에이전트들이 나눠서 협업과 경쟁을 통해 강화학습 수행하는 알고리즘

 

주어진 환경에서 높은 보상을 얻을 수 있는 행동이나 전략을 구상하라는 간단한 목적만 부여받은 여러 개의 AI(에이전트)들이 협업과 경쟁을 통해 학습할 수 있도록 한 알고리즘

 

 

[한계 개선]

지금까지 나온 AI들은 스타크래프트처럼 자원 수집, 건설, 전투유닛 생산과 제어는 물론 상대방의 정보를 토대로 전략을 끊임없이 수정하는 등의 복잡한 사항들을 실시간으로 수행하는 데는 한계

 

[활용]

 “AI가 실제로 활용될 것으로 예상되는 개인 비서, 자율주행차, 로봇 등 분야에서는 스타크래프트에서처럼 불완전한 정보로 최적의 답을 찾거나 실시간 결정을 해야 하는 상황에 맞닥뜨리게 된다”며 “이번 연구에서 보여 준 알파스타의 성공은 특정 분야가 아니라 모든 분야에서 활용할 수 있는 범용 AI 알고리즘이 실제 문제에서도 적용될 수 있다는 것을 보여 준다”

 

https://news.v.daum.net/v/20191031050804468

 

이세돌 잡은 AI.. 최강 프로게이머도 제압하다

[서울신문]알파스타, AI끼리 대전하며 학습 훈련 상위 0.2% ‘그랜드마스터’급 실력 갖춰 테란으로 프로토스 상대 땐 승률 100% 예측불가 상황 대처… 범용AI 적용 기대2016년 3월 이세돌 9단과 맞붙

news.v.daum.net

 

728x90

'07.AI' 카테고리의 다른 글

유사도(Similarity) 계산 방식  (0) 2020.07.27
딥러닝 - RNN (순환신경망, Recurrent Neural Network)  (0) 2020.07.16
딥러닝 - DNN (Deep Neural Network)  (0) 2020.07.13
표준 - DIN SPEC 92001:2019  (0) 2020.07.13
표준  (0) 2020.07.13
Posted by Mr. Slumber
,