강화학습2 [소개] DeepMimic - 사람처럼 움직이도록 학습하기 최근, 연구실 친구와 같이 공부를 하고 있는데, 이 연구회는 강화학습, 그 중에서도 사람의 움직임을 학습하기 위함에 초점을 두고 있다. 이 친구의 목표는 간단한 추가 정보를 이용해서 사람의 움직임의 특징을 포착하는 network의 학습인데, 참고가 되는 논문들이 많다. 가장 최근에 간단한 방법을 통해 사람과 비슷한 행동을 뉴럴네트워크에 학습시킨 알고리즘이 있다. 그 이름은 DeepMimic. 홈페이지에 그 결과와 방법에 대해 자세히 적혀있다. 이를 토대로 간단히 요약해 본다. 주소: https://bair.berkeley.edu/blog/2018/04/10/virtual-stuntman/ 사람의 움직임을 익히도록 뉴럴 네트워크를 학습하는 방법은 예전부터 많이 있었다. 이 방법은 몸의 중심의 위치, 앞으로.. 2018. 10. 1. [인공지능] 강화학습 맛보기 강화학습은 환경(Environment) 속에서 정책(Policy)에 따른 행위(Action)를 통해 상태(State)를 변화 시키며, 그에 따른 보상(Reward)를 받아 정책(Policy)에 반영한다. 최종적으로는 가장 높은 보상을 얻을 수 있는 정책을 확정하는 것이 목표이다. 간단하지만 생명체가 행위를 결정하는 본질이 잘 담겨있다. 불확실한 환경 속에서 행위를 통한 보상으로 정책을 수정해나가는 것은 시행착오로부터 배우는 생명체의 특징이다. (물론 생명체에겐, 통찰과 응용과 같이 다양한 스킬이 있다) 강화학습은 예전부터 있었지만, 가능한 State와 Action의 경우의 수가 너무 많아 그에 적합한 Policy를 찾는 것이 힘들었는데, Neural network가 도입되면서, 그 진가를 발휘하기 시작했.. 2018. 6. 6. 이전 1 다음