강화학습의 개념과 마르코프 결정 프로세스
▥ 강화학습의 개념 위키디피아에서 정의하고 있는 강화학습의 개념은 다음과 같다. Reinforcement learning(RL) is an area of machine learning concerned with how intelligent agents ought to take actions in an environment in order to maximize the notion of cumulative reward. 강화학습은 원하는 목표를 달성하기 위해 시간 순서대로 환경에 가해지는 행동(action)을 선택하기 위한 방법으로, 일반적으로 시간변수는 불연속시간변수(discrete-time)를 가정한다. 또한, 일반적으로 시간스텝마다 행동이 가해지기 때문에 순차적 의사 결정 문제(sequential de..