Chapter 3 Dynamic programming v Policy Iteration v

Chapter 3. Dynamic programming v Policy Iteration(벨만 기대 방정식) v Value Iteration(벨만 최적 방정식)

v Environment ■그리드월드에서 에이전트가 알고 있는 환경의 정보 2018 -01 -17 Dynamic programming 3

Slides: 8

Download presentation

Chapter 3. Dynamic programming v Policy Iteration(벨만 기대 방정식) v Value Iteration(벨만 최적 방정식) Ho-Bin Choi LINK@Korea. Tech http: //link. koreatech. ac. kr 2018 -01 -17 Dynamic programming 1

v Environment ■그리드월드에서 에이전트가 알고 있는 환경의 정보 2018 -01 -17 Dynamic programming 3