경다인
무은재학부
AI가 이끄는 4차 산업 혁명 시대가 찾아온 지금, 인간을 뛰어넘는 AI를 위한 기술 강화학습에 대해 알아본다. [수학적 사고력을 갖춘 예비 고1 대상]
주차 | 주차 | |
---|---|---|
1 | AI와 강화학습 | AI의 정의를 이해하고, AI, 머신러닝, 딥러닝의 관계를 알아본다. 머신러닝은 지도학습, 비지도학습, 강화학습으로 분류될 수 있음을 이해하고 강화학습의 용어와 특징을 탐구한다. |
2 | 마르코프 결정 과정 | 마르코프 과정, 마르코프한 상태, 마르코프 보상 과정, 마르코프 결정 과정을 이해한다. 리턴, 정책, 상태 가치 함수와 액션 가치 함수의 의미를 이해하고 수식으로 표현해 본다. |
3 | 벨만 방정식 | 상태 가치 함수, 액션 가치 함수, 리턴과 정책의 관계를 통해 벨만 기대 방정식을 도출해본다. 벨만 기대 방정식을 토대로 벨만 최적 방정식을 이해한다. |
4 | 여러 가지 강화학습 | 강화학습에서 예측과 제어의 의미를 이해한다. 몬테카를로 학습과 시간차 학습의 특징을 이해하고 비교해본다. 다양한 강화학습 기법들을 접해본다. |
무은재학부