[창의력] 정보/수학(3학년)_경다인 멘토

POSTECHx

이 강좌는 초대된 사람만 등록가능합니다

강좌 소개

AI가 이끄는 4차 산업 혁명 시대가 찾아온 지금, 인간을 뛰어넘는 AI를 위한 기술 강화학습에 대해 알아본다. [수학적 사고력을 갖춘 예비 고1 대상]

주차		주차
1	AI와 강화학습	AI의 정의를 이해하고, AI, 머신러닝, 딥러닝의 관계를 알아본다. 머신러닝은 지도학습, 비지도학습, 강화학습으로 분류될 수 있음을 이해하고 강화학습의 용어와 특징을 탐구한다.
2	마르코프 결정 과정	마르코프 과정, 마르코프한 상태, 마르코프 보상 과정, 마르코프 결정 과정을 이해한다. 리턴, 정책, 상태 가치 함수와 액션 가치 함수의 의미를 이해하고 수식으로 표현해 본다.
3	벨만 방정식	상태 가치 함수, 액션 가치 함수, 리턴과 정책의 관계를 통해 벨만 기대 방정식을 도출해본다. 벨만 기대 방정식을 토대로 벨만 최적 방정식을 이해한다.
4	여러 가지 강화학습	강화학습에서 예측과 제어의 의미를 이해한다. 몬테카를로 학습과 시간차 학습의 특징을 이해하고 비교해본다. 다양한 강화학습 기법들을 접해본다.

무은재학부