본문 영역으로 바로가기

[창의력] 정보/수학(3학년)_경다인 멘토


POSTECHx

강좌 소개

AI가 이끄는 4차 산업 혁명 시대가 찾아온 지금, 인간을 뛰어넘는 AI를 위한 기술 강화학습에 대해 알아본다. [수학적 사고력을 갖춘 예비 고1 대상]


강좌 목차

주차주차
1AI와 강화학습AI의 정의를 이해하고, AI, 머신러닝, 딥러닝의 관계를 알아본다. 머신러닝은 지도학습, 비지도학습, 강화학습으로 분류될 수 있음을 이해하고 강화학습의 용어와 특징을 탐구한다.
2마르코프 결정 과정
마르코프 과정, 마르코프한 상태, 마르코프 보상 과정, 마르코프 결정 과정을 이해한다. 리턴, 정책, 상태 가치 함수와 액션 가치 함수의 의미를 이해하고 수식으로 표현해 본다. 
3
벨만 방정식
상태 가치 함수, 액션 가치 함수, 리턴과 정책의 관계를 통해 벨만 기대 방정식을 도출해본다. 벨만 기대 방정식을 토대로 벨만 최적 방정식을 이해한다.
4여러 가지 강화학습
강화학습에서 예측과 제어의 의미를 이해한다. 몬테카를로 학습과 시간차 학습의 특징을 이해하고 비교해본다. 다양한 강화학습 기법들을 접해본다.


교수자

Teacher Image

경다인

무은재학부

등록