평일 09:00~18:00
(토,일,공휴일 휴무)
차수 | 교육기간 | 시간 | 교육장소 | 신청하기 |
---|---|---|---|---|
1 | 2021년 03월 25일(목) ~ 03월 27일(토) 종료 |
|
온라인교육(ZOOM) | 마감 |
2 | 2021년 09월 02일(목) ~ 09월 04일(토) 종료 |
|
온라인교육(ZOOM) | 마감 |
1일차 |
강화학습 기초 |
•강화학습
개요,
MDP (Markov Decision Process)
•벨만(Bellman)
방정식
|
||
Dynamic
프로그래밍과
|
•Grid World와
Dynamic
Programming
•Dynamic Programming - 정책 이터레이션, 가치 이터레이션
|
|||
2일차 |
강화학습
알고리즘 살사와 |
•몬테 카를로 예측과 시간차 예측
•강화 학습 알고리즘 살사 (SARSA)
•강화 학습 알고리즘 큐러닝 (Q-Laerning)
|
||
강화학습과 인공신경망 |
•Value
Function Approximaton
•인공신경망을
결합한 강화학습 Deep-SARSA
•인공신경망을
결합한 강화학습 Policy
Gradient
|
|||
3일차 |
강화학습 DQN
|
•강화학습 DQN(using
FNN) 구현
사례 -
카트폴
•강화학습 Actor-Critic(A2C)
구현
사례 -
카트폴
|
||
강화학습 DQN |
•강화학습 DQN(using
CNN) 구현
사례 -
아타리
게임
•강화학습 Actor-Critic(A3C)
구현
사례 -
아타리
게임
|