평일 09:00~18:00
(토,일,공휴일 휴무)
차수 | 교육기간 | 시간 | 교육장소 | 신청하기 |
---|---|---|---|---|
1 | 2020년 02월 17일(월) ~ 02월 19일(수) 종료 |
|
NCIA양재교육장(대면) | 마감 |
2 | 2020년 07월 13일(월) ~ 07월 15일(수) 종료 |
|
NCIA양재교육장(대면) | 마감 |
3 | 2020년 09월 14일(월) ~ 09월 16일(수) 종료 |
|
온라인교육(ZOOM) | 마감 |
4 | 2020년 10월 26일(월) ~ 10월 28일(수) 종료 |
|
온라인교육(ZOOM) | 마감 |
일차 | 과목 | 내용 |
1일차 | 강화학습 기초
Dynamic 프로그래밍과 강화 학습 | • 강화학습 개요, MDP
(Markov Decision Process), 벨만(Bellman)
방정식
• Grid
World와 Dynamic Programming,
• Dynamic
Programming 1 - 정책
이터레이션
• Dynamic
Programming 2 - 가치
이터레이션 |
2일차 | 강화학습 알고리즘 살사와 큐러닝
강화학습과 인공신경망 | • 몬테 카를로 예측과 시간차 예측, 강화 학습 알고리즘 살사 (SARSA) • 강화 학습 알고리즘 큐러닝 (Q-Laerning)
• 인공신경망을 결합한 강화학습 DQN(Deep
Q-Networks) |
3일차 | 강화학습 DQN 구현 사례
최신 강화 학습 알고리즘 분석 | • 강화학습 DQN 구현 사례 1 - 카트폴
• 강화학습 DQN 구현 사례 2 - 아타리 게임
• VPG,
NPG, TRPO, PPO 등 |