평일 09:00~18:00
(토,일,공휴일 휴무)
차수 | 교육기간 | 시간 | 교육장소 | 신청하기 |
---|---|---|---|---|
1 | 2022년 12월 04일(일) ~ 12월 18일(일) 종료 |
|
온라인교육(ZOOM) | 마감 |
2 | 2022년 12월 12일(월) ~ 12월 14일(수) 종료 |
|
온라인교육(ZOOM) | 마감 |
1일차 |
1. 강화학습 기초 - 강화학습 개요 - MDP (Markov Decision Process) & 벨만(Bellman) 방정식 2. Dynamic 프로그래밍과 강화 학습 - Grid World와 Dynamic Programming - Dynamic Programming - 정책 이터레이션 & 가치 이터레이션 |
||
2일차 |
3. 강화학습 알고리즘 살사와 큐러닝 - 몬테 카를로 예측과 시간차 예측 - 강화 학습 알고리즘 살사 (SARSA) & 큐러닝 (Q-Laerning) 4. 강화학습과 인공신경망 - Value Function Approximaton - 인공신경망을 결합한 강화학습 Deep-SARSA & Policy Gradient |
||
3일차 |
5. 강화학습 DQN & Actor-Critic 구현 사례 - 강화학습 DQN(using FNN) 구현 사례 - 카트폴 - 강화학습 Actor-Critic(A2C) 구현 사례 - 카트폴 - 강화학습 DQN(using CNN) 구현 사례 - 아타리 게임 - 강화학습 Actor-Critic(A3C) 구현 사례 - 아타리 게임 |