재직자 교육

재직자 직무능력향상 교육

교육문의

02-587-5180

평일 09:00~18:00

(토,일,공휴일 휴무)

• 강화 학습의 기본 원리와 동작을 이해할 수 있다.

• 강화 학습과 관련된 수학적 이론 및 용어를 구분할 수 있다.

• 강화 학습에 사용되는 기본 알고리즘을 이해할 수 있다.

• 강화 학습 구현 코드를 분석하고 활용할 수 있다.

• Tensorflow와 Keras 등을 이용하여 강화 학습에 사용되는 기본 알고리즘을 구현할 수 있다.

일차	과목	내용
1일차	강화학습 기초 Dynamic 프로그래밍과 강화 학습	• 강화학습 개요, MDP (Markov Decision Process), 벨만(Bellman) 방정식 • Grid World와 Dynamic Programming, • Dynamic Programming 1 - 정책 이터레이션 • Dynamic Programming 2 - 가치 이터레이션
2일차	강화학습 알고리즘 살사와 큐러닝 강화학습과 인공신경망	• 몬테 카를로 예측과 시간차 예측, 강화 학습 알고리즘 살사 (SARSA) • 강화 학습 알고리즘 큐러닝 (Q-Laerning) • 인공신경망을 결합한 강화학습 DQN(Deep Q-Networks)
3일차	강화학습 DQN 구현 사례 최신 강화 학습 알고리즘 분석	• 강화학습 DQN 구현 사례 1 - 카트폴 • 강화학습 DQN 구현 사례 2 - 아타리 게임 • VPG, NPG, TRPO, PPO 등

• AI 제품 기획/설계/기술지원/테스팅/감리/컨설팅 관련 자

• 강화 학습의 원리와 핵심 알고리즘을 파악하고자 하는 자

• 강화 학습 알고리즘을 구현하고자 하는 개발자

• Linux & Cloude 환경에서 진행함

• Anaconda3 ( Python, Spyder, numpy, scipy, pandas, scikit-learn, Tensorflow, Keras 등)

• Google Colab, Jupyter Notebook