평일 09:00~18:00
(토,일,공휴일 휴무)
차수 | 교육기간 | 시간 | 교육장소 | 신청하기 |
---|---|---|---|---|
1 | 2020년 05월 18일(월) ~ 05월 20일(수) 종료 |
|
협약기업 방문교육 | 마감 |
2 | 2020년 10월 15일(목) ~ 10월 19일(월) 종료 |
|
협약기업 방문교육 | 마감 |
3 | 2020년 11월 30일(월) ~ 12월 02일(수) 종료 |
|
온라인교육(ZOOM) | 마감 |
일차 | 과목 | 내용 |
1일차 | 빅데이터 머신러닝 개요 | • 빅데이터를 활용한 머신러닝 애플리케이션의 유형
• 머신러닝 사례
• 머신러닝 알고리즘의 종류 |
스파크의 개요 | • 실습환경 구축
• 스파크의 주요 컴포넌트
• RDD와 데이터셋
• RDD와 데이터셋 연산
• 스칼라,
SparkR, PySpark | |
2일차 | 스파크 머신러닝 | • MLlib와 스파크 ML의 모델 튜닝 도구 • 하이퍼파라미터, 그리드 서치, 교차 검증 등 머신러닝 모델 성능향상 방법
• 스파크 머신러닝 파이프라인 |
지도학습 알고리즘 | • 나이브 베이즈
• 결정 트리
• 다항 분류 | |
3일차 | 자율학습 알고리즘과 추천 시스템 | • 스파크 그래프 모델
• 군집화
• 추천 시스템 |
스파크 ML을 이용한 텍스트 분석 | • 트위터에서 스트리밍
데이터를 이용하여 머신러닝 알고리즘 적용 실습 • 머신러닝 파이프라인 구축 및 하이퍼파라미터 튜닝을 통한 모델 성능 향상 실습
• 분산 환경에서 스파크 테스팅과 디버깅 |
• 대용량 데이터에 머신러닝을 적용하고자 하는 개발자