교육문의

02-587-5180

평일 09:00~18:00

(토,일,공휴일 휴무)

1:1 온라인 상담
  1. 재직자교육
  2. 교육일정 및 신청

교육일정 및 신청

페이스북 트위터 구글

아파치 스파크기반 머신러닝

아파치 스파크기반 머신러닝
차수 교육기간 시간 교육장소 신청하기
1 2020년 05월 11일(월) ~ 05월 13일(수)
  • 주간
  • 09:00~18:00
NCIA양재교육장 신청
2 2020년 06월 18일(목) ~ 06월 20일(토)
  • 주간
  • 09:00~18:00
NCIA양재교육장 신청
3 2020년 07월 13일(월) ~ 07월 15일(수)
  • 주간
  • 09:00~18:00
NCIA양재교육장 신청

교육목표

 

• 스파크를 사용해 머신러닝, 그래프 처리, 스트리밍, SQL을 스파크에 전달하는 기능을 학습.
• 분산 환경에서 대용량 데이터를 이용한 머신러닝 알고리즘의 적용 방법
• 스파크의 MLlib스파크 ML의 모델 튜닝 및 파이프라인 도구의 활용법

 

교육내용

 

일차과목내용
1일차

빅데이터 머신러닝 개요

• 빅데이터를 활용한 머신러닝 애플리케이션의 유형
• 머신러닝 사례
• 머신러닝 알고리즘의 종류

스파크의 개요

• 실습환경 구축
• 스파크의 주요 컴포넌트
• RDD데이터셋
• RDD데이터셋 연산
• 스칼라, SparkR, PySpark
2일차

스파크 머신러닝

• MLlib스파크 ML의 모델 튜닝 도구

• 하이퍼파라미터, 그리드 서치, 교차 검증 등 머신러닝 모델 성능향상 방법
• 스파크 머신러닝 파이프라인

지도학습 알고리즘

• 나이브 베이즈
• 결정 트리
• 다항 분류
3일차

자율학습 알고리즘과 추천 시스템

• 스파크 그래프 모델
• 군집화
• 추천 시스템

스파크 ML을 이용한 텍스트 분석 

• 트위터에서 스트리밍 데이터를 이용하여 머신러닝 알고리즘 적용 실습
• 머신러닝 파이프라인 구축 및 하이퍼파라미터 튜닝을 통한 모델 성능 향상 실습
• 분산 환경에서 스파크 테스팅과 디버깅

 

교육대상

• 프로그래밍 경험자

• 대용량 데이터에 머신러닝을 적용하고자 하는 개발자 

특이점

 

• 스파크 ML 을 이용하여 머신러닝 알고리즘을 구현해 본다.

 

수/강/후/기