평일 09:00~18:00
(토,일,공휴일 휴무)
차수 | 교육기간 | 시간 | 교육장소 | 신청하기 |
---|
• SQL과 비슷한 HiveQL로 하둡맵리듀스를구현하고 HBase와 통합운영하는방법을 포함한다.
일차 | 과목 | 내용 |
1일차 | 빅데이터의 개요 | • 빅데이터의 개요 • 빅데이터 병렬처리 분석 기술 • Hive 실습환경 구축 |
HiveQL 기본 구문 | • 데이터 정의: 자료형, 형변환, DDL, Hive 데이터베이스, 테이블, 파티션, 버킷, 뷰 • 데이터 질의: SELECT 문, INNER JOIN, OUTER JOIN/CROSS JOIN, MAPJOIN, UNION • 데이터 조작: LOAD, INSERT, EXPORT/IMPORT, ORDER/SORT, 연산자와 함수, 트랜잭션 • 뷰, 색인 • 실습: wordcount, JOIN 실습 | |
2일차 | HDFS, 맵리듀스 개요 | • HDFS의 개요 • 맵리듀스의 개요 |
HiveQL 집계와 샘플링 | • 데이터 집계와 샘플링: GROUP BY, GROUPING SETS, ROLLUP/CUBE, HAVING, 분석 함수, 샘플링 • 성능 측정 도구 • NoSQL에 스키마 매핑하기 • 실습: GROUP BY와 집계함수를 이용한 실습 | |
3일차 | HiveQL 사용자 함수, 보안 | • 사용자 정의 함수의 정의 • 인증과 권한 • 보안 관련 고려사항 • 실습: 사용자 정의 함수실습 |
빅데이터병렬처리 분석 실습 | • JDBC/ODBC 커넥터 사용 • HBase와 연동, oozie와 연동 • 실습: 빅데이터병렬처리 분석 프로젝트 |
• 프로그래밍 경험자