모.집.임.박.강.좌

1/ 15
  1. HOME
  2. 재직자 국비과정
  3. 빅데이터

빅데이터

하둡의 설치부터 핵심구성요소인 HDFS, 맵리듀스의 동작 원리를 배우며 통계분석 패키지 R에 대한 전반적 기능을 배울 수 있다.

구분  
빅데이터 R-Hadoop 실무과정  
Step 1빅데이터 R-Hadoop 실무과정 - Linux / 쉘 프로그래밍
- Hadoop
- Map Reduce
- Hive 기본
Step 2빅데이터 Interactive, Streaming - Hadoop
- SQL On
- Storm
- 역색인 만들기
Step 3Spark를 이용한 빅데이터 처리/분석 과정 - Scala
- Spark Programming
- Spark 기본 및 응용
Step 4하둡에코시스템 - Hive
- SQOOP
- MAHOUT
Step 5R 빅데이터 기본분석 - 기초문법 및 패키지 사용법
- 데이터 시각화 및 특성 분석
- 기술통계 및 추론통계분석
Step 6빅데이터 설계,분석 프로젝트 - Data 분석
- Data 분석 설계
- 데이터마이닝 기법적용
- 시각화표현
Step 7프로젝트 시연 - 기초문법 및 패키지 사용법
- 데이터 시각화 및 특성 분석
- 기술통계 및 추론통계분석
Step 8Scala 언어에 대한 이해 - 아파치 스파크 개요의 이해
- Scalar 언에에 대한 이해
- 스파크 RDD의 이해
- 스파크 MLlib의 이해
4차 산업혁명 데이터분석가 과정  
Step 1분석을 위한,파이썬 프로그래밍 - 자료구조 및 함수
- 클래스,쓰레드,기초수학
- UML과 Desing Pattern
Step 2R 빅데이터 기본분석 - 기초 문법 및 패키지 사용법
- 데이터 시각화 및 특성분석
- 기술통계 및 추론통계 분석
Step 3파이썬 빅데이터 기본분석 - 파이썬 개발환경 구축 및 기본문법
- NumPy / pandas 학습
- 데이터 수집 및 가공
- 시각화 + 시계열 통계분석
Step 4알고리즘을 활용한 실전 머신러닝 분석 - R,Python 기계학습
- 시계열분석 과 예측분석
- 머신러닝 알고리즘 학습
Step 5딥러닝을 위한 텐서플로우(Tensorflow) - GPU분산처리,clustering
- CNN,RNN
- 실시간 분석 서비스 구축
Step 6심화알고리즘 웹 출력 및 시각화 기술 - GA(패턴인식), HMM(자연어 처리)
- 데이터문석실무&모델링
- 실시간 출력 및 시각화
Step 7빅데이터 설계,분석프로젝트 - Data분석
- Data분석설계
- 데이터마이닝 기법 적용
- 시각화 표현
Step 8프로젝트시연 - 프로젝트 발표 자료 및 기술서 작성
- 발표 및 시연