빅데이터
하둡의 설치부터 핵심구성요소인 HDFS, 맵리듀스의 동작 원리를 배우며 통계분석 패키지 R에 대한 전반적 기능을 배울 수 있다.
구분 | |
---|---|
빅데이터 R-Hadoop 실무과정 | |
Step 1빅데이터 R-Hadoop 실무과정 | - Linux / 쉘 프로그래밍 - Hadoop - Map Reduce - Hive 기본 |
Step 2빅데이터 Interactive, Streaming | - Hadoop - SQL On - Storm - 역색인 만들기 |
Step 3Spark를 이용한 빅데이터 처리/분석 과정 | - Scala - Spark Programming - Spark 기본 및 응용 |
Step 4하둡에코시스템 | - Hive - SQOOP - MAHOUT |
Step 5R 빅데이터 기본분석 | - 기초문법 및 패키지 사용법 - 데이터 시각화 및 특성 분석 - 기술통계 및 추론통계분석 |
Step 6빅데이터 설계,분석 프로젝트 | - Data 분석 - Data 분석 설계 - 데이터마이닝 기법적용 - 시각화표현 |
Step 7프로젝트 시연 | - 기초문법 및 패키지 사용법 - 데이터 시각화 및 특성 분석 - 기술통계 및 추론통계분석 |
Step 8Scala 언어에 대한 이해 | - 아파치 스파크 개요의 이해 - Scalar 언에에 대한 이해 - 스파크 RDD의 이해 - 스파크 MLlib의 이해 |
4차 산업혁명 데이터분석가 과정 | |
Step 1분석을 위한,파이썬 프로그래밍 | - 자료구조 및 함수 - 클래스,쓰레드,기초수학 - UML과 Desing Pattern |
Step 2R 빅데이터 기본분석 | - 기초 문법 및 패키지 사용법 - 데이터 시각화 및 특성분석 - 기술통계 및 추론통계 분석 |
Step 3파이썬 빅데이터 기본분석 | - 파이썬 개발환경 구축 및 기본문법 - NumPy / pandas 학습 - 데이터 수집 및 가공 - 시각화 + 시계열 통계분석 |
Step 4알고리즘을 활용한 실전 머신러닝 분석 | - R,Python 기계학습 - 시계열분석 과 예측분석 - 머신러닝 알고리즘 학습 |
Step 5딥러닝을 위한 텐서플로우(Tensorflow) | - GPU분산처리,clustering - CNN,RNN - 실시간 분석 서비스 구축 |
Step 6심화알고리즘 웹 출력 및 시각화 기술 | - GA(패턴인식), HMM(자연어 처리) - 데이터문석실무&모델링 - 실시간 출력 및 시각화 |
Step 7빅데이터 설계,분석프로젝트 | - Data분석 - Data분석설계 - 데이터마이닝 기법 적용 - 시각화 표현 |
Step 8프로젝트시연 | - 프로젝트 발표 자료 및 기술서 작성 - 발표 및 시연 |