Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 데이터교육
- 데이터분석캠프
- 데이터교육프로그램
- 부산데이터분석
- ncs하기 싫다
- 태블로
- 부산대학 지원사업
- sql입문반
- 데이터분석
- 빅데이터분석기사1과목
- 부산디자이너
- 데이터행사
- ncs 한국사
- 태블로신병훈련소19기
- ADsP독학
- ADsP2주합격
- Tableau
- 태블로신병훈련소
- 공부하기싫음
- 한국사 중세
- 부산소재대학
- 부산테크노파크
- 데이토리랩
- 데이터자격증
- 공부싫엉
- ADsP직장인2주
- 데이터 지원사업
- 데이터오픈랩
- 부산빅데이터혁신센터
- ADsP
Archives
- Today
- Total
HEY- HEY MIN
[빅분기 공부] 1과목 빅데이터 분석 기획 / Ch02. 데이터 분석 계획 본문
빅데이터 분석기사 필기
1과목 빅데이터 분석기획 - Ch02. 데이터 분석 계획
2.1.1 분석 로드맵 설정
- 데이터 분석 기획은 실제 분석을 수행하기 앞서 분석을 수행할 과제를 정의하고, 결과를 도출할 수 있도록 프로젝트를 관리하는 방안을 사전에 계획하는 일련의 작업을 의미함
- 어떤 목표 WHAT을 달성하기 위하여 WHY, 어떠한 데이터를 가지고, 어떠한 방식 HOW으로 수행할지에 대한 일련의 계획을 수립하는 과정이기 때문에 방향성이 명확해야 함
- 데이터 분석의 3요소 : 데이터, 분석모델, 분석가 -> 가치창출(INSIGHT)
- 분석의 대상 및 분석 방식에 따른 4가지 분석 기획 유형
HOW/WHAT | KNOWN | UNKOWN |
KNOWN | 최적화 Optimization | 통찰 Insight (How Know) |
UNKNOWN | 솔루션 Solution (What Know) | 발견 Discovery |
- 목표 시점에 따른 데이터 분석 기획 유형 : 과제중심적(단기), 마스터플랜방식(중장기) 두방식 융합적으로 적용 필요
- 성공적인 분석 기획 수행을 위한 고려사항 : 가용데이터확인, 적합한 활용방안과 유스케이스 확보, 장애요소식별
- 데이터분석마스터플랜은 분석이 주는 가치를 지속적이고 체계적으로 관리하고, 분석 역량을 내재화 하기 위하여 단기적인 과제 수행뿐 아니라 중/장기적 관점의 수행 계획을 수립하는 과정 의미함
- 데이터 분석 마스터 플랜 절차 : 수행과제 도출->우선순위평가->단기적 세부이행계획->중장기 분석 로드맵 분석
- 데이터 분석 마스터 플랜 수립하기 위해 ISP를 활용하거나 데이터 분석 마스터 플랜 수립 프레임워크 활용
- 우선순위 선정 절차 : 분석과제도출->우선순위평가->우선순위조정/확정
- 우선순위 평가 : 전략적 중요도, 비즈니스 효과와 투자대비수익율(ROI), 시급성과 난이도
- 우선순위 선정 고려요소
- 전략적 중요도 : 전략적 필요성과 시급성
- 실행 용이성 : 투자 용이성, 기술 용이성 * ISP기반 IT 프로젝트는 전략적 중요도, 실행 용이성 기반 과제 도출
- 투자비용요소와 비즈니스효과 : Volume, Variety, Velocity, Value
- 시급성(전략적 중요도)과 난이도(분석 준비도와 성숙도 진단 결과)
- 우선순위 평가기준
- ROI 활용한 우선순위 평가 기준 : 시급성(전략적중요도, KPI, Value, 비지니효과), 난이도(3V, 투자비용요소)
- 포트폴리오 사분면 이용 : 난이도(Y). 시급성(X)
- 분석 로드맵 설정 : 최종적인 실행 우선순위 결정 후 수립
- (단계적 분석 로드맵 수립) 데이터 분석 체계 도입->데이터 분석 유효성 입증->데이터 분석 확산과 고도화
- (세부 이행 계획 수립) 데이터 분석 적용 모델(폭포수 모델->반복적 분석 모델) 고려하여 작성
2.1.2 분석 문제 정의 : 분석문제정의하는 과정(분석 과제 발굴), 필요한 방법(분석 과제 방법론)
- 분석과제의 이해: 하향식(최적화->솔루션), 상향식(발견->통찰), 상호보완적으로 적용하는것이 최적!(과제정의서도출)
- 햐항식 접근법 : 문제탐색-문제정의-해결방안탐색-타당성검토 (탐정탐검)
- 상향식 접근법 : 프로세스분류-프로세스흐름분석-분석요건식별-분석요건정의 (분흐식정)
- * 상향식 접근법 데이터 분석 방법 : 비지도 학습, 프로토타이핑 접근법
- 상향식-하향식 상호 보완적으로 수행하여 동적 환경에서 분석가치 높이는 의사결정 방법 : 디자인 씽킹
- 분석과제정의서 : 향후 프로젝트 수행 계획의 입력물로 사용
2.1.3 데이터 분석 방안
- 의사결정 가로막는 장애요소 : 고정관념, 편향된 생각, 프레이밍 효과
- 데이터 분석 모델
- 폭포수 모델 : 기존 레퍼런스
- 프로토타입 모델 : 고객과 점진적으로 개선 필요
- 나선형 모델 : 리스트가 높은 상황에서 위험 분석 추가하여 반복적으로 개발
- 애자일 모델 : 코딩과 테스트 기반의 접근을 통해 소프트웨어 개발 방식
- 데이터 마이닝 방법론 : KDD 분석 방법론, CRISP-DM 분석 방법론, SEMMA 분석 방법론
- KDD 분석 방법론 : 데이터선택-전처리-데이터변환-데이터마이닝-평가
- CRISP-DM : 업무이해-데이터이해-데이터준비-모델링-평가-배포 ( 단계, 테스크, 프로세스 실행)
- SEMMA : Sampling-Explore-Modify-Modeling-Assessment
- 빅데이터 분석 방법론 계층적 프로세스 모델: 단계-테스크-스텝
- 빅데이터 분석 방법론 5단계 절차 : PPADD
- Planning-Preparing-Aanalyzing-Developing-Deploying
2.2.1 데이터 확보 계획
- 데이터 확보 고려사항 : 데이터위치,데이터유형,수집기술,분석방법,비식별화
- 분석 데이터 확보 계획 : 목표정의-요구사항도출-예산안수립-데이터확보계획수립
- 분석 데이터 확보 방안 : 데이터확보계획점검-필요데이터정의-내/외부데이터확보채널검토-분석데이터확보
2.2.2 분석 절차 및 작업 계획
- 빅데이터 분석 절차 : PPADD
- Planning/분석기획 : 비즈니스 이해 및 범위설정, 프로젝트 정의 및 계획 수립, 프로젝트 위험 계획 수립
- Preparing/데이터준비 : 필요데이터정의, 데이터스토어설계, 데이터 수집 및 정합성 점검
- Analyzing/데이터분석 : 분석용데이터준비, 텍스트분석, 탐색적분석, 모델링, 모델평가및검증, 모델적용및운영방안수립
- Developing/시스템구현 : 설계및구현, 시스템 테스트 및 운영
- Deploying/평가및전개 : 모델발전계획수립, 프로젝트 평가 및 보고
- 빅데이터 분석 작업 계획 : WBS
- 10작업 이내, 2주 이내 기간으로 작업할 수 있는 WP크기로 관리
- 업무단위WP의 크기는 전체 작업의 1~10% 규모
- 자원/일정 산정 및 할당이 가능하고, 내/외부 의사소통에 활용 가능한 단위로 작업을 분할하여 관리
- 통상적으로 분할의 적정수는 3~5개