2과목. 데이터 분석 기획
01장. 데이터 분석 기획의 이해
(1) 분석 대상과 그 방법에 따른 4가지 분석 주제
① 분석 대상과 분석 방법 둘다 알고 있다면 》 최적화
② 분석 대상이 무엇인지 알고 있지만, 그 분석 방법을 모른다면 》 솔루션
③ 분석 대상과 분석 방법 둘다 모른다면 》 발견
④ 분석대상이 무엇인지 모르지만, 분석 방법은 알고 있다면 》 통찰
(2) 분석 기획 시 고려사항 3가지
① 가용 데이터 고려
- 분석의 기본이 되는 데이터가 확보될 수 있는지에 대한 고려 필요
② 적절한 활용 방안과 유스케이스의 탐색
- 기존에 잘 구현되어 활용되고 있는 유사 시나리오 및 솔루션을 최대한 활용하는 것이 중요함
③ 장애요소에 대한 사전 계획 수립
- 분석을 수행할 때 발생 가능한 장애요소에 대한 사전 계획 수립 필요
(3) 분석 방법론
1. 데이터 분석 방법론의 구성 요소
- 상세한 절차
- 방법
- 도구와 기법
- 템플릿과 산출물
2. 기업의 합리적 의사결정 방해요소
1) 고정 관념
2) 편향된 생각
3) 프레이밍 효과: 동일한 사건이나 상황을 두고도 개인의 판단이나 선택이 달라질 수 있는 현상
(4) 분석 방법론이 적용되는 업무 특성에 따른 모델
① 나선형 모델
- 프로토타입 모델과 유사하지만, 위험요소를 사전에 제거한다는 것에 초점을 맞춘다는 차이가 있음
② 계층적 프로세스 모델
- 계층적 프로세스 모델의 구조
단계 | 프로세스 그룹을 통해 완성된 단계별 산출물 생성, 버전 관리 등을 통한 통제 필요 |
태스크 | 단계를 구성하는 단위 활동, 물리적 또는 논리적 단위로 품질 검토의 항목이 될 수 있음 |
스텝 | WBS의 워크 패키지에 해당하고, 입력 자료, 처리 및 도구, 출력 자료로 구성된 단위 프로세스 |
(5) KDD 분석 방법론 프로세스
1단계 | 데이터셋 선택 |
2단계 | 데이터 전처리 |
3단계 | 데이터 변환 |
4단계 | 데이터 마이닝 |
5단계 | 데이터 마이닝 결과 해석과 평가 |
(6) CRISP-DM 분석 방법론 프로세스
1단계 | 업무 이해 |
2단계 | 데이터 이해 |
3단계 | 데이터 준비 |
4단계 | 모델링 |
5단계 | 평가 |
6단계 | 전개 |
* KDD 분석 방법론 프로세스와 CRISP-DM 분석 방법론 프로세스의 차이점
(7) 빅데이터 분석 방법론의 계층적 프로세스
분석 기획 | > | 데이터 준비 | > | 데이터 분석 | > | 시스템 구현 | > | 평가 및 전개 |
- 비즈니스 이해 및 범위 설정 - 프로젝트 정의 및 계획 수립 - 프로젝트 위험 계획 수립 |
- 필요 데이터 정의 - 데이터 스토어 설계 - 데이터 수집 및 정합성 검정 |
- 분석용 데이터 준비 - 텍스트 분석 - 탐색적 분석 - 모델링 - 모델 평가 및 검증 - 모델 적용 및 운영 방안 |
- 설계 및 구현 - 시스템 테스트 및 운영 |
- 모델 발전계획 수립 - 프로젝트 평가 및 보고 |
* 데이터 분석 > 데이터 준비 피드백
(8) 분석 과제 탐색 방법
① 하향식 접근법(Top-Down 방식): 과정이 체계적으로 단계화되어 문제를 해결하는 방식
② 상향식 접근법(Bottom-Up 방식): 다양한 데이터 조합 속에서 인사이트를 찾아내는 방식
- 최근에는 상향식을 주로 사용
- 분석 대상을 알고 있다면 하향식, 모른다면 상향식 사용
- 실제로는 둘다 혼용해서 사용하는 경우가 많음
[분석 과제 발굴]
[분석 과제 발굴 방법론 개념도]
Start 분석 대상이 무엇인지 알고 있는가? |
|||
Yes | No | ||
하향식 접근법 | 상향식 접근법 | ||
가. 문제 탐색 단계 | A. 비즈니스 모델 탐색 기법 | 가. 지도 · 비지도 학습 | A. 지도 학습 |
B. 분석 기회 발굴 및 범위 확장 | B. 비지도 학습 | ||
C. 외부 참조 모델 기반 문제 탐색 | 나. 프로토 타입 | 시행착오 해결법 | |
D. 분석 유스케이스 | |||
나. 문제 정의 단계 | 식별된 비즈니스 문제를 데이터 문제로 변환하여 과제를 정의 | ||
다. 해결 방안 탐색 단계 | 과제 정의 후 어떻게 해결할 것인지 그 방안을 탐색(분석 기법, 시스템 등) | ||
라. 타당성 검토 단계 | 경제적 타당성, 기술적 타당성 등을 검토 |
(9) 디자인 씽킹
① IDEO사의 디자인 씽킹
- 더블 다이아몬드 프로세스
* 수렴과 발산을 반복함
* 상향식
② 스탠퍼드대학의 디자인 씽킹
1. 공감
2. 문제 정의
3. 아이디어 도출
4. 프로토타입
5. 테스트
6. 평가
(10) 하향식 접근법
1. 1단계-문제 탐색 단계
① 비즈니스 모델 탐색 기법: 9가지 블록을 5가지로 단순화한 탐색 기법
[9 Block 모델을 5개 영역으로 단순화]
② 분석 기회 발굴 범위의 확장
- 4가지 관점을 통해 어떻게 분석 기회를 발굴할 것인지
거시적 관점 | 문제 혹은 변화가 기업에 주는 영향을 탐색 |
경쟁자 확대 관점 | 기업에 위협이 도리 상황을 탐색 |
시장의 니즈 탐색 | 시장의 니즈 탐색 관점에서 문제를 탐색 |
역량을 재해석 | 역량의 재해석 관점에서 다시 기업 내부를 둘러보도록 함 |
[분석 기회 발굴 범위의 확장]
③ 외부 참조 모델 기반 문제 탐색 및 분석 유즈케이스 정의
- 비즈니스 모델 및 유사, 동종 업계의 탐색을 통해 발견된 문제들을 세부과제로 도출하기 전 '분석 유즈케이스(Analytics Use Cases: 분석을 적용했을 때 업무 흐름을 개념적으로 설명한 것)'로 정의
2. 2단계- 문제 정의 단계
① 문제 정의: 비즈니스 문제를 데이터의 문제로 변환하여 정의
3. 3단계- 해결 방안 탐색 단계
[해결 방안 탐색 단계 프로세스]
4. 4단계- 타당성 검토 단계
① 경제적 타당성
② 데이터 및 기술적 타당성
(11) 상향식 접근법
① 지도학습
- 인공지능이 데이터를 통해 알고리즘을 학습하는 것
ex) 머신러닝, 의사결정 트리, 인공신경망모형, 분류 분석
② 비지도학습
- 정답을 알려주지 않고 학습하는 것, 스스로 학습하는 것
ex) 장바구니 분석, 기술 통계, 프로파일링, 군집 분석, 주성분분석, 다차원 척도
(12) 시행착오를 통한 문제 해결(프로타이핑 접근법)
- 프로타이핑 접근법=시행착오 해결법
- 분석을 먼저 시도하고 결과를 확인하면서 조금씩 개선해나가는 방법
(13) 정확도와 정밀도
- 정확도: 모델과 실제 값 간의 차이가 적은 것
- 정밀도: 반복적으로 모델을 사용했을 때 모델 값들의 편차 수준
* 정확도 보다는 정밀도가 높은 것 이 더 좋음
(14) 능력 성숙도 통합 모델(CMMI)
- 소프트웨어 및 시스템 공학의 역량 성숙도를 파악하기 위한 모델
- 5가지 단계
1단계 | 개인의 역량이 프로젝트의 성공과 실패를 나누는 주요 요인으로 프로젝트의 개발 프로세스가 거의 없음 |
2단계 | 일정이나 비용과 같은 요소가 프로세스의 중심으로, 약간의 개발 프로세스하에서 통제되는 상태 |
3단계 | 2단계에서 존재하지 않은 조직을 관리하기 위한 프로세스가 존재하는 상태 |
4단계 | 체계적인 관리하에 프로젝트 및 산출물 등에 대한 정량적인 측정이 가능한 상태 |
5단계 | 조직적으로 최적화된 프로세스를 보유하고 지속적인 개선을 목표로 하는 상태 |
'🖊️Certificate > 📌ADsP' 카테고리의 다른 글
[ADsP] 3과목_02장. 통계분석 (2) | 2024.02.20 |
---|---|
[ADsP] 2과목_02장. 분석 마스터 플랜 (0) | 2024.02.19 |
[ADsP] 1과목_02장. 데이터의 가치와 미래 (2) | 2024.02.14 |
[ADsP] 1과목_01장. 데이터의 이해 (0) | 2024.02.14 |
[ADsP] Part3 오답 개념 정리 (0) | 2021.08.24 |
댓글