본문 바로가기
🖊️Certificate/📌ADsP

[ADsP] 2과목_01장. 데이터 분석 기획의 이해

by 빛나고요 2024. 2. 19.
BIG

2과목. 데이터 분석 기획
01장. 데이터 분석 기획의 이해
(1)  분석 대상과 그 방법에 따른 4가지 분석 주제
① 분석 대상과 분석 방법 둘다  알고 있다면 》 최적화
② 분석 대상이 무엇인지 알고 있지만, 그 분석 방법을 모른다면  》 솔루션
③ 분석 대상과 분석 방법 둘다 모른다면  》 발견
④ 분석대상이 무엇인지 모르지만, 분석 방법은 알고 있다면  》  통찰



 
(2) 분석 기획 시 고려사항 3가지
① 가용 데이터 고려
- 분석의 기본이 되는 데이터가 확보될 수 있는지에 대한 고려 필요
 
② 적절한 활용 방안과 유스케이스의 탐색
- 기존에 잘 구현되어 활용되고 있는 유사 시나리오 및 솔루션을 최대한 활용하는 것이 중요함
 
③ 장애요소에 대한 사전 계획 수립
- 분석을 수행할 때 발생 가능한 장애요소에 대한 사전 계획 수립 필요
 

(3) 분석 방법론

1. 데이터 분석 방법론의 구성 요소

- 상세한 절차

- 방법

- 도구와 기법

- 템플릿과 산출물


2. 기업의 합리적 의사결정 방해요소
  1) 고정 관념
  2) 편향된 생각
  3) 프레이밍 효과: 동일한 사건이나 상황을 두고도 개인의 판단이나 선택이 달라질 수 있는 현상


 

 

(4) 분석 방법론이 적용되는 업무 특성에 따른 모델
① 나선형 모델
- 프로토타입 모델과 유사하지만, 위험요소를 사전에 제거한다는 것에 초점을 맞춘다는 차이가 있음 
 
② 계층적 프로세스 모델
- 계층적 프로세스 모델의 구조

단계 프로세스 그룹을 통해 완성된 단계별 산출물 생성, 버전 관리 등을 통한 통제 필요
태스크 단계를 구성하는 단위 활동, 물리적 또는 논리적 단위로 품질 검토의 항목이 될 수 있음
스텝 WBS의 워크 패키지에 해당하고, 입력 자료, 처리 및 도구, 출력 자료로 구성된 단위 프로세스

 
(5) KDD 분석 방법론 프로세스

1단계  데이터셋 선택
2단계  데이터 전처리
3단계 데이터 변환
4단계 데이터 마이닝
5단계 데이터 마이닝 결과 해석과 평가

 
(6) CRISP-DM 분석 방법론 프로세스

1단계 업무 이해
2단계  데이터 이해
3단계  데이터 준비
4단계 모델링
5단계 평가
6단계 전개

* KDD 분석 방법론 프로세스와 CRISP-DM 분석 방법론 프로세스의 차이점


(7) 빅데이터 분석 방법론의 계층적 프로세스

분석 기획 > 데이터 준비 > 데이터 분석 > 시스템 구현 > 평가 및 전개
- 비즈니스 이해 및 범위 설정
- 프로젝트 정의 및 계획 수립
- 프로젝트 위험 계획 수립
  - 필요 데이터 정의
- 데이터 스토어 설계
- 데이터 수집 및 정합성 검정



  - 분석용 데이터 준비
- 텍스트 분석
- 탐색적 분석
- 모델링
- 모델 평가 및 검증
- 모델 적용 및 운영 방안
  - 설계 및 구현
- 시스템 테스트 및 운영





  - 모델 발전계획 수립
- 프로젝트 평가 및 보고




* 데이터 분석 > 데이터 준비 피드백

 

(8) 분석 과제 탐색 방법

 하향식 접근법(Top-Down 방식): 과정이 체계적으로 단계화되어 문제를 해결하는 방식

 상향식 접근법(Bottom-Up 방식): 다양한 데이터 조합 속에서 인사이트를 찾아내는 방식

- 최근에는 상향식을 주로 사용

- 분석 대상을 알고 있다면 하향식, 모른다면 상향식 사용

- 실제로는 둘다 혼용해서 사용하는 경우가 많음

 

 

[분석 과제 발굴]

 

 

[분석 과제 발굴 방법론 개념도]

Start
분석 대상이 무엇인지 알고 있는가?
Yes No
하향식 접근법 상향식 접근법
가. 문제 탐색 단계 A. 비즈니스 모델 탐색 기법 가. 지도 · 비지도 학습 A. 지도 학습
B. 분석 기회 발굴 및 범위 확장 B. 비지도 학습
C. 외부 참조 모델 기반 문제 탐색 나. 프로토 타입 시행착오 해결법
D. 분석 유스케이스    
나. 문제 정의 단계 식별된 비즈니스 문제를 데이터 문제로 변환하여 과제를 정의    
다. 해결 방안 탐색 단계 과제 정의 후 어떻게 해결할 것인지 그 방안을 탐색(분석 기법, 시스템 등)    
라. 타당성 검토 단계 경제적 타당성, 기술적 타당성 등을 검토    

 

(9) 디자인 씽킹

① IDEO사의 디자인 씽킹

- 더블 다이아몬드 프로세스

  * 수렴과 발산을 반복함

  * 상향식

 

② 스탠퍼드대학의 디자인 씽킹

  1. 공감

  2. 문제 정의

  3. 아이디어 도출

  4. 프로토타입

  5. 테스트

  6. 평가

 

(10) 하향식 접근법

1. 1단계-문제 탐색 단계

 비즈니스 모델 탐색 기법: 9가지 블록을 5가지로 단순화한 탐색 기법

 

[9 Block 모델을 5개 영역으로 단순화]

 

② 분석 기회 발굴 범위의 확장

- 4가지 관점을 통해 어떻게 분석 기회를 발굴할 것인지

거시적 관점 문제 혹은 변화가 기업에 주는 영향을 탐색
경쟁자 확대 관점 기업에 위협이 도리 상황을 탐색
시장의 니즈 탐색 시장의 니즈 탐색 관점에서 문제를 탐색
역량을 재해석 역량의 재해석 관점에서 다시 기업 내부를 둘러보도록 함

 

[분석 기회 발굴 범위의 확장]

 

 외부 참조 모델 기반 문제 탐색 및 분석 유즈케이스 정의

- 비즈니스 모델 및 유사, 동종 업계의 탐색을 통해 발견된 문제들을 세부과제로 도출하기 전 '분석 유즈케이스(Analytics Use Cases: 분석을 적용했을 때 업무 흐름을 개념적으로 설명한 것)'로 정의

 

2. 2단계- 문제 정의 단계

 문제 정의: 비즈니스 문제를 데이터의 문제로 변환하여 정의

 

3. 3단계- 해결 방안 탐색 단계

[해결 방안 탐색 단계 프로세스]

 

4. 4단계- 타당성 검토 단계

 경제적 타당성

② 데이터 및 기술적 타당성

 

(11) 상향식 접근법

 지도학습

- 인공지능이 데이터를 통해 알고리즘을 학습하는 것

ex) 머신러닝, 의사결정 트리, 인공신경망모형, 분류 분석

 

② 비지도학습

- 정답을 알려주지 않고 학습하는 것, 스스로 학습하는 것

ex) 장바구니 분석, 기술 통계, 프로파일링, 군집 분석, 주성분분석, 다차원 척도

 

(12) 시행착오를 통한 문제 해결(프로타이핑 접근법)

- 프로타이핑 접근법=시행착오 해결법

- 분석을 먼저 시도하고 결과를 확인하면서 조금씩 개선해나가는 방법

 

(13) 정확도와 정밀도

- 정확도: 모델과 실제 값 간의 차이가 적은 것

- 정밀도: 반복적으로 모델을 사용했을 때 모델 값들의 편차 수준

 

* 정확도 보다는 정밀도가 높은 것 이 더 좋음

 

(14) 능력 성숙도 통합 모델(CMMI)

- 소프트웨어 및 시스템 공학의 역량 성숙도를 파악하기 위한 모델

- 5가지 단계

1단계 개인의 역량이 프로젝트의 성공과 실패를 나누는 주요 요인으로 프로젝트의 개발 프로세스가 거의 없음
2단계 일정이나 비용과 같은 요소가 프로세스의 중심으로, 약간의 개발 프로세스하에서 통제되는 상태
3단계 2단계에서 존재하지 않은 조직을 관리하기 위한 프로세스가 존재하는 상태
4단계 체계적인 관리하에 프로젝트 및 산출물 등에 대한 정량적인 측정이 가능한 상태
5단계  조직적으로 최적화된 프로세스를 보유하고 지속적인 개선을 목표로 하는 상태

 

댓글