본문 바로가기
데이터 분석 개념 정리

ADP 필기. 3과목 . 데이터 분석 기획 요약 2

by 코드챌린지 2022. 1. 23.

데이터 분석 기획 요약

분석기획

  • 분석기획

- 실제 분석을 수행하기에 앞서 분석을 수행할 과제의 정의&의도했던 결과를 도출할 수 있도록

이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업

 

- 어떠한 목표(what)를 달성하기 위하여, 어떠한 데이터를 가지고, 어떤 방식을(how) 수행할 지에 대한

일련의 계획을 수립하는 작업

 

1. 특정한 분석주제를 대상으로 진행할 경우, How.

분석방법 how   Known Un-known
know Optimization insight
un-know Solution descovery
    2. ahrvytlwjaquf qnstjrrlghlrqkddks
당면한 분석주제의 해결(과제단위)   지속적분석문화 내재화(마스터플랜단위)
speed&test 1차목표 accuray&deploy
Quick-win 과제유형 long term view
problem solving 접근방식 problem definition
  • 분석기획 시, 고려사항

1. 데이터 확보&유형에 대한 분석

2. 적절한 기존의 활용방안과, 활용가능한 유스케이스 탐색

3. 장애요소들에 대한 사전계획 수립

 

  •  방법론

1. 폭포수 모델 : Top-down / 이전, 다음 단계간 피드백

2. 나선형 모델 : 반복→검증적 개발, 처음 시도 용이

3. 계층적 프로세스 모델 : 데이터 분석을 위한 방법론

 

  • 빅데이터 분석방법론

 

분석기획 -> 데이터준비-> 데이터분석=? 시스템구현-> 평가&전개

 

※ 분석기획 : 비즈니스 도메인 & 문제점 인식, 분석계획&프로젝트 수행계획 수립 

※ 시스템구현 : 운영중인 시스템에 적용 또는 프로토타입을 구현하고자 하는 경우

 

데이터마이닝

  • 데이터마이닝 프로세스

1. KDD(Knowledge Discovery in Database)분석방법론

1) 데이터 선택

2) 데이터전처리

3) 데이터변환

4) 데이터마이닝

5) 데이터마이닝 결과평가

 

2. CRISP-DM분석(Cross Industry Standard Process form DM)분석방법론

 : 계층적 프로세스 모델로 4개레벨(단계,일반화태스크,세분화태스크,프로세스실행)로 구성

 : 단계간 피드백을 통해 단계별 완성도↑

 

1) 업무이해

  - 업무목적파악, 상황파악, 데이터마이닝목표설정,프로젝트계획수립

 

2) 데이터 이해

 - 초기데이터수집,데이터기술분석,데이터탐색,데이터품질확인

 

3) 데이터 준비

  - 분석용데이터셋선택, 데이터정제,분석용데이터셋편성, 데이터통합, 데이터포맷팅

 

4) 모델링

   - 모델링기법선택,모델테스트계획설계,모델작성,모델평가

5) 평가

- 분석결과평가,모델링과정평가,모델적용성평가

6) 전개(유지보수)

    - 전개계획수립, 모니터링과 유지보수 계획수립, 프로젝트종료보고서 작성, 프로젝트 리뷰

 

  •  분석과제발굴

1. 하향식 접근방식(전통적 방식)

 : 문제가 주어지고, 이에 대한 해법을 찾는 방식

 

2. 상향식 접근방식(생각치 못한 인사이트를 도출하는, 최근(빅데이터) 접근방식)

 : 데이터를 기반으로 문제점을 찾고, 해결방안 탐색



  •  하향식 접근방식

 

: 최적화 & 단기과제 형식

: 현황분석을 통해서, 인식된 문제점, 전략으로부터 기회나 문제를 탐색하고 

  해당문제를 데이터문제로 정의→해결방안탐색→데이터분석의타당성평가→분석과제도출

지도학습/분석적으로사물을인식하려는why강조/문제정형화/데이터완벽시효과적

 

1) 문제탐색단계

: 전체적 관점의 기준모델(기업 내,외부 환경을 포괄하는 비즈니스 모델과 외부참조모델 )을 활용하여 문제도출&식별

2) 문제정의

: 식별된 비즈니스 문제를, 필요한 데이터&기법을 정의하기 위한 데이터 문제로 변환

3) 해결방안 탐색단계

 

 

 

분석기법 및 시스템
how
  분석역량 who
  확보 미확보
기존시스템 기존시스템 개선 활용 교육&채용을 통한 역량확보
신규도입 시스템 고도화 전문업체 sourcing

 

4) 타당성 검토단계

 : 도출된 분석문제나 가설에 대한 대안을 과제화하기 위해서는, 다각적인 타당성 분석(경제성,기술적) 수행되야함.

 

* 특정 업무 영역을 대상으로 주제를 정하여 분석기회를 발굴하는 접근방식

프로세스분류 -> 프로세스 흐름 분석-> 분석요건식별->분석요건 정의

 

 

  • 상향식 접근방식(bottom up Approach)

: 답을 미리내는 것이 아니라, 사물을 있는 그대로 인식하는 what관점

 : 비지도학습 ( 목표값을 사전에 정의하지 않고, 데이터자페만을 가지고, 그룹들 도출로 해석이 용이하지는 않지만,

새로운 유형의 인사이트를 도출하기엔 유용)

 : 인과관계로부터 상관관계 분석으로의 이동이, 빅데이터 분석에서의 주요변화



프로토타이핑 접근법 = 애자일 프로젝트 관심방법 = 시행착오를 통한 문제해결

 

비록 완전하지는 않아도, 해결책/모형 제시함으로써 문제 명확히 인식하고 필요한 데이터를 식별하여 구체화/비지도학습/사물있는그대로 인식하는 what관점

 

* 비즈니스모델이해 -> 비즈니스 모델 상세화 -> 분석유즈케이스 정의

 

 

  • 분석프로젝트 관리방안

: 과제형태로 도출된 분석기회는 프로젝트를 통해서 그 가치를 증명해야 한다. 

분석프로젝트는 일반적인 IT프로젝트처럼 범위, 일정, 품질, 이슈/리스크, 의사소통 등 영역별 관리가 수행되어야 할 뿐 아니라, 데이터를 다루면서 분석모델을 생성하는 특성상 Size, Complexity, Speed, Model Complexity, Accuracy&Precision 등 5가지의 추가적인 중점관리 영역에 대한 고려 필요. 

 

: 분석가의 경우, 비즈니스 영역과 데이터 영역의 중재자로써, 주로 분석 프로젝트의 관리자 역할을 수행하는 경우가 많기 때문에, 영역별 관리포인트를 사전에 이해하고, 적용하는 것이 pjt의 성공가능성↑



분석과제

  • 마스터플랜
우선순위고려요소 고려해서 적용우선순위 설정 적용범위/방식 고려요소 Analyics
구현
로드맵
수립
전략적중요도 업무내재화 적용수준
비즈니스성과/roi 분석데이터 적용수준
실행용이성 기술 적용 수준

 

3v (volume, variery, velocity ) -> 투자비용 요소 -> 난이도 (데이터 획득/저장/가공비용, 분석적용비용, 분석수준)

4V (3V + value ) -> 비지니스화 -> 시급성 ( 전략적 중요도, KPI)

 

  •  분석 과제 우선순위 선정 & 조정 결과
Difficult 1 2
난이도    
3 4
Easy/현재 시급성 미래
  • 분석과제 정의

의사결정지연시간,

데이터지연시간, 분석지연시간, 의사결정지연시간

비즈니스가치가 높고, 시간이 적을수록 : 데이터 지연 시간

비즈니스가치가 낮아지면서, 시간이 길수록 : 분석지연시간 => 의사결정지연시간

비즈니스가치가 낮고, 간이 길수록 : 대응하기 위한 액션

 

  •  분석 거버넌스 체계 구성요소

process 과제기획/운영프로세스

system IT시스템/ 프로그램

data 데이터 거버넌스

HR 분석교육/마인드육성 체계

organization 분석기획/관리&추진 조직

  • 데이터거버넌스의 구성요소

1. 원칙 : 데이터 유지관리 위한 지침과 가이드

2. 조직 : 데이터 관리할 조직의 역할과 책임

3. 프로세스 : 데이터 관리를 위한 활동과 체계

 

  • 데이터 거버넌스 체계

데이터관리체계 : 메타데이터와 관리원칙수립

데이터 저장소 관리 : 데이터 관리 위한 전사 저장소 구축

표준화 활동 : 표준준수여부 점검

데이터 표준화 : 표준용어 설정, 메타데이터 등 구축

 

  •  분석수준 진단 결과 / 사분면 분석

도입 ->활용 ->확산 -> 최적화

 

- 사분면 분석

 

도입형 (준비 고, 성숙 저) : 활용하는 분석업무, 기법 등은 부족. 적용조직 등 준비도는 높아 바로 도입 가능

 

확산형 (준비 고, 성숙 고) : 기업에 필요한 6가지 분석 구성요소 갖춤. 부분적 도입되어 지속확산필요

 

정착형 (준비 저, 성숙 고) : 조직/인력/분석업무/기법 등을 내부에서 제한적 사용

 

준비형 (준비 저, 성숙 저) : 사전준비 필요

 

 

데이터분석조직 

  •  데이터 분석 조직 및 인력

집중구조 : 별도의 분석 전담 조직에서 담당

기능구조 : 분석조직 없고, 해당업무 부서에서 업무 수행

분산구조 : 부서내에 배치하여 분석 업무

 

  •  비즈니스 모델 이해

비즈니스 컨텍스트(환경)분석

 

주요트렌드 : 기술/규제/경제/사회문화 트렌드

시장요인 : 마켓이슈,마켓세그먼트, 니즈와수요 , 전환비용, 기대수익

거시경제요익 : 글로벌시장 환경, 자본시장, 원자재 다른 지원, 경제인프라

산업요인 : 기존경쟁사, 신규진입사, 대체상품/서비스, 공급자/기타/value chain내 주체들, 이해당사자

 

댓글