데이터 분석 기획 요약
분석기획
- 분석기획
- 실제 분석을 수행하기에 앞서 분석을 수행할 과제의 정의&의도했던 결과를 도출할 수 있도록
이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업
- 어떠한 목표(what)를 달성하기 위하여, 어떠한 데이터를 가지고, 어떤 방식을(how) 수행할 지에 대한
일련의 계획을 수립하는 작업
1. 특정한 분석주제를 대상으로 진행할 경우, How.
분석방법 how | Known | Un-known | |
know | Optimization | insight | |
un-know | Solution | descovery |
- 2. ahrvytlwjaquf qnstjrrlghlrqkddks
당면한 분석주제의 해결(과제단위) | 지속적분석문화 내재화(마스터플랜단위) | |
speed&test | 1차목표 | accuray&deploy |
Quick-win | 과제유형 | long term view |
problem solving | 접근방식 | problem definition |
- 분석기획 시, 고려사항
1. 데이터 확보&유형에 대한 분석
2. 적절한 기존의 활용방안과, 활용가능한 유스케이스 탐색
3. 장애요소들에 대한 사전계획 수립
- 방법론
1. 폭포수 모델 : Top-down / 이전, 다음 단계간 피드백
2. 나선형 모델 : 반복→검증적 개발, 처음 시도 용이
3. 계층적 프로세스 모델 : 데이터 분석을 위한 방법론
- 빅데이터 분석방법론
분석기획 -> 데이터준비-> 데이터분석=? 시스템구현-> 평가&전개
※ 분석기획 : 비즈니스 도메인 & 문제점 인식, 분석계획&프로젝트 수행계획 수립
※ 시스템구현 : 운영중인 시스템에 적용 또는 프로토타입을 구현하고자 하는 경우
데이터마이닝
- 데이터마이닝 프로세스
1. KDD(Knowledge Discovery in Database)분석방법론
1) 데이터 선택
2) 데이터전처리
3) 데이터변환
4) 데이터마이닝
5) 데이터마이닝 결과평가
2. CRISP-DM분석(Cross Industry Standard Process form DM)분석방법론
: 계층적 프로세스 모델로 4개레벨(단계,일반화태스크,세분화태스크,프로세스실행)로 구성
: 단계간 피드백을 통해 단계별 완성도↑
1) 업무이해
- 업무목적파악, 상황파악, 데이터마이닝목표설정,프로젝트계획수립
2) 데이터 이해
- 초기데이터수집,데이터기술분석,데이터탐색,데이터품질확인
3) 데이터 준비
- 분석용데이터셋선택, 데이터정제,분석용데이터셋편성, 데이터통합, 데이터포맷팅
4) 모델링
- 모델링기법선택,모델테스트계획설계,모델작성,모델평가
5) 평가
- 분석결과평가,모델링과정평가,모델적용성평가
6) 전개(유지보수)
- 전개계획수립, 모니터링과 유지보수 계획수립, 프로젝트종료보고서 작성, 프로젝트 리뷰
- 분석과제발굴
1. 하향식 접근방식(전통적 방식)
: 문제가 주어지고, 이에 대한 해법을 찾는 방식
2. 상향식 접근방식(생각치 못한 인사이트를 도출하는, 최근(빅데이터) 접근방식)
: 데이터를 기반으로 문제점을 찾고, 해결방안 탐색
- 하향식 접근방식
: 최적화 & 단기과제 형식
: 현황분석을 통해서, 인식된 문제점, 전략으로부터 기회나 문제를 탐색하고
해당문제를 데이터문제로 정의→해결방안탐색→데이터분석의타당성평가→분석과제도출
지도학습/분석적으로사물을인식하려는why강조/문제정형화/데이터완벽시효과적
1) 문제탐색단계
: 전체적 관점의 기준모델(기업 내,외부 환경을 포괄하는 비즈니스 모델과 외부참조모델 )을 활용하여 문제도출&식별
2) 문제정의
: 식별된 비즈니스 문제를, 필요한 데이터&기법을 정의하기 위한 데이터 문제로 변환
3) 해결방안 탐색단계
분석기법 및 시스템 how |
분석역량 who | ||
확보 | 미확보 | ||
기존시스템 | 기존시스템 개선 활용 | 교육&채용을 통한 역량확보 | |
신규도입 | 시스템 고도화 | 전문업체 sourcing |
4) 타당성 검토단계
: 도출된 분석문제나 가설에 대한 대안을 과제화하기 위해서는, 다각적인 타당성 분석(경제성,기술적) 수행되야함.
* 특정 업무 영역을 대상으로 주제를 정하여 분석기회를 발굴하는 접근방식
프로세스분류 -> 프로세스 흐름 분석-> 분석요건식별->분석요건 정의
- 상향식 접근방식(bottom up Approach)
: 답을 미리내는 것이 아니라, 사물을 있는 그대로 인식하는 what관점
: 비지도학습 ( 목표값을 사전에 정의하지 않고, 데이터자페만을 가지고, 그룹들 도출로 해석이 용이하지는 않지만,
새로운 유형의 인사이트를 도출하기엔 유용)
: 인과관계로부터 상관관계 분석으로의 이동이, 빅데이터 분석에서의 주요변화
프로토타이핑 접근법 = 애자일 프로젝트 관심방법 = 시행착오를 통한 문제해결
비록 완전하지는 않아도, 해결책/모형 제시함으로써 문제 명확히 인식하고 필요한 데이터를 식별하여 구체화/비지도학습/사물있는그대로 인식하는 what관점
* 비즈니스모델이해 -> 비즈니스 모델 상세화 -> 분석유즈케이스 정의
- 분석프로젝트 관리방안
: 과제형태로 도출된 분석기회는 프로젝트를 통해서 그 가치를 증명해야 한다.
분석프로젝트는 일반적인 IT프로젝트처럼 범위, 일정, 품질, 이슈/리스크, 의사소통 등 영역별 관리가 수행되어야 할 뿐 아니라, 데이터를 다루면서 분석모델을 생성하는 특성상 Size, Complexity, Speed, Model Complexity, Accuracy&Precision 등 5가지의 추가적인 중점관리 영역에 대한 고려 필요.
: 분석가의 경우, 비즈니스 영역과 데이터 영역의 중재자로써, 주로 분석 프로젝트의 관리자 역할을 수행하는 경우가 많기 때문에, 영역별 관리포인트를 사전에 이해하고, 적용하는 것이 pjt의 성공가능성↑
분석과제
- 마스터플랜
우선순위고려요소 | 고려해서 적용우선순위 설정 | 적용범위/방식 고려요소 | Analyics 구현 로드맵 수립 |
전략적중요도 | 업무내재화 적용수준 | ||
비즈니스성과/roi | 분석데이터 적용수준 | ||
실행용이성 | 기술 적용 수준 |
3v (volume, variery, velocity ) -> 투자비용 요소 -> 난이도 (데이터 획득/저장/가공비용, 분석적용비용, 분석수준)
4V (3V + value ) -> 비지니스화 -> 시급성 ( 전략적 중요도, KPI)
- 분석 과제 우선순위 선정 & 조정 결과
Difficult | 1 | 2 |
난이도 | ||
3 | 4 | |
Easy/현재 | 시급성 | 미래 |
- 분석과제 정의
의사결정지연시간,
데이터지연시간, 분석지연시간, 의사결정지연시간
비즈니스가치가 높고, 시간이 적을수록 : 데이터 지연 시간
비즈니스가치가 낮아지면서, 시간이 길수록 : 분석지연시간 => 의사결정지연시간
비즈니스가치가 낮고, 간이 길수록 : 대응하기 위한 액션
- 분석 거버넌스 체계 구성요소
process 과제기획/운영프로세스
system IT시스템/ 프로그램
data 데이터 거버넌스
HR 분석교육/마인드육성 체계
organization 분석기획/관리&추진 조직
- 데이터거버넌스의 구성요소
1. 원칙 : 데이터 유지관리 위한 지침과 가이드
2. 조직 : 데이터 관리할 조직의 역할과 책임
3. 프로세스 : 데이터 관리를 위한 활동과 체계
- 데이터 거버넌스 체계
데이터관리체계 : 메타데이터와 관리원칙수립
데이터 저장소 관리 : 데이터 관리 위한 전사 저장소 구축
표준화 활동 : 표준준수여부 점검
데이터 표준화 : 표준용어 설정, 메타데이터 등 구축
- 분석수준 진단 결과 / 사분면 분석
도입 ->활용 ->확산 -> 최적화
- 사분면 분석
도입형 (준비 고, 성숙 저) : 활용하는 분석업무, 기법 등은 부족. 적용조직 등 준비도는 높아 바로 도입 가능
확산형 (준비 고, 성숙 고) : 기업에 필요한 6가지 분석 구성요소 갖춤. 부분적 도입되어 지속확산필요
정착형 (준비 저, 성숙 고) : 조직/인력/분석업무/기법 등을 내부에서 제한적 사용
준비형 (준비 저, 성숙 저) : 사전준비 필요
데이터분석조직
- 데이터 분석 조직 및 인력
집중구조 : 별도의 분석 전담 조직에서 담당
기능구조 : 분석조직 없고, 해당업무 부서에서 업무 수행
분산구조 : 부서내에 배치하여 분석 업무
- 비즈니스 모델 이해
비즈니스 컨텍스트(환경)분석
주요트렌드 : 기술/규제/경제/사회문화 트렌드
시장요인 : 마켓이슈,마켓세그먼트, 니즈와수요 , 전환비용, 기대수익
거시경제요익 : 글로벌시장 환경, 자본시장, 원자재 다른 지원, 경제인프라
산업요인 : 기존경쟁사, 신규진입사, 대체상품/서비스, 공급자/기타/value chain내 주체들, 이해당사자
'데이터 분석 개념 정리' 카테고리의 다른 글
ADP 필기 4. 데이터 분석 요약 정리 2 (0) | 2022.01.24 |
---|---|
ADP 필기 4. 데이터 분석 요약 정리 1 (0) | 2022.01.23 |
ADP 필기 3. 데이터 분석 기획 (0) | 2022.01.22 |
ADP 필기 2. 데이터처리기술이해/3. 데이터분석기획 (0) | 2022.01.22 |
ADP 필기 2. 데이터 처리 기술 이해 2 (0) | 2022.01.21 |
댓글