ADP 필기 준비하면서, 데이터의 이해 부분 요약해봅니다.
ADP 데이터의 이해 요약
데이터 정의
- 데이터의 정의
데이터는 ‘객관적 사실’
개별 데이터 자체로는 의미 X, 상호 관계 속에서 가치를 가짐
추론·전망 등의 근거로 기능 (당위적 특성)
- 정성적 데이터 vs 정량적 데이터
정성적 데이터 : 언어, 문자 등 ex) 특성에 대한 설명
정량적 데이터 : 수치, 도형, 기호 ex) 몸무게, 주가
- 암묵지=(상호작용 : 조직차원에서 조직원 지식 공유, 발전)=형식지
지식경영 : 지식을 창출, 저장, 전이, 적용하기 위해 조직에서 개발한 일련의 비즈니스 프로세스
암묵지 : 학습과 체험을 통해 습득
형식지 : 책, 메뉴얼 등
- 내면화 된 지식을, 조직의 지식으로 공통화 하기 위해서는 개인의 암묵지를 기호, 숫자 등을 표츌화하고, 이를 다시 다른 개인 지식에 연결화
- SECI 모델
공통화 -> 표출화 -> 연결화 -> 내면화
예시)
공통화 : 말로 알려주는 것
표출화 : 책으로 써내는 것
연결화 : 책에 내용을 추가하는 것
내면화 : 책을 통해 지식을 습득하는 것
- DIKW 피라미드
Data -> Information -> Knowledge -> Wisdom
데이터 : 순수한 수치나 기호 ex) A 마트에서는 깻잎이 1000원, B 마트에선 깻잎이 1500원
정보 : 의미를 부여 ex) A마트가 깻잎이 더 싸다
지식 : 이를 토대로 예측 ex) A마트에서 깻잎을 사야겠다. (미래형)
지혜 : 이를 통해 도출되는 아이디어 ex) A마트가 야채가 더 쌀 것이다.
데이터베이스
- 데이터베이스 특징
1) 통합된 데이터 : 데이터의 중복이 없음을 의미
2) 저장된 데이터 : 디스크 등의 저장매체에 저장되는 것을 의미
3) 공용 데이터 : 여러 사용자가 데이터베이스의 데이터를 공동 이용한다.
4) 변화되는 데이터 : 추가, 삭제, 갱신으로 변화하면서도 항상 현재의 정확한 데이터 상태를 유지
- 데이터베이스 VS DBMS
데이터베이스 : 체계적으로 정렬된 데이터 집합
DBMS : 이용자가 쉽게 데이터베이스를 구축하고 유지할 수 있도록 하는 SW
- 데이터베이스 설계 절차
요구조건 분석 / 명세서 작성
개념적 설계
논리적 설계
물리적 설계
- 데이터베이스 활용 기술
OLTP : 온라인 거래처리
OLAP : 온라인 분석처리
CRM : 고객관계관리
SCM : 공급망계획
ERP(Enterprise Resource Planning)
BI(Business Intelligence)
BA(Business Analytics) : BI보다 진보된 형태, 통찰에 초점을 둠
EAI : 기업 애플리케이션 통합
KMS : 지식관리시스템
VAN : 부가가치통신망
NGIS : 국가지리정보체계
ITS : 지능형교통시스템
EDI : 서로 합의된 표준에 따라 전자문서를 통신을 통해 상호 교환하는 것
DW : 데이터 웨어하우스, 전사적인 규모 (데이터마트는 사업부 단위의 소규모)
+특징 : 주제지향성, 통합성, 시계열성, 비휘발성
- 사회기반 구조로서의 데이터베이스
물류부문, 지리부문, 교통부문, 의료부문, 교육부문
- 빅데이터의 정의 / 데이터의 변화
3V : Volume(규모), Variety(다양성), Velocity(속도) + Value(4V)
- 기술변화
새로운 데이터 처리, 저장, 분석기술, 아키텍처
클라우드 컴퓨팅 활용
- 인재,조직,변화
DataScientist 같은 새로운 인재 필요
데이터 중심 조직
-> 기존 방식으로 얻을 수 없었던 통찰&가치창출
-> 사업방식, 시장, 사회, 정부 등에서 변화와 혁신 주도
- 빅데이터의 비유
석탄과 철, 원유, 렌즈, 플랫폼
- 빅데이터가 만드는 변화
사전처리 -> 사후처리
표본조사 -> 전수조사
질 -> 양
인과관계 -> 상관관계
- 데이터 유형
정형데이터 : RDB, 스프레드시트 등
반정형데이터: HTML, 웹로그 XML 등
비정형데이터 : 오디오, 텍스트, 이미지 등
- 빅데이터 활용
연관규칙학습
유전알고리즘
기계학습
회귀분석
사회관계망분석(SNA)
- 위기와 방안
사생활 침해 -> 동의에서 책임으로
책임 원칙의 훼손 -> 책임 원칙을 강화
데이터 오용
- 빅데이터 3요소
데이터, 기술, 인력
데이터사이언티스트
- 데이터 사이언스 3요소
IT, Analytics, 비즈니스 분석
- 데이터 사이언티스트 요구 역량
하드 스킬 : 빅데이터에 대한 지식, 분석 기술에 대한 숙련 (데이터 관리, 모델링, 비즈니스 분석)
소프트 스킬 : 통찰력, 호기심, 창의적 사고, 스토리텔링, 시각화, 커뮤니케이션 능력
- 가치 패러다임 변화
1. 디지털화 (과거)
2. 연결 (현재)
3. Agency (미래)
- SQL
DML - SELECT, INSERT, UPDATE, DELETE
DDL - CREATE, DROP, ALTER, TRUNCATE
DCL - GRANT, REVOKE
TCL - COMMIT, ROLLBACK
'데이터 분석 개념 정리' 카테고리의 다른 글
ADP 필기 2. 데이터 처리 기술 이해 2 (0) | 2022.01.21 |
---|---|
ADP 2. 데이터 처리 기술 이해 (0) | 2022.01.21 |
ADP 필기 1과목 요약 (0) | 2022.01.20 |
ADP 필기 - 데이터의 이해 3 (0) | 2022.01.20 |
ADP필기 1. 데이터의 이해 요약 2 (0) | 2022.01.19 |
댓글