본문 바로가기
데이터 분석 개념 정리

ADP필기 1. 데이터의 이해 요약 1

by 코드챌린지 2022. 1. 19.

ADP 필기 준비하면서, 데이터의 이해 부분 요약해봅니다.

 

ADP 데이터의 이해 요약

데이터 정의

  • 데이터의 정의

데이터는 ‘객관적 사실’

개별 데이터 자체로는 의미 X, 상호 관계 속에서 가치를 가짐

추론·전망 등의 근거로 기능 (당위적 특성)

 

  • 정성적 데이터 vs 정량적 데이터

정성적 데이터 : 언어, 문자 등 ex) 특성에 대한 설명

정량적 데이터 : 수치, 도형, 기호 ex) 몸무게, 주가

 

  • 암묵지=(상호작용 : 조직차원에서 조직원 지식 공유, 발전)=형식지

지식경영 : 지식을 창출, 저장, 전이, 적용하기 위해 조직에서 개발한 일련의 비즈니스 프로세스

암묵지 : 학습과 체험을 통해 습득

형식지 : 책, 메뉴얼 등

 

  • 내면화 된 지식을, 조직의 지식으로 공통화 하기 위해서는 개인의 암묵지를 기호, 숫자 등을 표츌화하고, 이를 다시 다른 개인 지식에 연결화

 

  • SECI 모델

공통화 -> 표출화 -> 연결화 -> 내면화

예시)

 

공통화 : 말로 알려주는 것

표출화 : 책으로 써내는 것

연결화 : 책에 내용을 추가하는 것

내면화 : 책을 통해 지식을 습득하는 것

 

  • DIKW 피라미드

Data -> Information -> Knowledge -> Wisdom

 

데이터 : 순수한 수치나 기호 ex) A 마트에서는 깻잎이 1000원, B 마트에선 깻잎이 1500원

정보 : 의미를 부여 ex) A마트가 깻잎이 더 싸다

지식 : 이를 토대로 예측 ex) A마트에서 깻잎을 사야겠다. (미래형)

지혜 : 이를 통해 도출되는 아이디어 ex) A마트가 야채가 더 쌀 것이다.

 

데이터베이스

  • 데이터베이스 특징

1) 통합된 데이터 : 데이터의 중복이 없음을 의미

2) 저장된 데이터 : 디스크 등의 저장매체에 저장되는 것을 의미

3) 공용 데이터 : 여러 사용자가 데이터베이스의 데이터를 공동 이용한다.

4) 변화되는 데이터 : 추가, 삭제, 갱신으로 변화하면서도 항상 현재의 정확한 데이터 상태를 유지

 

 

  • 데이터베이스 VS DBMS

데이터베이스 : 체계적으로 정렬된 데이터 집합

DBMS : 이용자가 쉽게 데이터베이스를 구축하고 유지할 수 있도록 하는 SW

 

  • 데이터베이스 설계 절차

요구조건 분석 / 명세서 작성

개념적 설계

논리적 설계

물리적 설계

 

 

 

  • 데이터베이스 활용 기술

OLTP : 온라인 거래처리

OLAP : 온라인 분석처리

CRM : 고객관계관리

SCM : 공급망계획

ERP(Enterprise Resource Planning)

BI(Business Intelligence)

BA(Business Analytics) : BI보다 진보된 형태, 통찰에 초점을 둠

EAI : 기업 애플리케이션 통합

KMS : 지식관리시스템

VAN : 부가가치통신망

NGIS : 국가지리정보체계

ITS : 지능형교통시스템

EDI : 서로 합의된 표준에 따라 전자문서를 통신을 통해 상호 교환하는 것

DW : 데이터 웨어하우스, 전사적인 규모 (데이터마트는 사업부 단위의 소규모)

 

 +특징 : 주제지향성, 통합성, 시계열성, 비휘발성

 

 

  • 사회기반 구조로서의 데이터베이스

물류부문, 지리부문, 교통부문, 의료부문, 교육부문

 

  • 빅데이터의 정의 / 데이터의 변화

3V : Volume(규모), Variety(다양성), Velocity(속도) + Value(4V)

 

  • 기술변화

새로운 데이터 처리, 저장, 분석기술, 아키텍처

클라우드 컴퓨팅 활용

 

  • 인재,조직,변화

DataScientist 같은 새로운 인재 필요

데이터 중심 조직

-> 기존 방식으로 얻을 수 없었던 통찰&가치창출

-> 사업방식, 시장, 사회, 정부 등에서 변화와 혁신 주도

 

  • 빅데이터의 비유

석탄과 철, 원유, 렌즈, 플랫폼

 

  • 빅데이터가 만드는 변화

사전처리 -> 사후처리

표본조사 -> 전수조사

질 -> 양

인과관계 -> 상관관계

 

 

  • 데이터 유형

정형데이터 : RDB, 스프레드시트 등

반정형데이터: HTML, 웹로그 XML 등

비정형데이터 : 오디오, 텍스트, 이미지 등

 

 

  • 빅데이터 활용

연관규칙학습

유전알고리즘

기계학습

회귀분석

사회관계망분석(SNA)

 

 

  • 위기와 방안

사생활 침해 -> 동의에서 책임으로

책임 원칙의 훼손 -> 책임 원칙을 강화

데이터 오용 

 

 

 

  • 빅데이터 3요소

데이터, 기술, 인력

 

 

 

데이터사이언티스트

  • 데이터 사이언스 3요소

IT, Analytics, 비즈니스 분석

 

 

  • 데이터 사이언티스트 요구 역량

하드 스킬 : 빅데이터에 대한 지식, 분석 기술에 대한 숙련 (데이터 관리, 모델링, 비즈니스 분석)

소프트 스킬 : 통찰력, 호기심, 창의적 사고, 스토리텔링, 시각화, 커뮤니케이션 능력

 

 

  • 가치 패러다임 변화

1. 디지털화 (과거)

2. 연결 (현재)

3. Agency (미래)

 

 

  • SQL

DML - SELECT, INSERT, UPDATE, DELETE

DDL - CREATE, DROP, ALTER, TRUNCATE

DCL - GRANT, REVOKE

TCL - COMMIT, ROLLBACK

 

댓글