2과목 데이터 처리 기술 이해/3과목 데이터 분석 기획
과목2 데이터 처리 기술 이해 1장 데이터 처리 프로세스 1절 ETL , ODS ETL(Extraction, Transformation and Load) : 통합, 이동, 관리 Batch ETL과 Real Time ETL Source -> ODS -> DWH -> Data Mart Extraction추출: 데이터 원천Source에서 데이터 획득, Transformation변형: 데이터 클렌징, 형식변환,표준화, 통합 Loading적재: 특정 목표 시스템에 적재 ODS(Operational Data Store): 추가 작업을 위해 데이터 소스들로부터 추출,통합한 데이터 베이스 Interface 단계: 데이터 획득, OLEDB(Object Linking and Embedding Database), ODBC(..
2022. 2. 23.
1과목 데이터 이해와 5과목 시각화부분
과목 1 데이터 이해 1장 데이터의 이해 데이터 : 추론과 추정의 근거를 이루는 사실 - 객관적 사실이라는 존재적 특성 갖는 동시에 추론/예측/전망/추정을 위한 근거 정성적 데이터 : 언어, 문자 등 정량적 데이터 : 수치, 도형, 기호 등 지식화 - 암묵지(공통화, 내면화) -> 형식지(표출화,연결화) 데이터Data -> 정보Information -> 지식Knowledge -> 지혜Wisdom 데이터 베이스 정의 : 문자,기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체 데이터 베이스 + 데이터베이스 시스템DBMS(SW) 데이터베이스 특징 : 통합된 데이터, 저장된 데..
2022. 2. 21.
4과목 데이터 분석 심층 요약 정리
과목 4. 데이터 분석 1장 R 기초와 데이터 마트 1절 R 기초 : R 특징 - 그래픽 처리, 데이터 처리 및 계산 능력, 패키지 R 설치하기 R 패키지 설치 install.packages(‘패키지 이름’) library(패키지 이름) ?par help(par) R 데이터 구조 : 벡터, 행렬, 데이터 프레임, 데이터불러오기 read.table(‘.csv’, header=T, sep=‘,’) rep(1,3) seq(1,3)…. 2절 데이터 마트 R reshape를 활용한 데이터 마트 개발 : Reshape melt와 cast를 이용해 데이터를 재구성하거나 밀집화 된 데이터를 생성 Sqldf SQL에서 사용하는 쿼리 문장 사용 가능 Plyr 데이터 분리 다시 결함 등 처리 기능 ddply, ply 등 데..
2022. 2. 19.