본문 바로가기

전체 글32

2과목 데이터 처리 기술 이해/3과목 데이터 분석 기획 과목2 데이터 처리 기술 이해 1장 데이터 처리 프로세스 1절 ETL , ODS ETL(Extraction, Transformation and Load) : 통합, 이동, 관리 Batch ETL과 Real Time ETL Source -> ODS -> DWH -> Data Mart Extraction추출: 데이터 원천Source에서 데이터 획득, Transformation변형: 데이터 클렌징, 형식변환,표준화, 통합 Loading적재: 특정 목표 시스템에 적재 ODS(Operational Data Store): 추가 작업을 위해 데이터 소스들로부터 추출,통합한 데이터 베이스 Interface 단계: 데이터 획득, OLEDB(Object Linking and Embedding Database), ODBC(.. 2022. 2. 23.
1과목 데이터 이해와 5과목 시각화부분 과목 1 데이터 이해 1장 데이터의 이해 데이터 : 추론과 추정의 근거를 이루는 사실 - 객관적 사실이라는 존재적 특성 갖는 동시에 추론/예측/전망/추정을 위한 근거 정성적 데이터 : 언어, 문자 등 정량적 데이터 : 수치, 도형, 기호 등 지식화 - 암묵지(공통화, 내면화) -> 형식지(표출화,연결화) 데이터Data -> 정보Information -> 지식Knowledge -> 지혜Wisdom 데이터 베이스 정의 : 문자,기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체 데이터 베이스 + 데이터베이스 시스템DBMS(SW) 데이터베이스 특징 : 통합된 데이터, 저장된 데.. 2022. 2. 21.
4과목 데이터 분석 심층 요약 정리 과목 4. 데이터 분석 1장 R 기초와 데이터 마트 1절 R 기초 : R 특징 - 그래픽 처리, 데이터 처리 및 계산 능력, 패키지 R 설치하기 R 패키지 설치 install.packages(‘패키지 이름’) library(패키지 이름) ?par help(par) R 데이터 구조 : 벡터, 행렬, 데이터 프레임, 데이터불러오기 read.table(‘.csv’, header=T, sep=‘,’) rep(1,3) seq(1,3)…. 2절 데이터 마트 R reshape를 활용한 데이터 마트 개발 : Reshape melt와 cast를 이용해 데이터를 재구성하거나 밀집화 된 데이터를 생성 Sqldf SQL에서 사용하는 쿼리 문장 사용 가능 Plyr 데이터 분리 다시 결함 등 처리 기능 ddply, ply 등 데.. 2022. 2. 19.
ADP필기 복기 ADP 필기 복기문제 정리 문제가 돌아다니는 것만 추려보겠습니다. 군집과 분류의 차이? 다중공선성 - 상관계수 일정함 상관없다 ? wage Mape - 0.45 vs 0.1 (정답은 0.45 ?) 비행기, 쿠폰할인 문제 - 기출에 할인쿠폰 관련 문제가 있었는데, 유의깊게 봐주세요. 다음중 기법 활용분야가 나머지와 다른 하나는 찾아보세요. 1. 로지스틱회귀분석.인공신경망.의사결정나무 2. SOM - 비지도학습 다중회귀분석에서는, 보통 자료수 구할 때 df+1로 하는데, 다중회귀는 df+1+k도 해야합니다.4+8+1 서술형은, 부스팅이나 k-fold 설명하거나, 회귀분석 관련된 문제들이 나옵니다. 1. 다음과 같은 추출 방식을 보고 어떤 방식인지 명칭을 쓰고 설명하라. 1-가) (a) 명칭: 홀드아웃 (b).. 2022. 2. 19.