본문 바로가기
데이터 분석 개념 정리

ADP 필기 - 데이터의 이해 3

by 코드챌린지 2022. 1. 20.

 2. 빅데이터의 가치와 영향 

 1) 빅데이터의 가치 

 빅데이터 가치 산정이 어려운 이유 

 

  데이터 활용방식  : 데이터 활용 방식에서는 재사용이나 재조합, 다목적용 데이터 개발 등이 일반화되면서 특정 데이터를 언제, 어디서, 누가 활용할지 알 수 없게 되어 가치 산정이 어려움 

 

  새로운 가치 창출  : 빅데이터 시대에는 데이터가 기존의 없던 가치를 창출함에 따라 그 가치를 측정하기 어려움 

 

  분석 기술 발전  : 현재는 가치가 없는 데이터일지라도, 추후에 새로운 분석 기법이 등장한다면 거대한 가치를 지닌 데이터가 될 수도 있기 때문에 가치 산정이 어려움 

 

 

 2) 빅데이터의 영향 

 다양한 시장 주체들(기업, 정부, 개인)이 빅데이터를 활용함에 따라 소비자이면서 국민인 일반일들은 맞춤형 서비스를 저렴한 비용으로 이용하게 되고, 적시에 필요한 정보를 얻음으로써 다양한 형태로 기회 비용을 절약할 수 있어 사람들의 생활이 점점 스마트 해짐 

  기업 : 혁신, 경쟁력제고, 생산성향상  - 빅데이터를 활용해 소비자의 행동을 분석하고 시장 변동을 예측해 비즈니스 모델을 혁신하거나 신사업을 발굴함 

  정부 : 환경 탐색, 상황분석, 미래대응  - 기상, 인구이동, 각종 통계, 법제 데이터 등을 수집해 사회 변화를 추정하여, 관련 정보를 추출함 

  개인 : 목적에 따른 활용  - 빅데이터를 서비스하는 기업의 출현이 늘어나면서, 데이터 분석 비용이 지속적으로 하락하여 정치인이나 대중 가수 등과 같은 개인도 인지도 향상에 빅데이터를 활용함 

 

   

 3. 비즈니스 모델 

 1) 빅데이터 활용 사례 

 

 기업 

 - 구글은 사용자의 로그 데이터를 활용하여 검색 서비스를 개선 

 - 월마트는 고객의 구매 패턴을 분석하여 상품 진열에 활용 

 

 

 정부 

 - 실시간 교통 정보, 기후 정보, 각종 지질 활동, 소방 서비스 등 다양한 국가 안전 확보 활동을 위해 실시간 모니터링을 활용 

 - 미래 의제인 의료와 교육 개선을 위해 빅데이터를 활용해 해결책을 모색 

 

 

 개인 

 - 정치인은 선거 승리를 위해 사회관계망 분석을 통해 유세 지역을 선정, 효과적인 선거 활동을 함 

 - 가수는 팬들의 음악 청취 기록 분석을 통해 공연에서 부를 노래 순서를 짜는데 활용 

 

 

 2) 빅데이터 활용 기본 테크닉 

 

  연관규칙학습  : 변인들 간에 주목할 만한 상관관계가 있는지를 찾아내는 방법 (커피를 구매하는 사람이 탄산음료를 더 많이 사는가?) 

 

 

  유형분석  : 문서를 분류하거나 조직을 그룹으로 나눌 때나 온라인 수강생들을 특성에 따라 분류할 때 사용 (이 사용자는 어떤 특성을 가진 집단에 속하는가?) 

 

 

  유전자 알고리즘  : 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 메커니즘을 통해 점진적으로 진화시켜 나가는 방법 (최대의 시청률을 얻으려면 어떤 프로그램을 어떤 시간대에 방송해야 하는가?) 

 

 

  기계학습  : 훈련 데이터로부터 학습한 알려진 특성을 활용해 예측하는 방법 (기존의 시청 기록을 바탕으로 시청자가 현재 보유한 영화 중에서 어떤 것을 가장 보고 싶어할까?) 

 

 

  회귀분석  : 독립변수를 조작하여, 종속변수가 어떻게 변하는지를 보면서 두 변인의 관계를 파악할 때 사용 (구매자의 나이가 구매 차량의 타입에 어떤 영향을 미치는가?) 

 

 

  감성분석  : 특정 주제에 대해 말하거나 글을 쓴 사람의 감정을 분석 (새로운 환불 정책에 대한 고객의 평가는 어떤가?) 

 

 

  소셜네트워크분석  : 특정인과 다른 사람이 몇 촌 정도의 관계인가를 파악할 때 사용하고, 영향력있는 사람을 찾아낼 때 사용 (고객들 간 관계망은 어떻게 구성되어 있나?) 

 

 

   

 4. 위기 요인과 통제 방안 

 1) 빅데이터 시대의 위기 요인 

 

 

  사생활 침해 - 개인정보가 포함된 데이터를 목적 외에 활용할 경우 사생활 침해를 넘어 사회, 경제적 위협으로 변형 - 예) 여행 사실을 트윗한 사람의 집을 강도가 노림 

 

 

  책임 원칙 훼손 - 빅데이터 기본 분석과 예측 기술의 발전으로 분석 대상이 되는 사람들은 예측 알고리즘의 희생양으로 될 가능성 존재 - 민주주의 국가에서 잠재적인 위협이 아닌 명확한 결과에 대한 책임을 묻고 있는 원리를 훼손할 가능성 존재 - 예) 영화 "마이너리티 리포트"와 같이 범행을 저지르기 전에 체포하는 경우, 자신의 신용도와 무관하게 부당하게 대출을 거절되는 경우 

 

 

  데이터 오용 - 데이터의 의존하여 잘못된 미래를 예측할 경우, 잘못된 지표를 사용하는 경우 - 예) 베트남 전쟁에서, 적국 사망자 수를 전쟁의 진척상황으로 나타내는 지표로 활용, 전쟁 상황을 오보하는 결과 

 

 

 2) 위기 요인에 따른 통제 방안 

 

  동의에서 책임으로 - 빅데이터에 의해 사생활 침해 문제를 해결하기 부족하기 때문에, 개인정보를 사용하는 사용자의 "책임"으로 해결하는 방안 제시 - 기대효과 : 개인정보 유출로 발생하는 피해를 사용자가 책임을 지게됨으로써 사용주체의 적극적인 보호장치를 강구 

 

 

  결과 기반 책임 원칙 고수 - 기존의 원칙을 좀 더 보강하고 강화할 필요가 있으며, 예측 자료에 의한 불이익을 당할 가능성을 최소화 하는 장치가 필요 - 기대효과 : 잘못된 예측 알고리즘을 통한 판단을 근거로 불이익을 줄 수 없으며, 이에 따른 피해를 최소화 하는 장치를 마련해야 함 

 

 

  알고리즘 접근 허용 - "알고리즘에 대한 접근권"을 제공하여 예측 알고리즘의 부당함을 반증할 수 있는 방법을 명시해 공개 - 기대효과 : 불이익을 당한 사람들을 대변할 전문가(알고리즈미스트)가 필요 

 

 5. 미래의 빅데이터 

 빅데이터의 활용 3요소 

 1) 데이터 

  모든 것의 데이터화  - 모든 것을 데이터화 하는 현 추세로 특정 목적없이 축적된 데이터를 통한 창의적인 분석이 가능해져, 새로운 가치로 부상 

 2) 기술 

  진화하는 알고리즘, 인공지능  - 대용량의 데이터를 빠르게 처리하기 위한 알고리즘의 진화와 함께 스스로 학습하고 데이터를 처리할 수 있는 인공지능 기술이 출현 

 3) 인력 

  데이터 사이언티스트, 알고리즈미스트  - 빅데이터를 처리하기 위한 데이터 사이언티스트와 알고리즈미스트의 역할을 통해 빅데이터의 다각적 분석을 통한 인사이트 도출이 중요

 

댓글