본문 바로가기
  • Let's go grab a data
Review/Book_Data

데이터 분석 전문가 가이드 과목1. 데이터 이해

by pub-lican-ai 2018. 12. 16.
반응형

아래를 클릭하여 바로 구매하기 데이터 분석 전문가 가이드(ADP)(ADsP), 한국데이터산업진흥원

*파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있음

과목 1  데이터 이해

  • 1 데이터의 이해

데이터 : 추론과 추정의 근거를 이루는 사실 - 객관적 사실이라는 존재적 특성 갖는 동시에 추론/예측/전망/추정을 위한 근거

정성적 데이터 : 언어, 문자

정량적 데이터 : 수치, 도형, 기호

지식화 - 암묵지(공통화, 내면화) -> 형식지(표출화,연결화)

데이터Data -> 정보Information -> 지식Knowledge -> 지혜Wisdom


데이터 베이스 정의 : 문자,기호, 음성, 화상, 영상 상호 관련된 다수의 콘텐츠를 정보 처리 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 있도록 정리한 정보의 집합체

데이터 베이스 + 데이터베이스 시스템DBMS(SW)

데이터베이스 특징 : 통합된 데이터, 저장된 데이터, 공용 데이터, 변화되는 데이터

OLTP(Online Transaction Processing), OLAP(Online Analytical Processing), CRM(Customer Relationship Management), SCM(Supply Chain Management), ERP(Enterprise Resource Planning)


  • 2 데이터의 가치와 미래

빅데이터 : 용량이 방대하고 복잡도가 높은 데이터 세트의 집합, 기존 방식으로는 얻을 없었던 통찰 가치 창출

3V - Volume, Variety, Velocity  + Value

출현 배경 : 데이터 축적, 학계의 빅데이터 과학 확산, 관련기술(디지털화, 저장기술, 인터넷, 클라우드-> 분산병렬처리 기술로 데이터 분석비용문제 해결 ) 발전


빅데이터의 기능 : 산업혁명의 석탄, / 21세기의 원유 / 렌즈(구글의 Ngram Viewer-The United States is(복수아닌 단수로 사용) / 플랫폼

빅데이터가 만드는 변화 : 사전처리-> 사후처리(일단 쌓고), 표본조사-> 전수조사, ->, 인과관계 -> 상관관계

빅데이터의 가치측정 어려움 이유 : 데이터 활용방식이 다양(재사용, 재조합mashup, 다목적용 사용), 완전히 새로운 가치창출, 분석 기술 발전)

빅데이터의 영향 : 기업- 혁신, 경쟁력 제고, 생산성향상. 정부- 환경탐색, 상황분석, 미래대응  개인- 다양한 목적에 따라 활용. --> 스마트화

빅데이터 활용 기본 기술 : 연관규칙학습Association rule learning, 유형분석Classification tree analysis, 유전알고리즘Genetic algorithms(최적화, 진화), 기계학습Machine learning, 회귀분석Regression analysis, 감정분석Sentiment analysis, 소셜네트워크분석Social network


위기요인 : 사생활 침해, 책임원칙 훼손, 데이터오용

통제방안 : 동의에서 책임제로, 결과기반 책임원칙 고수, 알고리즘 접근 허용

미래의 빅데이터: 모든것의 데이터화Datafication, 진화하는 알고리즘, 인공지능Artificial Intelligence, 데이터 사이언티스트, 알고리즈미스트

데이터사이언티스트의 역량 - Soft(통찰력있는 분석+설득력있는 전달+커뮤니케이션) + Hard(빅데이터 이론지식, 빅데이터 분석기술의 숙련)


  • 3 가치창조를 위한 데이터 사이언스와 전략 인사이트

분석기반경영이 도입되지 않는 이유 - 기존관행만 따르고 중요한시도를 하지 않는다. 종종 경영진의 의사결정은 정확성이나 분석이 아닌 직관적 결정에 따르는 경우가 많다. 역량없는 사람에게 분석업무, 사람들은 아이디어 자체보다 아이디어를 사람에 관심이 있다.

빅데이터분석은 Big 핵심이 아닌 유형의 다양성 이를 분석할 있는 능력에 있다.

전략적 통찰없는 분석은 위험하다 : 아메리칸항공 복잡한 분석, 쓸데없는 비즈니스 모델을 뒷받침하는 분석

일차적인 분석 -> 전략 도출 위한 가치 기반 분석


데이터사이언스 : 데이터로 부터 의미있는 정보를 추출해내는 학문

통계학: 정형화된 실험데이터로 분석 -> 데이터 사이언스 : 정형/비정형 다양한 유형의 데이터를 대상

데이터마이닝: 주로 분석에 초점 -> 데이터 사이언스 : 분석+ 효과적으로 구현하고 전달하는 과정으로 데이터공학, 수학, 통계학, 컴퓨터 공학, 시각화, 해커, 해당분야의 전문지식을 종합한 학문, 총체적holistic 접근법

데이터사이언스의 핵심구성요소: 데이터분석, IT, 비즈니스분석

과학과 인문학의 교차로 : 높은 가치와 진정한 차별화는 사고방식(habits of mind), 비즈니스 이슈에 대한 감각, 고객들에 대한 공감능력

컨버전스- 규모의 경제, 글로벌효율성, 표준화, 이성화. 디버전스- 다양성과 정체성, 맥락, 관계, 연결성, 창조성이 화두


데이터사이언스 핵심 문제 (과거/현재/미래)

정보 - 무슨일이 일어났는가?(리포팅) 무슨일이 일어나고 있는가(경고), 무슨일이 일어날 것인가(추출)

통찰 - 어떻게 왜일어났는가(모델링, 실험설계)  차선행동은 무엇인가(권고) 최악또는 최선의 상황은 무엇인가(예측, 최적화, 시뮬레이션)

가치 패러다임의 변화

디지털화Digitalization -> 연결Connection -> 에이전트Agent (복잡한 연결을 얼마나 효과적이고 믿을만 하게 관리해 주는가)


반응형