*파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있음
과목 1 데이터 이해
- 1장 데이터의 이해
데이터 : 추론과 추정의 근거를 이루는 사실 - 객관적 사실이라는 존재적 특성 갖는 동시에 추론/예측/전망/추정을 위한 근거
정성적 데이터 : 언어, 문자 등
정량적 데이터 : 수치, 도형, 기호 등
지식화 - 암묵지(공통화, 내면화) -> 형식지(표출화,연결화)
데이터Data -> 정보Information -> 지식Knowledge -> 지혜Wisdom
데이터 베이스 정의 : 문자,기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체
데이터 베이스 + 데이터베이스 시스템DBMS(SW)
데이터베이스 특징 : 통합된 데이터, 저장된 데이터, 공용 데이터, 변화되는 데이터
OLTP(Online Transaction Processing), OLAP(Online Analytical Processing), CRM(Customer Relationship Management), SCM(Supply Chain Management), ERP(Enterprise Resource Planning)
- 2장 데이터의 가치와 미래
빅데이터 : 용량이 방대하고 복잡도가 높은 데이터 세트의 집합, 기존 방식으로는 얻을 수 없었던 통찰 및 가치 창출
3V - Volume, Variety, Velocity + Value
출현 배경 : 데이터 축적, 학계의 빅데이터 과학 확산, 관련기술(디지털화, 저장기술, 인터넷, 클라우드-> 분산병렬처리 기술로 데이터 분석비용문제 해결 등) 발전
빅데이터의 기능 : 산업혁명의 석탄,철 / 21세기의 원유 / 렌즈(구글의 Ngram Viewer-The United States is(복수아닌 단수로 사용) / 플랫폼
빅데이터가 만드는 변화 : 사전처리-> 사후처리(일단 쌓고), 표본조사-> 전수조사, 질->양, 인과관계 -> 상관관계
빅데이터의 가치측정 어려움 이유 : 데이터 활용방식이 다양(재사용, 재조합mashup, 다목적용 사용), 완전히 새로운 가치창출, 분석 기술 발전)
빅데이터의 영향 : 기업- 혁신, 경쟁력 제고, 생산성향상. 정부- 환경탐색, 상황분석, 미래대응 개인- 다양한 목적에 따라 활용. --> 스마트화
빅데이터 활용 기본 기술 : 연관규칙학습Association rule learning, 유형분석Classification tree analysis, 유전알고리즘Genetic algorithms(최적화, 진화), 기계학습Machine learning, 회귀분석Regression analysis, 감정분석Sentiment analysis, 소셜네트워크분석Social network
위기요인 : 사생활 침해, 책임원칙 훼손, 데이터오용
통제방안 : 동의에서 책임제로, 결과기반 책임원칙 고수, 알고리즘 접근 허용 등
미래의 빅데이터: 모든것의 데이터화Datafication, 진화하는 알고리즘, 인공지능Artificial Intelligence, 데이터 사이언티스트, 알고리즈미스트
데이터사이언티스트의 역량 - Soft(통찰력있는 분석+설득력있는 전달+커뮤니케이션) + Hard(빅데이터 이론지식, 빅데이터 분석기술의 숙련)
- 3장 가치창조를 위한 데이터 사이언스와 전략 인사이트
분석기반경영이 도입되지 않는 이유 - 기존관행만 따르고 중요한시도를 하지 않는다. 종종 경영진의 의사결정은 정확성이나 분석이 아닌 직관적 결정에 따르는 경우가 많다. 역량없는 사람에게 분석업무, 사람들은 아이디어 자체보다 아이디어를 낸 사람에 더 관심이 있다.
빅데이터분석은 Big이 핵심이 아닌 유형의 다양성 및 이를 분석할 수 있는 능력에 있다.
전략적 통찰없는 분석은 위험하다 : 아메리칸항공 복잡한 분석, 쓸데없는 비즈니스 모델을 뒷받침하는 분석
일차적인 분석 -> 전략 도출 위한 가치 기반 분석
데이터사이언스 : 데이터로 부터 의미있는 정보를 추출해내는 학문
통계학: 정형화된 실험데이터로 분석 -> 데이터 사이언스 : 정형/비정형 다양한 유형의 데이터를 대상
데이터마이닝: 주로 분석에 초점 -> 데이터 사이언스 : 분석+ 효과적으로 구현하고 전달하는 과정으로 데이터공학, 수학, 통계학, 컴퓨터 공학, 시각화, 해커, 해당분야의 전문지식을 종합한 학문, 총체적holistic 접근법
데이터사이언스의 핵심구성요소: 데이터분석, IT, 비즈니스분석
과학과 인문학의 교차로 : 더 높은 가치와 진정한 차별화는 사고방식(habits of mind), 비즈니스 이슈에 대한 감각, 고객들에 대한 공감능력
컨버전스- 규모의 경제, 글로벌효율성, 표준화, 이성화. 디버전스- 다양성과 각 정체성, 맥락, 관계, 연결성, 창조성이 화두
데이터사이언스 핵심 문제 (과거/현재/미래)
정보 - 무슨일이 일어났는가?(리포팅) 무슨일이 일어나고 있는가(경고), 무슨일이 일어날 것인가(추출)
통찰 - 어떻게 왜일어났는가(모델링, 실험설계) 차선행동은 무엇인가(권고) 최악또는 최선의 상황은 무엇인가(예측, 최적화, 시뮬레이션)
가치 패러다임의 변화
디지털화Digitalization -> 연결Connection -> 에이전트Agent (복잡한 연결을 얼마나 효과적이고 믿을만 하게 관리해 주는가)
'Review > Book_Data' 카테고리의 다른 글
데이터 분석 전문가 가이드 과목 3. 데이터 분석 기획 (0) | 2019.01.04 |
---|---|
데이터 분석 전문가 가이드 과목 2. 데이터 처리 기술 이해 (0) | 2019.01.04 |
한계 비용 체증의 법칙 (0) | 2016.07.09 |
성공적인 빅데이터 사례 (0) | 2016.07.09 |
아파치 카프카 Apache Kafka (0) | 2016.02.13 |