본문 바로가기
  • Let's go grab a data
Data/Info.

기계학습Machine Learning - 정의, 목적별 분류

by pub-lican-ai 2016. 2. 6.
반응형

통계와 기계학습의 차이는?

  • 통계는 정해진 분포나 가정을 가지고 엄격하게 규칙이 적용되는 설문조사나 실험 계획에 사용됨
  • 기계학습은 대용량 데이터의 분석이나 패턴을 찾는데 사용됨


기계학습이란?

  • 정의 : 컴퓨터에게 배울 수 있는 능력, 즉 코드로 정의하지 않은 동작을 실행하는 능력에 대한 연구분야 (아서 사무엘, 1959)
  • 머신 러닝(영어: machine learning) 또는 기계 학습(機械 學習)은 인공 지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야를 말한다. 가령, 기계 학습을 통해서 수신한 이메일이 스팸인지 아닌지를 구분할 수 있도록 훈련할 수 있다.

  • 기계 학습의 핵심은 표현(representation)과 일반화(generalization)에 있다. 표현이란 데이터의 평가이며, 일반화란 아직 알 수 없는 데이터에 대한 처리이다. 이는 전산 학습 이론 분야이기도 하다. 다양한 기계 학습의 응용이 존재한다.문자 인식은 이를 이용한 가장 잘 알려진 사례이다.

출처 : https://ko.wikipedia.org/wiki/%EB%A8%B8%EC%8B%A0_%EB%9F%AC%EB%8B%9D


기계학습과 데이터 마이닝의 차이는?

  • 기계 학습과 데이터 마이닝은 종종 같은 방법을 사용하며 상당히 중첩되지만, 데이터 마이닝을 위해 기계 학습이 필수가 아니며, 반대로 기계 학습에는 데이터 마이닝이 필수다


기계학습의 목적별 종류는?

  • 분류, 예측, 차원 축소, 그룹화, 데이터 비교


 기계학습 분류

 알고리즘 

분류 

Logistic regression,  Decision tree, Nearest-neighbor classifier, Kernel discriminate analysis, Neural network, Support Vector Machine, Random forest, Boosted tree

예측 

Linear regression, Regression tree, Kernel regression, Support vector regression

차원(변수) 축소 

Principal component analysis, Non-negative matrix factorization, Independent component analysis, Manifold learning, SVD 

그룹화 

k-means, Hierarchical clustering, mean-shift, self-organizing maps(SOMs) 

선행학습(Pre-training), 

2차분류 

Deep Learning(Stacked Restricted Boltzmann Machine, Stacked Auto-Encoders등을 사용한 Multi layers Neural Nets, Non-linear Transformation) 

데이터 비교 

Bipartite cross-matching, n-point correlation two-sample testing, minimum spanning tree

출처 : 데이터 과학 어떻게 기업을 바꾸었나? 김옥기, 2014.12

반응형