통계와 기계학습의 차이는?
- 통계는 정해진 분포나 가정을 가지고 엄격하게 규칙이 적용되는 설문조사나 실험 계획에 사용됨
- 기계학습은 대용량 데이터의 분석이나 패턴을 찾는데 사용됨
기계학습이란?
- 정의 : 컴퓨터에게 배울 수 있는 능력, 즉 코드로 정의하지 않은 동작을 실행하는 능력에 대한 연구분야 (아서 사무엘, 1959)
머신 러닝(영어: machine learning) 또는 기계 학습(機械 學習)은 인공 지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야를 말한다. 가령, 기계 학습을 통해서 수신한 이메일이 스팸인지 아닌지를 구분할 수 있도록 훈련할 수 있다.
기계 학습의 핵심은 표현(representation)과 일반화(generalization)에 있다. 표현이란 데이터의 평가이며, 일반화란 아직 알 수 없는 데이터에 대한 처리이다. 이는 전산 학습 이론 분야이기도 하다. 다양한 기계 학습의 응용이 존재한다.문자 인식은 이를 이용한 가장 잘 알려진 사례이다.
출처 : https://ko.wikipedia.org/wiki/%EB%A8%B8%EC%8B%A0_%EB%9F%AC%EB%8B%9D
기계학습과 데이터 마이닝의 차이는?
- 기계 학습은 훈련 데이터(Training Data)를 통해 학습된 알려진 속성을 기반으로 예측에 초점을 두고 있다.
- 데이터 마이닝은 데이터의 미처 몰랐던 속성을 발견하는 것에 집중한다. 이는 데이터베이스의 지식 발견 부분의 분석 절차에 해당한다.
- 기계 학습과 데이터 마이닝은 종종 같은 방법을 사용하며 상당히 중첩되지만, 데이터 마이닝을 위해 기계 학습이 필수가 아니며, 반대로 기계 학습에는 데이터 마이닝이 필수다
기계학습의 목적별 종류는?
- 분류, 예측, 차원 축소, 그룹화, 데이터 비교
기계학습 분류 |
알고리즘 |
분류 |
Logistic regression, Decision tree, Nearest-neighbor classifier, Kernel discriminate analysis, Neural network, Support Vector Machine, Random forest, Boosted tree |
예측 |
Linear regression, Regression tree, Kernel regression, Support vector regression |
차원(변수) 축소 |
Principal component analysis, Non-negative matrix factorization, Independent component analysis, Manifold learning, SVD |
그룹화 |
k-means, Hierarchical clustering, mean-shift, self-organizing maps(SOMs) |
선행학습(Pre-training), 2차분류 |
Deep Learning(Stacked Restricted Boltzmann Machine, Stacked Auto-Encoders등을 사용한 Multi layers Neural Nets, Non-linear Transformation) |
데이터 비교 |
Bipartite cross-matching, n-point correlation two-sample testing, minimum spanning tree |
출처 : 데이터 과학 어떻게 기업을 바꾸었나? 김옥기, 2014.12
'Data > Info.' 카테고리의 다른 글
머신러닝 딥러닝 온라인 강의 / SNS / 논문 (0) | 2017.03.23 |
---|---|
기계학습Machine Learning - 강화 학습 유형(Multi armed bandit) (0) | 2016.02.07 |
기계학습Machine Learnig - 비지도 학습 (0) | 2016.02.07 |
기계학습Machine Learning - 지도 학습 유형 (2) | 2016.02.06 |
Big Data Overview (0) | 2016.01.01 |