본문 바로가기
  • On the ball

classification3

데이터의 질 - intra-/inter-class variability 데이터의 질 - intra-/inter-class variability 데이터의 질에 따라 머신러닝을 통한 분석의 결과가 바뀐다 Intra- 클래스 내부의 분산이 어떤가Inter- 클래스간 분산이 어떠냐 위 이미지에서 위쪽 줄은 Intra-class variability가 작다 아래 줄은 크다왼쪽 두 산점도는 Inter-class variability가 크다 오른쪽 두 산점도는 작다 그래서 inter-가 크고 intra-가 작은 Input으로 만들어주는 것이 좋다= 클래스 별로 잘 구분되는 것이 좋고 클래스 내부에 서로 뭉쳐있는 것이 좋다 예) 성적을 예측하라X: 키, 몸무게, 사교육, IQ, 소득, 형제, 이성친구, 인터넷 사용시간, 게임 시간, 소비금액, 등등 high dimension - 다 때려 .. 2017. 7. 20.
MNIST 데이터로 KNN 분류기, 성능 측정 MNIST 데이터로 KNN 분류기, 성능 측정 MNIST 데이터는 머신 러닝 분야에서 광범위하게 사용되는 손글씨 숫자 0~9가 흑백으로 저장된 이미지 [데이터 다운로드]http://yann.lecun.com/exdb/mnist/ ( train-images-idx3-ubyte.gz, train-labels-idx1-ubyte.gz, t10k-images-idx3-ubyte.gz, t10k-labels-idx1-ubyte.gz) [입력을 도와주는 스크립트 다운로드]https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/mnist/input_data.py Python 스크립트와 동일한 폴더에 input_data.py .. 2017. 4. 17.
David Barber의 Machine Learning 분류 https://www.facebook.com/terryum.io/photos/pcb.518577148267476/518576694934188/?type=3&theaterhttp://web4.cs.ucl.ac.uk/staff/D.Barber/pmwiki/pmwiki.php?n=Brml.Online [Machine Learning 분류] - Supervised Learning - Regression 회귀 ㄴ Gaussian Process (non-parametric) 함수 정의 없이 ㄴ linear ㄴ Parametric 함수를 정의 ㄴ linear ㄴ non-linear - Classification 분류 ㄴ Discriminative 그냥 나눠줘 ㄴ Support Vector Machine ㄴ Logis.. 2017. 3. 28.
반응형