본문 바로가기
  • On the ball
반응형

분류 전체보기494

숫자의 거짓말~ 평균, 분산, 표준편차, 변동계수 원리 파악하기 1) 평균의 함정The catch of average은 무엇일까요? http://tvcast.naver.com/v/295418 평균의 함정이란 재미있는 동영상입니다. 5분만 투자해서 봐요^^ 동영상에서 나타난 분포는 왼쪽으로 skewed 되어 있네요! 평균은 데이터 집단을 대표하는 지표로 가장 널리 알려지고 쓰이는 것이지만 가장 정확한 것은 아닙니다. 데이터에 따라 중위값Median, 최빈값Mode, 분산Variance, 표준편차 등이 더욱 가치있는 대표값으로 사용될 때도 있죠. 예를 들어 직원1이 1월 100, 2월 110, 3월 120 매출을 올렸고 직원 2가 1월 50, 2월 330, 3월 40 매출을 올렸다 할때 평균으로 보면 직원 2가 평가를 잘 받을 텐데 '얼마나 안정적인가' 라는 새로운 차원.. 2016. 6. 27.
9. 리눅스 커널 기본 명령어 9. 리눅스 커널 기본 명령어 #cd #pwd #ls #cp #mv #touch #rm #mkdir #rmdir #cat #find #grep #df #du #ln #diff #netstat [온라인 매뉴얼]man [섹션번호] 명령어 또는 파일명다음 화면 Space키 빠져나오기 q섹션번호 1. 사용자 명령어 2. 시스템 콜 함수 3. 라이브러리 함수 4. 특수 파일(장치 파일) 5. 시스템 정보가 포함되어 있는 파일 6. 게임 7. 기타 프로그램 8. 시스템 관리 명령어 9. 커널 관련 명령 cd홈 디렉토리 이동cd - 이전 디렉토리 이동pwd현재 디렉토리 확인 [파일 열람]ls [옵션] [파일명]옵션 -l 파일 정보 자세히 -a 숨김 파일까지 보기 -R 서브 디렉토리의 파일까지 재귀적으로 보기 -t 파.. 2016. 5. 23.
8.vi 편집기 사용 8.vi 편집기 사용 #vi vi 시작하면 명령어 모드로 시작vi test.txt 명령어 모드 -> 입력 모드 i 또는 a 또는 o 입력입력 모드 -> 명령어모드 ESC 명령어 모드 -> 확장 모드: 입력확장 모드 -> 명령어 모드ESC vi 종료ZZ -> 저장후 끝내기:wq -> (확장모드)저장후 끝내기:q! -> 저장하지 ㅇ낳고 끝내기 [명령어 모드]10dw (10개, d삭제, w단어) -> 현재 커서로 부터 10개 단어 삭제43G (43개 Go가기) ->43번째 라인으로 가기x (삭제) -> 현재 커서 위치의 문자 삭제 k, j, h, l 상하좌우 이동b단어의 시작으로 이동, e단어의 끝으로 이동, w다음 단어의 첫 문자로 이동0 라인의 시작으로 이동, $라인의 끝으로 이동, nG n번째 라인으로 .. 2016. 5. 23.
7. 압축 파일 jar, tar, gzip, zip 7. 압축 파일 #jar, #tar, #gzip, #zip[tar 묶기]tar -cvf test.tar test.txt 2016. 4. 22.
6.scp 파일전송, ssh, 인증서 설치, proxy 설정, 방화벽 off 설정 ssh, scp 파일전송, 인증서 설치, proxy 설정, 방화벽 off 설정 #ssh #scp #.crt #proxy #firewall [ssh 연결] 원격 서버에 ssh 서비스 떠 있는지 확인 [~]#netstat -an|grep 22|grep LISTENtcp 0 0 0.0.0.0:22 LISTENtcp6 0 0 :::22 root 연결(user계정 없이)[~]#ssh IPADDRESSroot@IPADDRESS's password:패스워드 입력 후 엔터 호스트로 돌아오기[root@localhost ~]#exitlogoutConnection to IPADDRESS closed. user계정으로 identity_file을 통한 연결[~]#ssh -i IDENTITY_FILE.pem USERNAME@IP.. 2016. 4. 18.
5. python, flask, numpy, scipy, yaml 설치 5. python, flask, numpy, scipy, yaml 설치 현재 OS: CentOS 7python 설치하기 [설정 방법]Root 권한으로 이동[~]$su - 1) yum을 통해 설치[~]#yum install gcc python-develIs this ok [y/d/N] : y를 눌러 설치 완료[설치 확인][~]#python -VPython 2.7.5 #update: 16.04.182) 특정 버전 컴파일 설치(또는 업데이트)현재 문서에서는 2.7.10 버전으로 설치[~]#cd /usr/local/src[src]#wget --no-check-certificate -N http://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz[src]#tar xzf .. 2016. 4. 6.
[데이터 전처리]특징 추출, 차원 축소, 상관 분석, 주성분 분석, 푸리에변환 [데이터 전처리]특징 추출, 차원 축소, 상관 분석, 주성분 분석, 푸리에 변환 #feature vector #Correlation #Covariance #Dimensionality Reduction #PCA #FFT 데이터 특징 추출 Feature Vector generation[목적]- 모든 데이터 셋의 변수를 모두 측정하고 다룰 수 없다- 측정가능한 subset으로 추출/변환/축소하여 Summarization한다- 특징 추출은 데이터 마이닝의 중요한 컨셉이다 상관도와 공분산 또한 데이터의 특징 추출하는 중요한 방법 상관도Correlation두 변수간의 관계를 -1~1값으로 표현함-1에 가까울 수록 음의 상관관계, 1에 가까울 수록 양의 상관관계 공분산Covariance상관도에 각 표준편차를 곱한 값.. 2016. 3. 31.
[R] 잡음 처리(MAF), 이상치 검출(카이제곱분포, LOF) [R] 잡음 처리(MAF), 이상치 검출(카이제곱분포, LOF) Moving Average Filtern개의 데이터가 각rkr 1/n씩 가중치를 가짐 [데이터]http://ps.cs.utwente.nl/Datasets.php 에서 제공하는 Physical Activity Recognition Dataset Using Smartphone Sensors을 다운받아(63MB) 사용 - Arm.csv 파일로드 하여 사용 하거나 첨부의 txt 파일 사용(일부 데이터) [코드] data 2016. 3. 31.
[데이터 전처리] 결측치, 이상치, 잡음 처리, 데이터 변환 [데이터 전처리] 결측치, 이상치, 잡음 처리, 데이터 통합, 데이터 변환 #missing value #outlier #noise 결측치 채워넣기 Missing Value Imputation1) 중심 경향 값 넣기 (평균, 중앙값, 최빈값 등) - 분산이 줄어들고, 소수의 평균이 전체를 대표하는 경우가 생김, 극단값에의해 평균이 영향 받음, Mid-minimum spacing: 양측 5%제거하고 평균 예) 피겨스케이팅 점수 계산2) 랜덤 추출(분포 기반) - 랜덤에의해 자주 나타나는 값이 채워짐3) Regression Imputation 회귀 삽입 - 변수내의 값들의 평균이 아닌 각 관측치의 특성을 고려하여 삽입, 기초 Imputation 먼저하고 회귀식에 의해 타겟 소실 데이터를 채움4) EM algo.. 2016. 3. 30.
반응형