알고리즘 |
주 활용 분야 |
업리프트 모델링(Uplift modeling) |
단계적 추정, 예측 분석 마케팅 캠페인에서 많이 사용, 환경이나 조건을 달리한 후 적당한 그룹을 선택하여 예측성을 높이는 방법 마케팅, 신용관리, 가격선택, 고객 이탈 관리 등 분야 |
생존 분석(Suvival Anlaysis) |
의료 통계, 설비 분야 사건 예측 |
회귀 분석(Regression, logistic) |
예측 분석, 추정 분석(매출, 신용 점수 등) |
시각화(Visualization) |
원인과 관계 분석 |
기초 통계(Statistics) |
현황 파악 |
부스팅(Boosting), 배깅(Bagging) |
분류 분석 |
시계열/순열 분석(Timeseries/Sequence analysis) |
시간상의 예측(이자율, 예산 등) |
요인 분석(Factor Analysis) |
요인 분석, 차원 축소 |
이상치 감지 기법(Anomaly/Deviation detection) |
이상치 분석 |
텍스트 마이닝(Text Mining) | 시대 경향 및 감성 분석 |
의사 결정 나무(Decision Trees) | 분류(종속 변수 존재) |
신경 회로망(Neural Nets) | 분류 분석 |
군집 분석(Clustering, K-mean) | 독립 변수들만의 분류, 그룹화, 프로파일링 |
앙상블 기법(Ensemble Methods) | 분류, 예측 최적화 등의 결합 분석 |
소셜 네트워크 분석(Social Network Analysis) | 관계망 분석(사람 관계, 통화 관계, 소셜 네트워크 등) |
연관 법칙(Association rules) | 관계 분석, 장바구니 분석 등 |
서포트 벡터 머신(Support Vector Machine, SVM) | 분류 분석 |
주성분 분석(Principal component analysis, PCA) | 원인 분석(독립 변수간의 관계), 차원 축소 |
추천(Recommender) | 몇 개의 기본 알고리즘을 활용하여 상품, 내용, 사람 등 추천(일종의 앙상블 기법) |
출처 : 데이터 과학 어떻게 기업을 바꾸었나? 김옥기, 2014.12
'Review > Book_Data' 카테고리의 다른 글
아파치 카프카 Apache Kafka (0) | 2016.02.13 |
---|---|
하둡을 선택하기 전에 고려해야 할 것들 (0) | 2016.01.23 |
데이터 분석가에게 필요한 것 (0) | 2016.01.17 |
현황Descriptive,예측Predictive, 예측최적화Prescriptive (1) | 2016.01.17 |
데이터 과학자에게 분석과정에서 가장 큰 도전은? (0) | 2016.01.17 |