정형 데이터 마이닝
-
[ADsP] 3과목 데이터 분석 - 기출문제 해설(5.정형 데이터 마이닝)ADsP 2021. 2. 27. 21:04
기출문제 해설(5.정형 데이터 마이닝)* 데이터 마이닝은 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법이다. * 반응 변수가 범주형인 경우 예측모형의 주목적은 분류이다. * 군집분석은 각 객체의 유사성을 측정하여 유사성이 높은 대상 집단을 분류하고, 군집에 속한 객체들의 유사성과 서로 다른 군집에 속한 객체간의 상이성을 규명하는 분석 방법이다. * 한 보험회사에서 자사 고객의 보험갱신 여부를 고객의 인구통계학적 특성, 보험가입 채널, 상품 종류 등의 정보를 사용하여 예측할 때 가장 적절한 분석 기법은?- 랜덤포레스트 분석 기법은 데이터마이닝 방법론의 앙상블 기법 중 하나로 분류분석 문제를 해결하기 위한 의사결정나무와 같은 방법론이지만 의사결정나무에서 나타나는 과대적합/과..
-
[ADsP] 3과목 데이터 분석_요약 정리(5.정형 데이터 마이닝)ADsP 2021. 2. 27. 20:57
5. 정형 데이터 마이닝5_1. 데이터 마이닝의 개요* 데이터마이닝- 데이터마이닝은 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법이다. * 통계분석과의 차이점- 통계분석은 가설이나 가정에 따른 분석이나 검증을 하지만 데이터마이닝은 다양한 수리 알고리즘을 이용해 데이터베이스의 데이터로부터 의미있는 정보를 찾아내는 방법으로 통칭한다. * 데이터마이닝의 종류1) 정보를 찾는 방법론에 따른 종류- 인공지능(Artificial Intelligence), 의사결정나무(Decision Tree), K-평균군집합(K-means Clustering), 연관분석(Association Rule), 회귀분석(Regression), 로짓분석(Logit Analysis), 최근접이웃(Nearest..