개요
통계 분석은 왜 필요한 것일까요? 약 300년된 통계(및 확률)가 현 시대까지 필요한 이유는 무엇일까요?
빅 데이터 시대의 전제 조건은 데이터가 크다는 것입니다. 그런데 어떤 분야는 데이터를 우리가 원하는 만큼 수집할 수 없는 상황이 존재합니다. 생수를 예로 들어 보겠습니다. 생수 500 ml에는 사람의 생명에 지장이 없을 정도의 미생물 수가 요구될 것입니다. 생수 제조 공장에서 모든 생수의 미생물 수를 측정하려면 생수가 담아지는 순간에 미생물 수를 측정할 수 있는 센서가 있어야 할 것 입니다. 이 센서가 발명되기 전까지는 표본을 통한 전통적인 통계분석이 효율적이고 적합한 방법일 것 입니다. 질병 연구, 신약 연구 등에서 여전히 통계 분석이 중요한 것도 연구 대상(Subject)의 제약성 때문일 것입니다. 물론 유전자 정보나 의학 이미지(X-Ray, CT, MRI) 같이 데이터가 방대한 분야는 머신러닝과 딥러닝이 경쟁 우위에 있습니다.
서비스 내용
디시전 인사이트는 데이터의 크기에 적합한 분석 방법을 찾기 위하여 전통적인 통계 분석과 머신러닝 알고리즘을 서로 경합시켜 상대적으로 적합한 분석 방법을 제시하고 있습니다. 예를 들어 고객 매출(금액 또는 수량)을 예측하는 회귀 문제 해결을 위하여 회귀분석(단순, 다중, 다항 등)과 LASSO, Ridge 그리고 Random Forest, Gradient Boosting Method, Deep Neural Network 등 방법론적으로 서로 다른 이론적 배경을 지닌 모델 중 상대적으로 가장 좋은 예측력을 지닌 모델을 귀사에 제안합니다.