2021-Manager-Matching-Prediction-Industry-Academia-Linkage-Contest
- 고객 밀착형 서비스의 특성상 고객의 서비스 요청에 적합한 서비스 제공자 즉, 매니저를 매칭하는 것은 고객 만족도뿐만 아니라 비즈니스 모델의 성공을 위한 중요한 과업
- '사용자의 서비스 요청사항'과 '고객 및 매니저 정보'를 활용하여 매니저 매칭 성공 여부(0/1)를 예측 할 수 있는 머신러닝 모델의 개발
- 평가 지표: AUC
- 주최: (주)플랫포머스
- 주관: 국민대학교 빅데이터경영통계전공 D&A
- 참가 대상: 전공 학부생
- 성과: 최우수상 수상(2위)
- 제출마감: 2021년 11월 23일
- 코드 평가 마감 및 최종순위 발표: 2021년 11월 29일
- 사용자의 서비스 요청사항과 고객 및 매니저 정보 데이터를 통해 매니저 매칭 성공 여부를 예측하는 이진 분류 문제임.
- 매니저 관련 column들은 비정상적인 score로 인해 drop되었음.
- 다양한 범주형 변수를 그룹화, 조합을 통해 생성하였음.
- 고객가입일이나 접수일과 같은 날짜 정보들을 대상으로 세부 날짜정보로 subdivision하였음.
- 정규화, 피처 셀렉션을 거쳐서 최종적으로 피처를 선정하였음.
- ExtraTrees 모델을 base model로 Catboost 모델을 앙상블하여 최종 submission을 생성하였음.
- EDA
- Group Features
- Date Features
- Combination Features
- Manager Feature drop
- NAN processing
- One-hot Encoding
- Normalization
- Feature Selection
- ExtraTrees(Default parameters)
- Catboost(Default parameters)
- Additional Eval metric(Average Precision)
- Weighted Ensemble
- ExtraTress 8 : Catboost 2