Skip to content

Algorithms and Models Used in Samsung Card Big Data Competition (1st prize)

Notifications You must be signed in to change notification settings

hw79chopin/SAMSUNG_CARDS

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

22 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🔎 삼성카드 데이터분석 공모전 (SCDC2020)

🥇알고리즘 개발부분 1위 #XGBoost #LightGBM #Voting

🚦 1. Introduction

  • 온라인 가맹점 방문 고객 예측 알고리즘을 개발하는 공모전이다. (Track 1) 대회 포스터
  • 최종 1위를 했다.
  • 참가자: 정현우, 윤형준, 기유진

🚦 2. Algorithms and Models

2-1. EDA (T-sne Visualization)

  • 데이터를 처음 받고서 데이터 전반의 분포와 outlier 파악을 위해 T-sne로 시각화했다. (데이터 차원이 너무 커서)
  • Colab version: T-sne.ipynb

2-2. Dimensionality Reduction

  • 데이터 차원이 200차원이 넘어서 차원축소를 하는 게 도움이 되는지 확인해보기 위해서 다양한 차원축소 기법을 사용하였다.
  • Colab version: Dimensionality Reduction.ipynb

2-3. Hyperparameter tuning

2-4. Modeling

  • 최종모델은 XGB 1개, LGBM 1개를 soft voting으로 합친 모델을 사용하였다.
  • 학습에는 Google Colab Pro의 GPU (Tesla V100)를 사용하였다. 최종 모델 학습은 30시간이 넘게 걸렸다.
  • LIFT와 Multiclass AUROC는 직접 함수를 만들었다. auroc-lift.ipynb
  • Colab version: Voting Model.ipynb

끗! 🙌

About

Algorithms and Models Used in Samsung Card Big Data Competition (1st prize)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published