Credit Classification Project

This project tackles a multi-class credit classification task using historical loan data. The pipeline includes data cleaning, imputation of missing values, encoding categorical variables, feature selection (Bivariate Dependence Feature Selection using Normalized Mutual Info and Custom Recursive Feature Elimination using Cross Validation), hyperparameter and model optimization with Optuna, model training, and probability calibration.

The model is evaluated using confusion matrix and explained using SHAP for feature importance insights. The pipeline is adaptable to other datasets with minor modifications.

To train the model, simply run main.py after configuring your dataset. All feature selection, model optimization, and calibration decisions are based on the training set, ensuring no data leakage.

Key scripts:

data_cleaning.py: Class that cleans the dataset (type conversion, feature removal).
imputer.py: Class to handle missing values (median for numeric, "Missing" for categorical).
categorical_encoder.py: Class to encode categorical features (manual mapping for ordinal, LabelEncoder for non ordinal).
01_main_dependence_fs.py: Bivariate feature selection using Normalized Mutual Information.
02_main_rfe_fs.py: Custom Recursive Feature Elimination with cross-validation.
03_main_hyp_opt.py: Hyperparameter and model optimization using Optuna.
main.py: Trains and calibrates the model.
evaluation.py: Evaluates the trained model (ROC AUC, confusion matrix).
model_explainability.py: Explains model predictions using SHAP values.

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
__pycache__		__pycache__
logs		logs
pipeline_order_execution		pipeline_order_execution
utils		utils
.gitignore		.gitignore
README.md		README.md
cateorical_encoder.py		cateorical_encoder.py
constant.py		constant.py
data_cleanning.py		data_cleanning.py
dependence_feature_selection.py		dependence_feature_selection.py
evaluation.py		evaluation.py
imputer.py		imputer.py
main.py		main.py
model_explainability.py		model_explainability.py
rfe_multivariant_feature_selection.py		rfe_multivariant_feature_selection.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Credit Classification Project

Key scripts:

About

Releases

Packages

Languages

miguelmoralh/credit_classification

Folders and files

Latest commit

History

Repository files navigation

Credit Classification Project

Key scripts:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages