Emission_Prediction_and_Classification

This project addresses multiclass classification and regression task, aiming to predict vehicle emissions and classify CO2 rating based on various vehicle characteristics.

This project leveraged Pandas and NumPy libraries for exploratory data analysis and data cleaning, along with visualizations using seaborn, matplotlib, and plotly.

Statistical techniques like ANOVA and Pearson's correlation were applied, and principal component analysis with Mutual Information was used for feature selection.

Data Exploration and Preprocessing:

Load the CO2 Emission dataset and perform initial data exploration. Handle missing values, specifically in the 'CO2 Rating' and 'Smog Rating' columns. Conduct data visualization and analysis to understand the relationships between variables. Identify and remove outliers, focusing on true outliers. Regression Task (Predicting CO2 Emissions):

Use various regression models to predict CO2 emissions.

Models used: Multiple Linear Regression, Decision Tree Regressor, Support Vector Regressor, Random Forest Regressor, and GridSearchCV for hyperparameter tuning. Evaluate model performance using metrics like R-squared, RMSE, MSE, and MAE. Classification Task (Predicting CO2 Ratings):

Perform classification for CO2 ratings.

Models used: Support Vector Classifier, Multinomial Naive Bayes, Random Forest Classifier, and XGBoost Classifier. Use ROC analysis for multiclass classification, including micro-average and class-specific ROC curves. Evaluate classification performance using metrics like accuracy, precision, recall, F1-score, and the ROC curve.

Evaluation metrics including accuracy, precision recall, F1 score, ROC curve, RMSE, MSE, R2 score were utilized for evaluating the model.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
Emission Prediction and Classificationipynb		Emission Prediction and Classificationipynb
Machine learning and Advanced Statistical Analytics.ipynb		Machine learning and Advanced Statistical Analytics.ipynb
Multi-class_Classification_&_Regression.pdf		Multi-class_Classification_&_Regression.pdf
Multiclass_Classification_&_Regression.py		Multiclass_Classification_&_Regression.py
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Emission_Prediction_and_Classification

Data Exploration and Preprocessing:

Use various regression models to predict CO2 emissions.

Perform classification for CO2 ratings.

About

Releases

Packages

Languages

Sidessh/Advanced-Machine-Learning-and-Statistical-Analytics

Folders and files

Latest commit

History

Repository files navigation

Emission_Prediction_and_Classification

Data Exploration and Preprocessing:

Use various regression models to predict CO2 emissions.

Perform classification for CO2 ratings.

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages