NLP-Spam-Classification

A spam classification model which uses a sms spam classification dataset from https://archive.ics.uci.edu/ml/datasets/sms+spam+collection

The model displays the use of nlp techniques such as Porter Stemming, WordNet Lemmatization, Tokenization, Stopwords Removal, Bag of Words Model and TF-IDF Model.

The model has pretty good accuracy though due to imbalanced dataset there might be some errors. We can fix this by upsampling or downsampling the dataset in further edits.

The model uses a Multinomial Naive Bayes Classifer for making predictions.

Thanks.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.ipynb_checkpoints		.ipynb_checkpoints
Dataset Readme		Dataset Readme
README.md		README.md
SMS Spam Collection		SMS Spam Collection
Spam Classification using MultinomialNBC.ipynb		Spam Classification using MultinomialNBC.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NLP-Spam-Classification

About

Releases

Packages

Languages

harshit-saraswat/NLP-Spam-Classification

Folders and files

Latest commit

History

Repository files navigation

NLP-Spam-Classification

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages