Indonesian Hate Speech Classification

Program akan melakukan klasifikasi terhadap tweet berbahasa Indonesia yang dianggap ujaran kebencian (Hate Speech) atau tidak (Non Hate Speech).

Dataset yang digunakan berasal dari repositori berikut id-hatespeech-detection.

Program pertama menggunakan SVM Classifier, XGBoost, dan Neural Network. Dalam prosesnya menggunakan oversampling SMOTE.

Program kedua menggunakan SVM Classifier, XGBoost. Tidak seperti program pertama tidak menggunakan Neural Network, serta ditambah dengan penerapan Stratified KFold CV pada SCM Classifier. Tanpa menggunakan oversampling SMOTE.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Indonesian Hate Speech Classification

Files

README.md

Latest commit

History

README.md

File metadata and controls

Indonesian Hate Speech Classification