Skip to content

Latest commit

 

History

History
9 lines (5 loc) · 906 Bytes

File metadata and controls

9 lines (5 loc) · 906 Bytes

Indonesian Hate Speech Classification

Program akan melakukan klasifikasi terhadap tweet berbahasa Indonesia yang dianggap ujaran kebencian (Hate Speech) atau tidak (Non Hate Speech).

Dataset yang digunakan berasal dari repositori berikut id-hatespeech-detection.

Program pertama menggunakan SVM Classifier, XGBoost, dan Neural Network. Dalam prosesnya menggunakan oversampling SMOTE.

Program kedua menggunakan SVM Classifier, XGBoost. Tidak seperti program pertama tidak menggunakan Neural Network, serta ditambah dengan penerapan Stratified KFold CV pada SCM Classifier. Tanpa menggunakan oversampling SMOTE.