ABSTRAKTujuan dari permasalahan filtrasi spam adalah mengidentifikasi sebuah e-mail sebagai spam atau bukan spam. Dengan berkembangnya machine learning, semakin banyak permasalahan yang dapat diselesaikan. Salah satunya adalah filtrasi spam. Filtrasi e-mail spam dapat dilakukan dengan bantuan klasifikasi biner dengan machine learning untuk pengklasifikasiannya. Dalam penelitian ini akan menggunakan regresi logistik dan perceptron untuk melakukan proses filtrasi spam. Data yang digunakan menggunakan dataset Enron Spam. Hasil dari analisis menunjukkan bahwa regresi logistik menunjukkan hasil yang lebih baik dari perceptron. Di mana akurasi regresi logistik mencapai 97,02, sedangkan tingkat akurasi perceptron adalah 95,54, tetapi waktu pelatihan perceptron hanya membutuhkan waktu 3,8 sekon, sedangkan regresi logistik membutuhkan waktu 780,94 sekon.
ABSTRACTThe goal of spam filtering is to identify an e mail as spam or not spam. With the rapid development of machine learning, more problem can be solved. One of it is spam filtration. E mail spam filtering can be done with the help of binary classifier using machine learning for the classification. This research would use logistic regression and perceptron technique to filter spam. Data taken from Enron Spam dataset. The result indicate that logistic regression show better result than perceptron. Whereas the accuracy from logistic regression could reach 97,02, while accuracy from perceptron is 95,54, meanwhile the training time for perceptron takes only 3,8 second, while logistic regression takes about 780,94 second.