Serangan jaringan semakin beragam seiring berkembangnya internet. Dalam menghadapiserangan-serangan tersebut, diperlukan juga pengembangan sistem keamanan internetterhadap pengguna salah satunya adalah IDS. Intrusion detection system (IDS) merupakansistem keamanan dalam mengawasi aktivitas jaringan yang berbahaya bagi pengguna.Metode yang umum digunakan yaitu signature-based IDS. Signature-based IDSmenggunakan daftar serangan siber yang diketahui dalam menentukan jaringan berbahayaatau normal. Akan tetapi, IDS hanya mengetahui serangan yang diketahui saja danmembutuhkan input secara manual untuk mengubah daftar serangan sehingga tidak efektifdalam mengatasi serangan yang tidak ketahui. Oleh karena itu, penelitian ini berfokus padapengembangan IDS dengan pendekatan machine learning menggunakan model autoencoderuntuk reduksi dimensi dan pengaruhnya terhadap model IDS. Autoencoder yang digunakanpada penelitian ini terdapat 2 model yaitu non-symmetric deep autoencoder (NDAE) danmodifikasi dari NDAE menggunakan metode variational autoencoder (VAE) yang disebutsebagai V-NDAE, serta model PCA. Modifikasi NDAE bertujuan untuk mengambilinformasi penting dengan menggunakan distribusi probabilistik sehingga menjadi data yangberkualitas untuk pelatihan model IDS. Pengujian reduksi dimensi dari model-model inidilakukan dengan melatih model IDS yaitu model random forest. Penelitian ini dilakukanpada 2 dataset yang berbeda yaitu dataset CICIDS2017 dan dataset dari simulasi seranganjaringan. Metrik yang digunakan adalah metrik accuracy, precision, recall, F-1 score, ROCcurve. Berdasarkan pengujian yang telah dilakukan terhadap dataset CICIDS2017, modelNDAE memiliki nilai rata-rata akurasi validasi sebesar 90.85% sehingga memiliki nilai yanglebih besar daripada model V-NDAE yang memiliki nilai rata-rata akurasi validasi sebesar87.65%. Pelatihan model NDAE menggunakan hyperparameter yang paling optimal yaitudengan optimizer RMSProp dan batch size sebesar 128. Pada pengujian terhadap datasetdari simulasi serangan jaringan, model NDAE memiliki performa yang lebih baik daripadamodel V-NDAE dan model PCA. Model NDAE memiliki nilai rata-rata akurasi validasisebesar 94.66% dan model V-NDAE memiliki nilai rata-rata akurasi validasi sebesar66.32%. Pelatihan model NDAE menggunakan hyperparameter yang paling optimal yaitudengan optimizer Adam dan batch size sebesar 32. The variety of network attacks increases as the internet evolves. In dealing with these attacks,the development of an internet security system for users is necessary, one of which is IDS.An intrusion detection system (IDS) is a security system designed to monitor networkactivity that is dangerous for users. The commonly used method is signature-based IDS.Signature-based IDS uses a signature database of known cyber attacks to determine whethera network is dangerous or normal. However, this IDS only recognizes known attacks andrequires manual input to change the signature database of attacks, making it ineffective indealing with unknown attacks. Therefore, this research focuses on developing an IDS usinga machine learning approach, specifically using an autoencoder model for dimensionalityreduction and its impact on the IDS model. The models used in this research consists of anon-symmetric deep autoencoder (NDAE), modification of NDAE using the variationalautoencoder (VAE) method, and PCA model. The modified NDAE can capture importantinformation from the latent distribution, which helps stabilize the training of the model.Dimensionality reduction testing for both models is performed by training an IDS model,specifically a random forest model. This research is conducted on two different datasets: theCICIDS2017 dataset and a dataset from network attack simulations. The evaluation metricsused are accuracy, precision, recall, F-1 score, and ROC curve. Based on the testingperformed on the CICIDS2017 dataset, the NDAE model achieves an average validationaccuracy of 90.85%, which is higher than the average validation accuracy of 87.65% for theV-NDAE model and PCA model. The NDAE model's training is done using the most optimalhyperparameters, specifically the RMSProp optimizer and a batch size of 128. In the testingon the dataset from network attack simulations, the NDAE model outperforms the V-NDAEmodel and PCA model. The NDAE model achieves an average validation accuracy of94.66%, while the V-NDAE model achieves an average validation accuracy of 66.32%. TheNDAE model's training is done using the most optimal hyperparameters, specifically theAdam optimizer and a batch size of 32. |