ABSTRAKData besar tidak hanya dilihat dari jumlah sampelnya tetapi juga dapat dilihat dari berapa
banyak ciri yang tersimpan di setiap sampel tersebut. Seleksi ciri yang paling representatif
adalah tugas penting pada data besar untuk mengurangi dimensi. Metode seleksi ciri
dapat menjadi solusi untuk mengatasi masalah ini. Pada penelitian ini diterapkan metode
penggabungan seleksi ciri yang terdistribusi secara homogen dengan partisi 2-dimensi
untuk memperbaiki algoritme klasifikasi. Dari hasil eksperimen yang telah dilakukan
dapat ditarik kesimpulan metode yang dirancang mampu memperbaiki kinerja metode
klasifikasi untuk setiap dataset yang digunakan. Metode yang diusulkan menggunakan
partisi 2-dimensi yang dapat mempercepat proses latih sekaligus memperbaiki kinerja
akurasi. Metode yang diusulkan dapat memperbaiki metode sebelumnya rata-rata 2%
untuk dibeberapa dataset dan mempercepat proses hampir 2 kalinya.
ABSTRACTBig data is not only seen from the number of its samples but can also be seen from how
many features were stored in each sample. The selection of the most representative feature is an important task in big data analysis in order to reduce the dimension. The feature
selection method can be a solution to overcome this problem. In this research, a homogeneous distributed ensemble feature selection method with 2-dimensional partition is
used as the feature selection. The results showed that the proposed method can speed up
the training process in addition to improving the classification accuracy. The proposed
method can improve the accuracy from the standard feature selection method with an increase of 2% for several datasets. In addition, it also speeds up the computation to almost
two times faster.