"
ABSTRAKTren belanja yang terus meningkat mendorong tumbuhnya bisnis e-commerce di Indonesia yang salah satunya adalah suatu perusahaan e-commerce di Indonesia. Salah satu peran penting untuk mendukung bisnis e-commerce adalah kategorisasi produk yang baik. Kategorisasi produk yang baik akan membuat pencarian produk sesuai dengan kebutuhan dari pelanggan. Hal ini berdampak baik pada tingkat penjualan, pengalaman pengguna, maupun pengelolaan produk di sisi internal perusahaan. Akan tetapi, terdapat temuan kesalahan kategori yang penyebab utamanya adalah proses kategorisasi yang masih bersifat manual, berulang, dan massive.
Penelitian ini bertujuan untuk membantu menyelesaikan permasalahan tersebut dengan membuat suatu model yang mampu melakukan klasifikasi produk secara otomatis. Data yang digunakan adalah judul produk, sedangkan untuk label adalah kategori dari setiap produk. Penelitian ini melakukan percobaan terhadap dua representasi yaitu bag-of-words (BoW) dan TF-IDF. Selain itu, penelitian ini menggunakan algoritma naïve bayes dan SVM dalam percobaannya.
Hasil dari penelitian ini didapatkan model yang mampu melakukan klasifikasi produk salah satu perusahaan e-commerce secara baik. Kombinasi BoW dan SVM mampu menghasilkan model performa yang terbaik dengan nilai akurasi 96.40% dan F-measure 95.90%. Selain itu dari penelitian ini didapatkan hasil representasi BoW memberikan performa yang lebih baik dibandingkan dengan TF-IDF.
ABSTRACTThe increasing shopping trend encourages the growth of e-commerce businesses in Indonesia, one of which is e-commerce company in Indonesia. On of the important role to support e-commerce business is well-managed product categorization. Good product categorization will impact the product search according to the customer needs. This will affect the level of sales, user experience, and product management in the internal side of the company. However, some errors were found in the product category, the main causes are the manual categorization, repetitive, and massive process.
This study is aimed to solve the problem by making a model that able to classify products automatically. The data that used in this study is the product title, while the label is the category of each product. This study conducted experiments on two representations; bag-of-words (BoW) and TF-IDF. In addition, this study is using naïve bayes and SVM algorithms in the experiment.
This study resulted a model that able to classify one of e-commerce company products properly. The combination of BoW and SVM is able to produce the best performance model with an accuracy value of 96.40% and F-measure 95.90%. On the other hand, the results of the BoW representation provided the better performance than the TF-IDF."