Tren adalah suatu pola yang berulang, sementara analisis tren merupakan praktik pengumpulan dan analisis data dalam upaya untuk menemukan pola tersebut. Analisis tren adalah suatu metode untuk memproyeksikan kondisi masa depan berdasarkan data masa lalu hingga saat ini. Tinjauan literatur sistematis, bibliometrik, dan topic modeling adalah beberapa contoh pendekatan yang sering dipakai untuk menangkap fenomena perkembangan tren sains dan teknologi. Penelitian ini bertujuan untuk melakukan pengujian dan implementasi algoritma deteksi topik berbasis clustering yang dikombinasikan dengan analisis kualitatif dalam pendeteksian tren topik untuk mendapatkan gambaran yang menyeluruh mengenai konsep, struktur ilmiah, topik utama, dan perkembangan bidang teknologi big data dan smart sustainable city. Analisis topik dilakukan terhadap kumpulan data bibliografi publikasi ilmiah terkait kedua bidang tersebut yang didapat dari basis data Scopus dan CORE. Pengujian terhadap kinerja algoritma Deep-autoencoder based Fuzzy C-Means (DFCM) untuk deteksi topik dari corpus dokumen publikasi ilmiah menunjukkan bahwa algoritma DFCM menunjukkan kinerja yang baik serta dapat mengungguli kinerja algoritma-algoritma standar yang banyak dipakai untuk pendeteksian topik seperti Non-negatif Matrix Factorization (NMF) dan Latent Dirichlet Allocation (LDA) pada corpus dengan ukuran besar. Analisis hasil clustering terhadap data publikasi ilmiah memberikan gambaran perkembangan dan topik-topik yang menjadi “highlight” dalam periode tertentu, mencari research gap dan mengetahui karakteristik penelitian, serta memprediksi topik penelitian apa saja yang menjanjikan di masa depan. A trend is a recurring pattern, while trend analysis is the practice of collecting and analyzing data to find that pattern. Trend analysis is a method for projecting future conditions based on past to present data. Systematic literature review, bibliometrics, and topic modeling are examples of approaches that are often used to capture the phenomenon of the development of science and technology trends. This study examined and implemented clustering-based topic detection algorithms, combined with qualitative analysis, to comprehensively picture the concept, scientific structure, main topics, and developments in big data technology and smart and sustainable city. The topic analysis is performed on collecting bibliographic data from scientific publications related to these two fields obtained from the Scopus and CORE database. In this research, the deep-autoencoder based on the Fuzzy C-Means (DFCM) algorithm's performance for topic detection from the corpus of scientific publication documents was examined. Based on the experiment's results, it can be concluded that the DFCM algorithm shows good performance and can outperform standard algorithms that are widely used for topic detection, such as Non-negative Matrix Factorization (NMF) and Latent Dirichlet Allocation (LDA) on topic detection tasks in huge corpus text. The clustering results analysis on scientific publication data provides an overview of research topics and developments that become "highlights" in a certain period, discover research gaps and characteristics, and predict what research topics are promising in the future. |