Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 55 dokumen yang sesuai dengan query
cover
Nicholas Ramos Richardo
"Pendeteksian topik adalah suatu proses untuk menentukan suatu topik dalam teks dengan menganalisis kata di dalam teks tersebut. Pendeteksian topik dapat dilakukan dengan membaca isi dari teks tersebut. Namun, cara ini semakin sulit apabila data yang dimiliki semakin besar. Memanfaatkan metode machine learning dapat menjadi alternatif dalam menangani data yang berjumlah besar. Metode clustering adalah metode pengelompokkan data yang mirip dari suatu kumpulan data. Beberapa contoh metode clustering adalah K-Means, Fuzzy C-Means (FCM), dan Eigenspaced-Based Fuzzy C-Means (EFCM). EFCM adalah metode clustering yang memanfaatkan metode reduksi dimensi Truncated Singular Value Decomposition (TSVD) dengan metode FCM (Murfi, 2018). Dalam pendeteksian topik, teks harus direpresentasikan kedalam bentuk vektor numerik karena model clustering tidak dapat memproses data yang berbetuk teks. Metode yang sebelumnya umum digunakan adalah Term-Frequency Inversed Document Frequency (TFIDF). Pada tahun 2018 diperkenalkan suatu metode baru yaitu metode Bidirectional Encoder Representations from Transformers (BERT). BERT merupakan pretrained language model yang dikembangkan oleh Google. Penelitian ini akan menggunakan model BERT dan metode clutering EFCM untuk masalah pendeteksian topik. Kinerja performa model dievaluasi dengan menggunakan metrik evaluasi coherence. Hasil simulasi menunjukkan penentuan topik dengan metode modifikasi TFIDF lebih unggul dibandingkan dengan metode centroid-based dengan dua dari tiga dataset yang digunakan metode modifikasi TFIDF memiliki nilai coherence yang lebih besar. Selain itu, BERT lebih unggul dibandingkan dengan metode TFIDF dengan nilai coherence BERT pada ketiga dataset lebih besar dibandingkan dengan nilai coherence TFIDF.

Topic detection is a process to determine a topic in the text by analyzing the words in the text. Topic detection can be done with reading the contents of the text.However, this method is more difficult when bigger data is implemented. Utilizing machine learning methods can be an alternative approach for handling a large amount of data. The clustering method is a method for grouping similar data from a data set. Some examples of clustering methods are K-Means, Fuzzy C-Means (FCM), and Eigenspaced-Based Fuzzy C-Means (EFCM). EFCM is a clustering method that utilizes the truncated dimension reduction method Singular Value Decomposition (TSVD) with the FCM method (Murfi, 2018). In topic detection, the text must be represented in numerical vector form because the clustering model cannot process data in the form of text. The previous method that was most commonly used is the Term-Frequency Inverse Document Frequency (TFIDF). In 2018 a new method was introduced, namely the Bidirectional Encoder method Representations from Transformers (BERT). BERT is a pretrained language model developed by Google. This study will use the BERT model and the EFCM clustering method for topic detection problems. The performance of the model is evaluated using the coherence evaluation metric. The simulation results show that modified TFIDF method for topic determination is superior to the centroid-based method with two of the three datasets used by modified TFIDF method having a greater coherence value. In addition, BERT is superior to the TFIDF method with the BERT coherence value in the three datasets greater than the TFIDF coherence value."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Darell Hendry
"Chatbot sebagai asisten virtual yang digunakan oleh suatu instansi dapat memberikan manfaat bagi penggunanya. Dengan adanya chatbot, pengguna dapat berbicara langsung kepada chatbot melalui pesan singkat, yang kemudian sistem secara spontan mengidentifikasi intent pesan tersebut dan merespons dengan tindakan yang relevan. Sayangnya, cakupan pengetahuan chatbot terbatas dalam menangani pesan oleh pengguna yang semakin bervariasi. Dampak utama dari adanya variasi tersebut adalah adanya perubahan pada komposisi label intent. Untuk itu, penelitian ini berfokus pada dua hal. Pertama, pemodelan topik untuk menemukan intent dari pesan pengguna yang belum teridentifikasi intent-nya. Kedua, pemodelan topik digunakan untuk mengorganisasi intent yang sudah ada dengan menganalisis hasil keluaran model topik. Setelah dianalisis, terdapat dua kemungkinan fenomena perubahan komposisi intent yaitu: penggabungan dan pemecahan intent, dikarenakan terdapat noise saat proses anotasi dataset orisinal. Pemodelan topik yang digunakan terdiri dari Latent Dirichlet Allocation (LDA) sebagai model baseline dan dengan model state-of-the-art Top2Vec dan BERTopic. Penelitian dilakukan terhadap dataset salah satu e-commerce di Indonesia dan empat dataset publik. Untuk mengevaluasi model topik digunakan metrik evaluasi coherence, topic diversity dan topic quality. Hasil penelitian menunjukkan model topik BERTopic dan Top2Vec menghasilkan nilai topic quality 0.036 yang lebih baik dibandingkan model topik LDA yaitu -0.014. Terdapat pula pemecahan intent dan penggabungan intent yang ditemukan dengan analisis threshold proporsi.

Chatbot, as a virtual assistant used by an institution, can provide benefits for its users. With a chatbot, users can speak directly to the chatbot via a short message, which then the system spontaneously identifies the intent of the message and responds with the relevant action. Unfortunately, the scope of chatbot knowledge is limited in handling messages by an increasingly varied user. The main impact of this variation is a change in the composition of the intent label. For this reason, this research focuses on two things. First, topic modeling to find intents from user messages whose intents have not been identified. Second, topic modeling is used to organize existing intents by analyzing the output of the topic model. After being analyzed, there are two possible phenomena of changing intent composition: merging and splitting intents because there is noise during the annotation process of the original dataset. The topic modeling used consists of Latent Dirichlet Allocation (LDA) as the baseline model and the state-of-the-art Top2Vec and BERTopic models. The research was conducted on one dataset of e-commerce in Indonesia and four public datasets. The evaluation metrics of coherence, topic diversity, and topic quality were used to evaluate the topic model. The results showed that the BERTopic and Top2Vec topic models produced a topic quality value of 0.036, better than the LDA topic model, which was -0.014. There are also intent splitting and intent merging found by proportion threshold analysis."
Depok: Fakultas Ilmu Komputer Universita Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Innova Safitri Suprapto Putri
"Skripsi ini membahas struktur wacana naratif dan unsur penghubung yang menjadi faktor keutuhan wacana bahasa Isyarat. Penelitian ini menggunakan metode deskriptif kualitatif dengan menganalisis video bahasa Isyarat tentang tuturan dongeng Kelinci dan Kura-kura yang disampaikan oleh dua informan Tuli penutur jati bahasa Isyarat Jakarta. Tujuan penelitian ini adalah menguraikan struktur wacana naratif dan unsur penghubung wacana dari unsur kohesif dan unsur topik komen atas data yang sudah diambil dan ditranskripsikan. Berdasarkan variabel struktur yang diberikan oleh Labov dan Waletzky 1967 , wacana naratif bahasa Isyarat memiliki kesesuaian dari segi strukturnya. Dalam hal keutuhan wacana, terdapat kesesuaian dengan aspek-aspek yang diajukan oleh Schembri dan Johnston 2007 dalam menganalisis unsur kohesif dan topik komen. Unsur topik komen sebagai keutuhan wacana naratif terlihat dalam kesinambungan topik. Unsur kohesif dan topik komen dalam wacana naratif oleh penutur Isyarat ditandai dengan gerakan manual dan gerakan nomanual.

This study deals with the narrative structure and connecting elements of narrative discourse in Jakarta Sign Language JakSL . There are two methods used in this study, descriptive and qualitative. This study aims to describe the narrative superstructure and connecting elements of narrative discourse mdash focusing on cohesive and topic comment mdash from the data. The data are taken from transcription of two narrative signing videos about fable mdash The Hare and The Tortoise mdash narrated by JakSL signers. Between the theories about narrative structure by Labov dan Waletzky 1967 , research by Schembri dan Johnston 2007 and analysis of the data, there are compatibility of aspects in narrative superstructure. Moreover, it appears that manual and non manual sign are used to mark the connecting elements of narrative discourse in cohesive aspects and topic comment. Topic comment aspect is constantly delivered in topic continuity to demonstrate the unity of narrative discourse.
"
Depok: Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 2016
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Robertus Agung Pradana
"Pendeteksian topik adalah suatu proses yang digunakan untuk menganalisis kata-kata pada suatu koleksi data tekstual untuk menentukan topik-topik yang ada pada koleksi tersebut, bagaimana hubungan topik-topik tersebut satu sama lainnya, dan bagaimana mereka berubah dari waktu ke waktu. Metod (FCM) merupakan metode yang sering digunakan pada masalah pendeteksian topik. FCM dapat mengelompokkan dataset ke beberapa kelompok dengan baik pada dataset dengan dimensi yang rendah, namun gagal pada dataset yang berdimensi tinggi. Untuk mengatasi permasalahan tersebut, dilakukan reduksi dimensi pada dataset sebelum dilakukan pendeteksian topik. Pada penelitian ini digunakan Convolutional Autoencoder dalam reduksi dimensi pada dataset. Oleh sebab itu, metode yang digunakan pada penelitian ini dalam pendeteksian topik adalah metode Convolutional-based Fuzzy C-Means (CFCM). Data yang digunakan dalam penelitian ini data coherence pada topik antara metode CFCM dengan satu convolutional layer (CFCM-1CL) dan metode CFCM dengan tiga convolutional layer (CFCM-3CL). Hasil penelitian ini menunjukkan bahwa nilai coherence dari metode CFCM-1CL lebih tinggi dibandingkan metode CFCM-3CL.
Topic detection is a process used to analyze words in a collection of textual data to determine the topics in the collection, how they relate to each other, and how they change from time to time. The Fuzzy C-Means (FCM) method is a clustering method that is often used in topic detection problems. Fuzzy C-Means can group dataset into multiple clusters on low-dimensional dataset, but fails on high-dimensional dataset. To overcome this problem, dimension reduction is carried out on the dataset before topic detection is carried out. In this study, Convolutional Autoencoder (CAE) is used in the reduction of dimensions in the dataset. Therefore, the method used in this research in topics detection is the Convolutional-based Fuzzy C-Means (CFCM) method. The data used in this study tweets national news account data on social media Twitter. CFCM method are divided into two stages, namely reducing the dataset dimension to a lower dimension using CAE and then clustering the dataset by using FCM to obtain topics. After the topics are obtained, an evaluation is done by calculating the value of coherence on the topics obtained. The study was conducted by comparing the coherence value on the topic between the CFCM method with one convolutional layer (CFCM-1CL) and the CFCM method with three convolutional layers (CFCM-3CL). The results of this study indicate that the coherence value of the CFCM-1CL method is higher than the CFCM-3CL method"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Natasha Rosaline
"Pendeteksian topik merupakan suatu teknik untuk memperoleh informasi dengan cara mengekstrak topik-topik dari kumpulan data yang sangat besar. Salah satu metode yang digunakan untuk pendeteksian topik adalah metode clustering, yaitu Fuzzy C-Means (FCM). Namun, kinerja dari FCM menjadi buruk saat harus melakukan clustering pada data yang berdimensi tinggi. Kelemahan dari FCM tersebut dapat ditanggulangi dengan cara melakukan reduksi dimensi. Pada penelitian ini, digunakan suatu metode deep learning, yaitu Deep Autoencoders (DAE), untuk mereduksi dimensi dari kumpulan data. Metode FCM clustering dengan reduksi dimensi DAE ini disebut Deep Autoencoders-Based Fuzzy C-Means (DFCM). Metode DFCM dibagi menjadi dua tahapan, yakni mereduksi dimensi kumpulan data yang berdimensi tinggi menggunakan Deep Autoencoders, dan melakukan FCM clustering pada data yang telah direduksi. Hasil dari metode DFCM adalah topik-topik. Topik-topik tersebut dievaluasi menggunakan nilai coherence. Pada penelitian ini, dibangun dua metode DFCM, yaitu FCM berbasis DAE dengan satu lapisan tersembunyi (DFCM-single hidden layer) dan FCM berbasis DAE dengan multi lapisan tersembunyi (DFCM-multi hidden layers). Hasil dari kedua metode ini menunjukkan bahwa topik-topik pada DFCM-single hidden layer memiliki nilai coherence lebih tinggi dari topik-topik pada DFCM-multi hidden layers.

Topic detection is a technique to find out information by extracting topics from big data. One method used for topic detection is the clustering method, namely Fuzzy C-Means (FCM). However, the performance of FCM becomes worse when clustering on highdimensional data. That weakness is resolved by dimensional reduction. In this research, deep learning method is used to reduce the dimensions of the data set, namely Deep Autoencoders (DAE). FCM clustering method with DAE dimensional reduction is called Deep Autoencoders-Based Fuzzy C-Means (DFCM). DFCM is divided into two parts. First, reducing the dimensions of high-dimensional data collection using Deep Autoencoders. Second, performing FCM clustering on the reduced data. Results of DFCM are topics. These topics are evaluated using the value of coherence. In this research, two DFCM methods were built, namely DAE with one hidden layer based FCM (DFCM-single hidden layer) and DAE with multi-hidden layers based FCM (DFCMmulti hidden layers). The results of these two methods show that the topics in DFCMsingle hidden layer have a higher coherence value than the topics in DFCM-multi hidden layers."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rilo Chandra Pradana
"

Pendeteksian topik adalah teknik untuk memperoleh topik-topik yang dikandung oleh suatu data tekstual. Salah satu metode untuk pendeteksian topik yaitu dengan menggunakan clustering. Namun, secara umum metode clustering tidak menghasilkan cluster yang efektif bila dilakukan pada data yang berdimensi tinggi. Sehingga untuk memperoleh cluster yang efektif perlu dilakukan reduksi dimensi pada data sebelum dilakukan clustering pada ruang fitur yang berdimensi lebih rendah. Pada penelitian ini, digunakan suatu metode bernama Deep Embedded Clustering (DEC) untuk melakukan pendeteksian topik. Metode DEC bekerja untuk mengoptimasi ruang fitur dan cluster secara simultan. Metode DEC terdiri dari dua tahap. Tahap pertama terdiri dari pembelajaran autoencoder untuk memperoleh bobot dari encoder yang digunakan untuk mereduksi dimensi data dan k-means clustering untuk memperoleh centroid awal. Tahap kedua terdiri dari penghitungan soft assignment, penentuan distribusi bantuan untuk menggambarkan cluster di ruang data, dan dilanjutkan dengan backpropagation untuk memperbarui bobot encoder dan centroid. Dalam penelitian ini, dibangun dua macam model DEC yaitu DEC standar dan DEC without backpropagation. DEC without backpropagation adalah DEC yang menghilangkan proses backpropagation pada tahap kedua. Setiap model DEC pada penelitian ini akan menghasilkan topik-topik. Hasil tersebut dievaluasi dengan menggunakan coherence. Dari penelitian ini dapat dilihat bahwa model DEC without backpropagation lebih baik daripada DEC standar bila dilihat dari waktu komputasi dengan perbedaan coherence antara keduanya yang tidak terlalu jauh.


Topic detection is a technique for obtaining the topics that are contained in a textual data. One of the methods for topic detection is clustering. However, generally clustering does not produce an effective cluster when it is done by using data with high dimension. Therefore, to get an effective cluster, dimensionality reduction is needed before clustering in the lower dimensional feature space. In this research we use DEC method for topic detection. DEC method is used to optimize the feature space and cluster simultaneously. DEC is divided into two stages. The first stage consists of autoencoder learning that obtains the weights of the encoder that used for dimension reduction and k-means clustering to get the initial centroid. The second stage consists of the soft assignment calculation, computing the auxiliary distribution that represents the cluster in the data space, and backpropagation to update the encoder weights and the centroid. In this research, two DEC models are built, namely the standard DEC and DEC without backpropagation. DEC without backpropagation is the DEC which eliminate the backpropagation process in the second stage. Every DEC models will produce topics. The results are evaluated using the coherence measure. From this research, it can be seen that DEC without backpropagation is better than standard DEC in terms of computation time with a slight difference in coherence measure.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dyta Anggraeni
"Klasifikasi topik adalah proses pembagian dokumen sesuai dengan topik yang terkandung dari dokumen tersebut. Dalam melakukan klasifikasi topik, pada tugas akhir ini digunakan metode Naïve Bayes dan Maximum Entropi dengan dua jenis data, yaitu artikel media massa dan abstrak tulisan ilmiah dari sistem Lontar. Percobaan ini dilakukan dan dianalisis dari beberapa aspek yaitu metode dan fitur yang digunakan, banyak topik yang digunakan, dan jenis data yang digunakan.
Hasil percobaan yang didapat adalah nilai akurasi tertinggi didapat pada saat menggunakan metode Naïve Bayes dengan informasi fitur frequency-normalized yaitu 95,73%. Selain itu, jumlah token yang semakin banyak digunakan secara umum akan meningkatkan nilai akurasi dan pemakaian abstrak tulisan ilmiah memberikan nilai akurasi yang hampir mirip dengan pemakaian artikel media massa.

Topic Classification is a process of categorizing document based on the topic contained in a document. To carry out the topic classification, we use Naïve Bayes and Maximum Entropy towards mass media article and abstracts of scientific papers from Lontar System. Experiments have been done and analyzed regarding several aspects, namely the methods and features, the number of topics, and the data.
In this thesis, we found that Naïve Bayes with frequency-normalized as feature information yield the highest accuracy, 95,73%. Furthermore, as the number of the tokens used increase, the accuracy also increases. Experiments using the abstracts of scientific papers yield similar accuracy to mass media article."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Sarah Widythia Pramono
"Zhuang Zi (369-286 SM) adalah seorang filsuf pada zaman negara berperang (475-221 SM), dan tokoh penting dalam perkembangan Daoisme setelah Lao Zi. Zhuang Zi menghasilkan satu karya utama semasa hidupnya, yaitu kitab Zhuangzi. Salah satu artikel dalam kitab Zhuangzi, ada artikel yang berjudul Qiushui atau dalam Bahasa Indonesia diterjemahkan menjadi (Suasana Musim Gugur) terdiri dari tiga belas paragraf pendek yang terbagi menjadi beberapa tema dan disajikan dalam bentuk dialog antara tokoh yang berbeda-beda. Dialog-dialog dalam artikel ini sangat pendek tetapi memiliki makna yang mendalam. Topik-topik dialog apa saja yang digunakan oleh Zhuang Zi dalam tulisannya dan filsafat dasar seperti apa yang menjadi pokok dari ketigabelas paragraf tersebut menjadi permasalahan yang akan diangkat dalam tulisan ini. Dari hasil kajian atas topik-topik dialog tersebut terungkap bahwa teks menyampaikan pesan bahwa setiap makhluk di dunia masing-masing memiliki peran, keberadaan dan fungsinya di dalam semesta.
Zhuang Zi (369-286 BC) is a Chinese philosopher in the Warring States Period (zhanguo shidai) (475-221 BC), and an important figure in the development of Daoism after Lao Zi. During his lifetime, Zhuang Zi delivered a work by his name, Zhuangzi. One of the articles in Zhuangzi, there is an article called Qiushui or in Indonesian translated into (Suasana Musim Gugur) consists of thirteen short paragraphs which are divided to several themes and presented in the form of dialogue between different characters. The dialogues in this article are short but have deep meaning. What dialogue topics and philosophies used by Zhuang Zi in his writings as the base of the thirteen paragraphs are the main point in this paper. The result revealed that the texts conveyed messages that every living creature has its role, existence, and function in the universe."
Depok: Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 2019
MK-pdf
UI - Makalah dan Kertas Kerja  Universitas Indonesia Library
cover
Suyati Suwarso
Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 1995
LP-pdf
UI - Laporan Penelitian  Universitas Indonesia Library
cover
Tuwaji
"Studi bibliometrik dan sebaran topik koleksi khusus di Perpustakaan STAIN Al Fatah Jayapuramencakup karya tulis ilmiah berupa buku yang ditulis dosen, laporan penelitian, artikel pada Jurnal Jabal Hikmah, skripsi, tesis, direktori, prosiding, dan kliping. Pembahasan tulisan ini meliputi aspek berikut: 1). Sebaran topik yang ditulis belum merata, ada bidang ilmu yang sering ditulis yaitu pendidikan agama Islam, baca tulis Al-Qur’an, metodologi pembelajaran, pengajaran dan pengajar dalam hal ini guru. Sementara bidang ilmu yang jarang ditulis yaitu bahasan bidang kurikulum, toleransi dalam Islam, peserta didik, sistem pendidikan dan bimbingan.2). Produktifitas penulis, paling produktif adalah Idrus Al Hamid dan Umar Faruq dengan 11 judul untuk jenis koleksi buku. Sementara untuk laporan penelitian, penulispaling produktif adalah Sofwan Aljauharidengan 3 judul. Untuk artikel yang ditulis dalam Jurnal Ilmiah Jabal Hikmah, penulis paling produktif adalah Idrus Al Hamid dan Safiudindengan 4 judul. Sedangkan fluktuasi jumlah koleksi khusus seluruhnya mencapai 511 judul. 3). Derajat kolaborasi penulis masih sangat rendah. Dari jumlah tersebut, penulis ganda terdapat pada 21 judul (4,07%), sisanya 490 judul (95,07%) adalah penulis tunggal. Sedangkan derajat kolaborasi terdapat pada koleksi karya tulis ilmiah-buku (0,6) dan laporan penelitian dengan derajat (0,38).4). Penggunaan referensi dengan tingkat keusangan rendah artinya beberapa literature atau rujukan buku yang digunakan merupakan buku-buku yang sering digunakan dan juga buku-buku yang baru terbit. Data referensi terbaru yang digunakan berumur 0 – 5 tahun sebanyak 34%, umur 6 – 10 tahun sebanyak 38% dan buku-buku rujukan yang tingkat keusanganya semakin tinggi, tingkat penggunaanya semakin rendah"
Jakarta: Pusat Jasa Perpustakaan dan Informasi, 2019
020 VIS 21:1 (2019)
Artikel Jurnal  Universitas Indonesia Library
<<   1 2 3 4 5 6   >>