Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 110263 dokumen yang sesuai dengan query
cover
Ibtisami Najahaty
"Pendeteksian topik merupakan suatu proses untuk mendapatkan topik dari suatu koleksi dokumen. Salah satu metode yang dapat digunakan untuk mendeteksi topik adalah nonnegative matrix factorization (NMF). Pada penelitian ini topik berita pada Twitter dideteksi menggunakan algoritma NMF berbasis metode langsung. Terdapat tiga tahap untuk menyelesaikan NMF berbasis metode langsung, yakni membentuk matriks kookurensi kata-kata, mencari kata anchor dan mencari matriks kata-topik. Pendeteksian topik dilakukan dengan jumlah topik yang berbeda-beda. Setelah didapatkan hasil berupa topik-topik dari pembicaraan di Twitter, kemudian tingkat akurasi topik-topik tersebut dianalisis menggunakan satuan topic recall, term precision dan term recall. Jumlah topik yang berbeda akan mempengaruhi tingkat akurasi topik-topik hasil NMF berbasis metode langsung.Pendeteksian topik merupakan suatu proses untuk mendapatkan topik dari suatu koleksi dokumen. Salah satu metode yang dapat digunakan untuk mendeteksi topik adalah nonnegative matrix factorization (NMF). Pada penelitian ini topik berita pada Twitter dideteksi menggunakan algoritma NMF berbasis metode langsung. Terdapat tiga tahap untuk menyelesaikan NMF berbasis metode langsung, yakni membentuk matriks kookurensi kata-kata, mencari kata anchor dan mencari matriks kata-topik. Pendeteksian topik dilakukan dengan jumlah topik yang berbeda-beda. Setelah didapatkan hasil berupa topik-topik dari pembicaraan di Twitter, kemudian tingkat akurasi topik-topik tersebut dianalisis menggunakan satuan topic recall, term precision dan term recall. Jumlah topik yang berbeda akan mempengaruhi tingkat akurasi topik-topik hasil NMF berbasis metode langsung.

Topic detection is a process to get the topic of a collection of documents. One method that can be used to detect the topic is nonnegative matrix factorization (NMF). In this research, the topic of the news on Twitter detected using NMF algorithm based on the direct method. There are three stages to complete NMF-based direct method, they are, form the word-word coocurence matrix, look for the anchor word and seek word-topic matrix. Topic detection performed by the different numbers of topic. Once the results are obtained in the form of topics of conversation in Twitter, then the level of accuracy of these topics were analyzed using the unit topic recall, term precision and term recall. Number of different topics will affect the accuracy of topics results of NMF-based direct method."
Depok: Universitas Indonesia, 2015
S60924
UI - Skripsi Membership  Universitas Indonesia Library
cover
Lina Hidayati
"The rapid development of online news on the Internet has increased the number of news document. Information about the main topics become a necessity for people to determine the trending that is discussed at a certain time. Therefore, a way to find the main topic of news from very large documents quickly and efficiently is developed. Topic detection is the process to find a topic from documents collection. Detecting topics on a very large document is hardly done manually so that automatic methods are needed. One method to detect topic automatically is the theory based on model matrix factorization, Nonnegative Matrix Factorization (NMF). NMF can be solved directly by using the assumption that every topic has at least one word that does not appear in other topic called the anchor word. In this research, NMF based on direct method will be applied for detecting the main topics of Indonesia online news.

Perkembangan berita online di internet meningkatkan jumlah berita yang tersedia. Informasi mengenai topik utama menjadi suatu kebutuhan bagi masyarakat untuk mengetahui hal yang dominan dibicarakan pada waktu tertentu. Oleh karena itu dibutuhkan suatu cara cepat dan efisien untuk menemukan topik utama dari dokumen berita yang sangat besar. Pendeteksian topik merupakan suatu proses untuk menemukan topik dari suatu koleksi dokumen. Pendeteksian topik pada dokumen yang sangat besar sulit dilakukan secara manual sehingga dibutuhkan metode otomatis. Salah satu metode otomatis untuk pendeteksian topik adalah model yang berbasis teori faktorisasi matriks yaitu Nonnegative Matrix Factorization (NMF). NMF pada pendeteksian topik dapat diselesaikan secara langsung dengan menggunakan asumsi bahwa setiap topik memiliki satu kata yang tidak terdapat pada topik lainnya yang disebut sebagai kata anchor. Dalam penelitian ini akan diterapkan NMF berbasis metode langsung untuk mendeteksi topik utama dari berita online Indonesia"
Depok: Universitas Indonesia, 2015
S60088
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dini Rahmawati Akmalia
"Perkembangan teknologi dan informasi kini telah memberikan berbagai kemudahan dalam menjalani kehidupan. Salah satu perkembangan teknologi tersebut adalah munculnya berbagai portal berita online di Indonesia. Hal ini menyebabkan banyak berita online yang tersebar di Indonesia. Untuk mengetahui topik utama pada waktu tertentu, sulit jika harus membaca seluruh berita online. Oleh karena itu, digunakan proses pemodelan topik yang secara otomatis membantu menemukan topik utama yaitu metode NMF (Nonnegative Matrix Factorization). Dalam metode NMF, kumpulan berita online direpresentasikan sebagai matriks. Kemudian, metode NMF memfaktorisasi matriks tersebut menjadi matriks-matriks yang nonnegatif. Secara umum, sparseness merupakan akibat dari proses faktorisasi matriks. Namun, dalam penelitian ini, dilakukan proses pengaturan derajat sparseness pada metode NMF. Proses analisis pengaruh derajat sparseness dalam metode NMF pada ekstraksi topik utama berita online Indonesia ini dilihat pada tingkat interpretabilitas topik yang dihasilkan, semakin sparse suatu matriks maka semakin sulit untuk diinterpretasikan.

Development of technology and information nowadays gives many tools to be alive. One of that improved is the appearance of many portals of online news in Indonesia. As a consequences, many online news spread easily in Indonesia. For knowing the main topics in some time, it can be hard to read all the online news in short time. So that, using topic modeling that automatically help people to find the main topics. Non-negative matrix factorization (NMF) method is part of the topic modeling. In NMF method, the collection of online news are representing by a matrix. After that, NMF method factors that matrix into two nonnegative matrixs. Generally, sparseness is a result of the factorization process. But, in this research, we use to controlling the degree of sparseness in NMF method. Process of analizing the impact of degrees of sparseness for extracting main topics of Indonesia online news are seeing by the interpretability of the topics, more sparse the matrix, more difficult to interpret."
Depok: Universitas Indonesia, 2015
S59658
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rosiana Disiati Prabandari
"ABSTRAK
Era globalisasi tidak dapat menahan besarnya pengaruh kecanggihan teknologi informasi, salah satunya adalah internet. Perkembangan teknologi internet tentu meningkatkan jumlah informasi yang tersedia. Informasi tersebut dapat berupa berita ? berita aktual yang dapat diakses melalui media sosial, seperti Twitter. Oleh karena itu, dibutuhkan suatu cara cepat dan efisien untuk menemukan topik utama dari Twitter. Pendeteksian topik pada dokumen yang sangat besar sulit dilakukan secara manual sehingga dibutuhkan metode otomatis, salah satunya faktorisasi matriks yaitu Nonnegative Matrix Factorization (NMF). Salah satu metode NMF yang telah berhasil dikembangkan dengan komplesitas waktu polinomial adalah P-NMF dengan algoritma AGM yang memiliki asumsi bahwa setiap topik memiliki sedikitnya satu kata yang tidak terdapat pada topik lainnya yang disebut sebagai kata anchor. P-NMF dengan algoritma AGM terdiri dari tiga tahapan, yaitu pembentukan matriks coocurance, pencarian kata anchor, dan recover. Pada penelitian ini akan diterapkan P-NMF dengan Recover KL untuk mendeteksian topik pada twitter, kemudian hasilnya akan dibandingkan dengan LDA dan P-NMF dengan Original Recover. Penelitian menunjukan bahwa P-NMF dengan Recover KL mampu meningkatkan akurasi untuk pendeteksian topik pada Twitter.

ABSTRACT
The era of globalization can?t withstand the influence of sophistication of information technology, such as Internet. Development of Internet technology would increase the amount of information. The information may be actual news that can be accessed through social media, such as Twitter. Therefore, needed a fast and efficient way to find the main topics of Twitter. Detection topics on very large documents difficult to do manually so it takes automated methods, one of which is nonnegative matrix factorization (NMF). One method that has been successfully developed NMF with polynomial time complexity is P-NMF algorithm AGM which assumes that each topic has at least one word that doesn?t appear on other topics, called anchor words. P-NMF algorithm AGM consists of three steps, the establishment of a matrix coocurance, finding anchor words, and recover. This research will be implemented P-NMF with Recover KL to detect topics on twitter, then the results will be compared with the LDA and P-NMF with Original Recover. Research shows that P-NMF with Recover KL can improve detection accuracy for topics on Twitter."
2016
T46037
UI - Tesis Membership  Universitas Indonesia Library
cover
Delano Novrilianto
"ABSTRAK
Pendeteksian topik merupakan proses untuk mendapatkan topik dari koleksi data tekstual. Salah satu metode otomatis untuk masalah pendeteksian topik adalah Separable Nonnegative Matrix Factorization SNMF . Terdapat tiga tahap yang dilakukan untuk menyelesaikan SNMF yakni membentuk matriks kookurensi kata-kata, menentukan kata-kata anchor, dan mencari matriks kata-topik. Metode yang umum digunakan untuk menentukan kata-kata anchor pada tahap kedua dari penyelesaian SNMF adalah dengan metode berbasis Convex Hull. Pada penelitian ini digunakan pendekatan lain untuk menentukan kata-kata anchor yaitu dengan memakai metode Singular Value Decomposition SVD . Topik-topik yang dihasilkan dengan kata-kata anchor -nya ditentukan dengan metode SVD dievaluasi tingkat intepretabilitasnya dengan memakai satuan Pointwise Mutual Information PMI dan dibandingkan dengan topik-topik dimana kata-kata anchor -nya ditentukan dengan metode berbasis Convex Hull. Waktu komputasi yang dibutuhkan untuk menentukan kata-kata anchor dengan metode SVD juga dibandingkan dengan waktu komputasi yang dibutuhkan untuk menentukan kata-kata anchor dengan metode berbasis Convex Hull.

ABSTRACT
Topic detection is the process of getting topics from a collection of textual data. One of the methods for detection problems is the Separable Nonnegative Matrix Factorization SNMF . There are three stages done to complete SNMF that is to form the word kookurensi matrix, determine the anchor words, and search for the word topic matrix. The common method used to determine the anchor words in the second stage of SNMF completion is the Convex Hull based method. In this research another approach is used to determine the anchor words, that is using Singular Value Decomposition SVD method. The resulting topics where the anchor words are determined by the SVD method will be evaluated for their interpretability level by using the Pointwise Mutual Information PMI unit and will compare with the topics where the anchor 39 s words are based on the Convex Hull based method. The computational time required to determine the anchor words by the SVD method will also be compared with the computational time required to determine the anchor words by the Convex Hull based method."
2017
S68021
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ika Dwi Novitasari
"ABSTRAK
Pendeteksian topik merupakan suatu proses untuk menemukan topik atau pokok pembahasan utama dalam suatu kumpulan dokumen. Pada penelitian ini, pendeteksian topik diterapkan pada media sosial, yaitu Twitter. Pendeteksian topik pada Twitter secara manual sulit dilakukan karena terlalu banyak tweets. Oleh karena itu, dibutuhkan adanya pendeteksian topik secara otomatis. Salah satu metode otomatis untuk pendeteksian topik adalah metode Separable-Nonnegative Matrix Factorization S-NMF dengan algoritma AGM. S-NMF merupakan model berbasis faktorisasi matriks yang dapat diselesaikan secara langsung dengan menggunakan asumsi bahwa setiap topik memiliki satu kata yang tidak terdapat pada topik lainnya yang disebut kata anchor. S-NMF dengan algoritma AGM terdiri dari tiga tahapan, yaitu pembentukan matriks coocurance, penentuan kata anchor, dan recover. Dalam penelitian ini dilakukan proses penentuan kata anchor berbasis Singular Value Decomposition SVD . Kemudian, hasilnya akan dibandingkan dengan penentuan kata anchor metode Convex Hull berbasis Gram-Schmidt. Penelitian memberikan hasil bahwa dengan memperhatikan semua kata sebagai kandidat kata anchor, SVD memberikan hasil yang lebih baik daripada Convex Hull. Sedangkan, jika menggunakan anchor threshold, Convex Hull masih memberikan hasil yang lebih baik dibandingkan dengan SVD.

ABSTRACT
Topic detection is a process to find main topic or main subject of discussion in a collection of documents. In this research, topic detection is applied to social media, namely Twitter. Manual detection of topics on Twitter is difficult because of too many tweets. Therefore, it is necessary to detect topics automatically. One of the automatic methods for topic detection is the Separable Nonnegative Matrix Factorization S NMF method with the AGM algorithm. S NMF is a matrix factorization based model that can be solved directly using the assumption that each topic has one word that is not present in another topic called anchor words. S NMF with AGM algorithm consists of three stages, namely the formation of coocurance matrix, finding the anchor words, and recover. In this research, the process of finding anchor words was done based on Singular Value Decomposition SVD . Then, the result was compared to anchor word finding by Convex Hull based method. The results has shown that by considering all words as anchor word candidates, SVD gave better results rather than Convex Hull. Meanwhile, when the anchor finding was done by using anchor threshold, Convex Hull still gave better result rather than SVD."
2017
T47592
UI - Tesis Membership  Universitas Indonesia Library
cover
Naufal Khairil Imami
"ABSTRAK
Deteksi topik adalah proses yang digunakan untuk menganalisis kata-kata dalam kumpulan data tekstual untuk ditentukan topik dalam koleksi, bagaimana mereka saling berhubungan, dan bagaimana topik ini berubah dari waktu ke waktu. Salah satu metode yang digunakan untuk mendeteksi topik adalah Nonnegative Matrix
Metode Factorization (NMF) berdasarkan metode langsung atau disebut Separable Nonnegative Matriks Faktorisasi (SNMF). Dalam penelitian ini, tweet data diambil dari akun berita nasional pada aplikasi Twitter, dan topik terdeteksi menggunakan metode SNMF. Ada tiga tahap dalam metode SNMF, yaitu, menghasilkan kata co-kejadian
matriks, menentukan kata jangkar, dan memulihkan untuk mendapatkan matriks topik-kata. Penentuan dari kata anchor dilakukan dengan menggunakan tiga metode berbeda, yaitu Convex Metode berbasis lambung, metode SVD berdasarkan kata maksimum pada topik, dan SVD
metode berdasarkan perbedaan kata pada topik. Dalam deteksi topik, jumlah topik diproduksi bervariasi tergantung pada jumlah kata jangkar yang dihasilkan. Setelah mendapatkan topik, akurasi dihitung menggunakan unit topik word2vec. Hasil yang diperoleh menggunakan
tweet data akun berita nasional menunjukkan bahwa metode SVD berdasarkan perbedaan kata pada topik memiliki evaluasi topik yang buruk dibandingkan dengan dua topik lainnya.

ABSTRACT
Topic detection is the process used to analyze words in a textual data set to determine the topics in a collection, how they are related, and how these topics change over time. One method used to change the topic is the Nonnegative Matrix The Factorization (NMF) method is based on the direct method or called Separable Nonnegative Factor Matrix (SNMF). In this study, tweet data is taken from national news accounts on the Twitter application, and topics taken using the SNMF method. There are three methods in SNMF, namely, generating co-occurrence words matrix, determine anchor words, and recover to get a topic-word matrix. Determination of the word anchor is done using three different methods, namely Convex the stomach-based method, the SVD method based on the maximum words on the topic, and SVD method based on differences in words on the topic. In topic detection, the number of topics created varies depending on the number of anchor words produced. After getting the topic, it is calculated using the word2vec topic unit. The results obtained using National news account data tweets show the SVD method based on word differences on the topic has a worse evaluation topic compared to the other two topics."
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hanif Fatrial
"Penelitian tugas akhir sarjana di Departemen Matematika Universitas Indonesia dapat berupa aplikasi matematika dalam kehidupan sehari-hari. Salah satu aplikasinya dapat diterapkan pada pencarian topik pada portal berita Indonesia online secara otomatis dengan bantuan mesin. Dengan transformasi kata-kata pada artikel portal berita Indonesia online kedalam bentuk matriks, dapat dilakukan proses Latent Semantic Analysis (LSA) dengan menggunakan metode Nonegative Matrix Factorization dalam mengekstraksi kata-kata pendukung topik dari sekumpulan dokumen. Pada skripsi ini akan dibahas mengenai implementasi Latent Semantic Analysis dengan menggunakan Nonegative Matrix Factorization (NMF) dalam ekstraksi kata-kata pendukung topik sehingga kata-kata tersebut dapat menginterpretasikan topik utama harian dari portal berita Indonesia online.

There are a wide range of fields in mathematics that can be used as a final research in the Department of Mathematics, University of Indonesia, including the applications of mathematics for daily life. One of the applications can be applied to searching topic in Indonesia online news portal automatically with machines. Latent Semantic Analysis (LSA) using Matrix Factorization Nonegative method can extract the words from a collection of documents which supporting the topic. This skripsi will be discussed on the implementation of Latent Semantic Analysis using Nonegative Matrix Factorization in extraction for the words wich support topics that words can be interpretation of a topic Indonesian daily online news portal."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2012
S42926
UI - Skripsi Open  Universitas Indonesia Library
cover
Christhoper Nugraha
"ABSTRAK
Deteksi topik adalah proses menganalisis kumpulan data tekstual untuk menentukan topik pengumpulan data tekstual. Salah satu metode pengelompokan yang dapat digunakan untuk deteksi topik adalah metode Fuzzy C-Means (FCM). Namun, penggunaan FCM sederhana untuk pendeteksian topik tentang big data kurang efektif, karena akan memakan waktu lama dan banyak memori. FCM sederhana juga memiliki masalah lain, ketika melakukan deteksi topik aktif data dimensi tinggi, FCM sederhana hanya akan menghasilkan satu topik. Dalam penelitian ini, suatu gabungan metode Single-Pass Fuzzy C-Means (SPFCM) dan Fuzzy C-Means Berbasis Eigenspace (EFCM) diusulkan, yaitu Single-Pass Eigenspace-Based Fuzzy C-Means (SPEFCM) metode untuk mengatasi masalah ini. Data yang digunakan untuk deteksi topik adalah
tweet yang berasal dari aplikasi Twitter. Lalu, keakuratan topik didapat menggunakan SPEFCM dan EFCM akan dibandingkan berdasarkan nilai koherensi. Itu hasil simulasi menunjukkan bahwa nilai koherensi topik yang diperoleh menggunakan SPEFCM adalah sebanding dengan EFCM. Ini menunjukkan bahwa SPEFCM adalah metode yang tepat untuk mendeteksi topik pada data besar, tanpa mengurangi kualitas topik yang dihasilkan.

ABSTRACT
Topic detection is the process of analyzing a textual data set to determine the topic of textual data collection. One of the grouping methods that can be used for topic detection is the Fuzzy C-Means (FCM) method. However, the use of simple FCM for the detection of topics about big data is less effective, because it will take a long time and a lot of memory. Simple FCM also has another problem, when detecting active topics of high dimensional data, simple FCM will only produce one topic. In this study, a combination of the Single-Pass Fuzzy C-Means (SPFCM) method and the Fuzzy C-Means Based on Eigenspace (EFCM) is proposed, namely the Single-Pass Eigenspace-Based Fuzzy C-Means (SPEFCM) method to overcome this problem. The data used for topic detection is
tweets that come from the Twitter application. Then, the accuracy of the topics obtained using SPEFCM and EFCM will be compared based on coherence values. The simulation results show that the topic coherence value obtained using SPEFCM is comparable to EFCM. This shows that SPEFCM is the right method for detecting topics in big data, without reducing the quality of the topics produced."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Angga Pratama
"ABSTRAK
Perkembangan teknologi khususnya internet berkembang begitu pesat dewasa ini. Oleh karena itu, arus informasi meningkat begitu cepat yang menyebabkan informasi diperoleh sangat banyak. Media sosial pun menjadi salah satu sarana penyedia informasi, salah satunya adalah Twitter. Pendeteksian topik menjadi suatu kebutuhan bagi masyarakat untuk mengetahui hal-hal yang bicarakan pada waktu tertentu. Maka, dibutuhkan suatu cara yang cepat dan tepat untuk mendapatkan topik dari tweet yang terkirim pada Twitter. Dengan jumlah dokumen yang sangat besar, diperlukan suatu metode otomatis. Salah satu metode otomatis untuk pendeteksian topik adalah model yang berbasis faktorisasi matriks yaitu Non-negative Matrix Factorization (NMF). Metode NMF yang digunakan pada penelitian ini difokuskan pada wilayah Jakarta dan sekitarnya guna melihat topik yang dibahas masyarakat Jakarta dan sekitarnya pada kurun waktu tertentu. Hasil yang didapatkan lewat metode NMF ini selanjutnya akan dievaluasi dengan cara melihat tingkat akurasi yang dihasilkan lalu disimulasikan dalam bentuk tren berdasarkan frekuensi masing-masing topik.

ABSTRACT
Development of technology spesifically in internet grows so fast nowadays. Therefore, flow of information increase rapidly that leads information to be obtained so much. Social media become the one information provider, such as Twitter. Topic detection become a public society to know the things that being discussed at a certain time. Hence, needed a quick and precise method to obatain topic from tweet posted from twitter. With large amount of document, needed an automaticly method. One of automaticly method that based on matrix factorization is Non-negative Matrix Factorization as usually being called as NMF. Non-negative matrix factorization method on this research focused on region of Jakarta in order to know what are being discussed by society there in a period of time. The result have been obtain with NMF method will be evaluated by calculating the accuracy and finally will be simulated in the form of trend plot based on the frequency of the topic."
2016
S65611
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>