Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 5 dokumen yang sesuai dengan query
cover
Rangga Kharisma Putra
"ABSTRAK
Tren belanja yang terus meningkat mendorong tumbuhnya bisnis e-commerce di Indonesia yang salah satunya adalah suatu perusahaan e-commerce di Indonesia. Salah satu peran penting untuk mendukung bisnis e-commerce adalah kategorisasi produk yang baik. Kategorisasi produk yang baik akan membuat pencarian produk sesuai dengan kebutuhan dari pelanggan. Hal ini berdampak baik pada tingkat penjualan, pengalaman pengguna, maupun pengelolaan produk di sisi internal perusahaan. Akan tetapi, terdapat temuan kesalahan kategori yang penyebab utamanya adalah proses kategorisasi yang masih bersifat manual, berulang, dan massive.
Penelitian ini bertujuan untuk membantu menyelesaikan permasalahan tersebut dengan membuat suatu model yang mampu melakukan klasifikasi produk secara otomatis. Data yang digunakan adalah judul produk, sedangkan untuk label adalah kategori dari setiap produk. Penelitian ini melakukan percobaan terhadap dua representasi yaitu bag-of-words (BoW) dan TF-IDF. Selain itu, penelitian ini menggunakan algoritma naïve bayes dan SVM dalam percobaannya.
Hasil dari penelitian ini didapatkan model yang mampu melakukan klasifikasi produk salah satu perusahaan e-commerce secara baik. Kombinasi BoW dan SVM mampu menghasilkan model performa yang terbaik dengan nilai akurasi 96.40% dan F-measure 95.90%. Selain itu dari penelitian ini didapatkan hasil representasi BoW memberikan performa yang lebih baik dibandingkan dengan TF-IDF.

ABSTRACT
The increasing shopping trend encourages the growth of e-commerce businesses in Indonesia, one of which is e-commerce company in Indonesia. On of the important role to support e-commerce business is well-managed product categorization. Good product categorization will impact the product search according to the customer needs. This will affect the level of sales, user experience, and product management in the internal side of the company. However, some errors were found in the product category, the main causes are the manual categorization, repetitive, and massive process.
This study is aimed to solve the problem by making a model that able to classify products automatically. The data that used in this study is the product title, while the label is the category of each product. This study conducted experiments on two representations; bag-of-words (BoW) and TF-IDF. In addition, this study is using naïve bayes and SVM algorithms in the experiment.
This study resulted a model that able to classify one of e-commerce company products properly. The combination of BoW and SVM is able to produce the best performance model with an accuracy value of 96.40% and F-measure 95.90%. On the other hand, the results of the BoW representation provided the better performance than the TF-IDF."
2019
TA-Pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Yosia Rimbo Deantama
"ABSTRAK
Pangan merupakan hak asasi manusia yang harus senantiasa terpenuhi oleh masyarakat dengan daya beli yang sesuai dan mempunyai kualitas pangan yang tinggi dan aman. Hal tersebut mendorong kedaulatan pangan suatu negara, yang secara mandiri memenuhi kebutuhan pangan masyarakatnya berdasarkan sistem pangan yang adil bagi seluruh masyarakat. Peraturan Pemerintah Republik Indonesia Nomor 17 Tahun 2015 yang mewajibkan adanya sistem informasi tentang pangan dan gizi dan teori evolusi e-government 3.0. Oleh karena itu salah satu solusi yang mendukung peraturan tersebut dan pendekatan e-government 3.0 adalah dengan pendekatan text mining. Penelitian ini mengolah data dari LAPOR! dan berita daring mengenai kedaulatan pangan untuk mengekstrak informasi dan menemukan pola-pola yang akan menghasilkan informasi tentang kedaulatan pangan di Indonesia sehingga dapat membantu pengambilan keputusan yang berdasar pada data melalui representasi visualisasi berbasis web. Jenis analisis informasi yang digunakan adalah Klasifikasi Dokumen untuk penyaringan dokumen, Named Entitiy Recognition yang digunakan untuk mengetahui entitas lokasi dan komoditas pangan dari data tekstual, dan Topic Modelling untuk menemukan topik dari sekumpulan teks dokumen berita dan aduan LAPOR!. Algoritma yang dipakai dalam penelitian ini adalah Conditional Random Fields dan Conditional Markov Model untuk implementasi Named Entity Recognition. Latent Dirichlet Allocation dan Non-Negative Matrix Factorization untuk implementasi Topic Modelling. Selain itu Naïve Bayes, Support Vector Machine, dan Logistic Regression digunakan untuk klasifikasi dokumen. Sedangkan pemilihan model ini menggunakan Conditional Random Field dengan nilai F1-score pada entitas lokasi sebesar 83.85 dan entitas komoditas pangan sebesar 90.98 yang digunakan pada data berita daring, pada data aduan LAPOR!, entitas lokasi menggunakan Conditional Markov Model dengan nilai F1-Score sebesar 60.35 dan entitas komoditas pangan sebesar 89.74. Pada klasfikasi dokumen, model Support Vector Machine dengan fitur unigram memiliki nilai presisi sebesar 92.00. Pada Topic Modelling, model Non-Negative Matrix Factorization memiliki nilai coherence yang lebih tinggi daripada Latent Direchlete Allocation pada tiga eksperimen dengan dataset yang berbeda. Di samping itu, dilakukan visualisasi tentang kedaulatan pangan berdasarkan pengolahan data tersebut di atas untuk memudahkan pengambilan kebijakan oleh pimpinan seperti Tim Ahli di Kantor Staf Presiden.

ABSTRACT
Food is a human right that must always be fulfilled by the society with the appropriate purchasing power and high and safe food quality. This encourages food sovereignty of a country, which independently meets the food needs of its people based on a food system that is fair to the entire community. Peraturan Pemerintah Republik Indonesia Nomor 17 Tahun 2015 requires an information system on food and nutrition and the theory of e-government 3.0 evolution. Therefore, one solution that supports these regulations and the e-government 3.0 approach is the text mining approach. This research processes data from LAPOR! and online news on food sovereignty to extract information and find patterns that will produce information on food sovereignty in Indonesia so that it can assist decision-making based on data through web-based visualization representation. The type of information analysis used is Document Classification for document filtering, Named Entity Recognition which is used to find out location entities and food commodities from textual data, and Topic Modeling to find topics from a collection of text news documents and complaints LAPOR !. The algorithm used in this study is Conditional Random Fields and Conditional Markov Models for the implementation of Named Entity Recognition. Latent Dirichlet Allocation and Non-Negative Matrix Factorization for the implementation of Topic Modeling. In addition Naïve Bayes, Support Vector Machine, and Logistic Regression are used for document classification. Whereas the selection of this model uses Conditional Random Field with an F1-score value for location entities of 83.85 and a food commodity entity of 90.98 used in online news data. In the LAPOR! Complaint data, the location entity uses Conditional Markov Model with an F1-Score value of 60.35 and food commodity entities amounting to 89.74. In classifying documents, the Support Vector Machine model with unigram features has a precision value of 92.00. In Topic Modeling, the Non-Negative Matrix Factorization model has a higher coherence value than the Latent Direchlete Allocation in three experiments with different datasets. In addition, visualization of food sovereignty is based on the processing of the data above to facilitate policy making by leaders such as the Expert Team at the Kantor Staf Presiden.

"
2019
TA-Pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Nia Dwi Rahayuningtyas
"Keraguan dan penolakan orang tua terhadap vaksinasi meningkat secara global. Maraknya penyebaran isu vaksinasi melalui media sosial mengarahkan persepsi publik pada keraguan terhadap vaksin yang berujung pada penurunan cakupan imunisasi dan tidak tercapainya target IDL di Indonesia. Pada media sosial Twitter terdapat dua kelompok, yaitu kelompok pro-vaksin yang mendukung vaksinasi dan anti-vaksin yang menolak vaksinasi.
Penelitian ini bertujuan untuk mengidentifikasi apakah sebuah Tweet memiliki kecenderungan ke arah pro- atau anti-vaksin dan untuk mengeksplorasi topik-topik terkait pro-vaksin dan anti-vaksin. Dataset diambil dari Twitter dengan kata kunci "vaksin" dan "imunisasi" lebih dari 9.000 data Tweet antara 11 Agustus sampai 10 September 2019. Anotasi dilakukan dalam 3 langkah berturut-turut dengan tiga pasangan label yaitu RELEVANT/IRRELEVANT, SUBJECTIVE/NEUTRAL, dan PRO/ANTI. Tiga eksperimen yaitu pemilihan fitur, algoritma, dan pipeline klasifikasi dilakukan untuk mendapatkan model stance detection terbaik yaitu nilai rata-rata micro tertinggi dari precision, recall, dan f1-score.
Fitur terpilih adalah kombinasi 3 fitur teks Count +Unigram+Bigram dengan algoritma Logistic Regression dan pipeline Two-stage Classification (f1-score = 80,5%). Algoritma terpilih pada pembentukan topic modeling adalah NMF dan LDA masing-masing untuk korpus pro-vaksin dan anti-vaksin dengan nilai koherensi sebesar 0.999.
Topik-topik anti-vaksin meliputi kritik terhadap fatwa halal MUI untuk Vaksin MR, kandungan babi pada Vaksin Meningitis Haji, komersialisasi vaksin, vaksin palsu, KIPI dan bahaya vaksin, vaksin sebagai alat konspirasi dan agenda Yahudi, tuntutan vaksin halal, dan seterusnya. Sedangkan topik-topik pro-vaksin lebih bersifat homogen yaitu mengenai manfaat dan pentingnya imunisasi, aturan pemberian vaksin, dan kampanye dalam bentuk publisitas kegiatan imunisasi, dan anjuran vaksin.

Parents hesitancy and refusal toward immunization was rising globally. The rise of the issue of vaccination through social media directs the public's perception of vaccine hesitancy that lead to a reduction in immunization coverage and the unfulfilled IDL target in Indonesia. There are two groups: pro-vaccine that support vaccines and anti-vaccine that refuse vaccines for various reasons that expressed in tweets on Twitter.
This research aims to identify whether a tweet has a tendency to support, or oppose immunization or vaccines and exploring the topic of pro-vaccine and anti-vaccine corpus. The dataset was taken from Twitter with the keywords "vaksin" and "imunisasi" of more than 9,000 tweets at 11 August until 10 September 2019. Annotation was carried out in 3 consecutive steps with three couple label namely RELEVANT vs IRRELEVANT, SUBJECTIVE vs NEUTRAL, and PRO vs ANTI.
Three experiments, namely the selection of features, algorithms, and pipeline were carried out to get the best model of stance detection which has the highest micro average precision, recall, and f1-scores. The selected feature is combination of Count +Unigram+Bigram features with Logistic Regression and pipeline Two-stage Classification (f1-score = 80,5%).
The selected topic modeling algorithms are NMF and LDA for the corpus pro-vaccine and anti-vaccine with coherence score 0.999. Anti-vaccine topics include criticism of the halal MUI fatwa for MR vaccine, pork gelatine in the Hajj Meningitis Vaccine, vaccines for business fields, fake vaccines, KIPI and vaccine hazards, vaccines as part of conspiracy and Jewish agenda, demands for halal vaccines, etc. Whereas pro-vaccine topics are more homogeneous, namely the benefits and importance of immunization, vaccine administration rules, and campaigns with publicity of immunization activities and vaccine recommendations.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia , 2020
TA-Pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Luqman Maulana Rizki
"Pengembangan NLP di Indonesia terbilang lambat, terutama penelitian terkait bahasa daerah Indonesia. Alasannya adalah sumber data bahasa daerah tidak terdokumentasikan dengan baik sehingga sumber daya NLP yang ditemukan juga sedikit. Penelitian ini membahas metode ekstraksi kamus-kamus bahasa daerah di Indonesia untuk menghasilkan suatu sumber daya NLP yang dapat dibaca oleh mesin. Tahap penelitian dimulai dari pengumpulan data kamus, perancangan dan eksperimen metode ekstraksi, serta evaluasi hasil ekstraksi. Hasil penelitian berupa korpus paralel, leksikon bilingual, dan pasangan kata dasar-kata berimbuhan dalam format CSV dari beberapa kamus dwibahasa di Indonesia. Beberapa bahasa di antaranya adalah bahasa Minangkabau, Sunda, Mooi, Jambi, Bugis, Bali, dan Aceh. Perancangan metode ekstraksi berfokus pada kamus Minangkabau yang kemudian dilakukan eksperimen pada kamus-kamus bahasa daerah lainnya. Evaluasi dilakukan terhadap hasil ekstraksi kamus Minangkabau dengan melakukan anotasi data. Perhitungan akurasi dilakukan terhadap penempatan kelompok kata dari hasil anotasi. Hasil perhitungan menunjukkan 99% hasil ekstraksi sudah tepat untuk penentuan kelompok kata pada leksikon bilingual dan 88% untuk korpus paralel. Tim peneliti menemukan bahwa struktur dalam kamus bahasa daerah Indonesia sangat beragam, sehingga menuntut perlakuan yang berbeda pada setiap kamus, seperti perihal penomoran halaman. Selain itu, tim peneliti menemukan banyak kamus bahasa daerah Indonesia dengan kualitas yang kurang baik. Kualitas yang kurang baik ditunjukan dengan banyaknya kesalahan baca akibat noise yang terdapat pada tampilan berkas kamus.

The development of NLP in Indonesia is relatively slow, especially for Indonesian local languages. Indonesian local language data sources are not well-documented so that there are only few NLP resources found. This study discusses the extraction method of Indonesian local language dictionaries to produce a machine-readable NLP resource. Starting from collecting dictionary data, designing and experimentation of the extraction method, and evaluating the extraction results. The extraction results are parallel corpus, bilingual lexicon, and words’ morphological form in CSV format from several Indonesian Local Language bilingual dictionaries that are Baso Minangkabau, Sundanese, Moi, Jambinese, Buginese, Balinese, and Acehnese. The designed method is also applied to some other local language dictionaries. Data annotation has been done to evaluate the extraction results so that we can calculate its accuracy of word classification for parallel corpus and bilingual lexicon. Extraction method design focuses on the Minangkabau dictionary which is then applied to other dictionaries. Data annotation has been done to evaluate the extraction results.The evaluation results show that 99% of the extraction results are correct for word classifying in the bilingual lexicon and 88% correct for parallel corpus. We found that the structure of dictionaries varies, so it requires different approaches for each dictionary, for example regarding page numbering. We also found many dictionaries with poor quality. The poor quality is indicated by the number of reading errors due to noise contained in the original dictionary file."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Julius Dimas Trisaktyo Nugroho
"

Sistem e-procurement merupakan sistem pengadaan yang dilakukan dengan cara elektronik yang menjadi faktor kunci untuk mengelola keuangan negara dengan kontrol yang tepat, serta dilindungi oleh kebijakan dan peraturan perundang-undangan yang berlaku. Menurut Asian Development Bank e-tendering, yang merupakan bagian dari e-procurement, merupakan aplikasi strategis yang dapat menunjang kinerja pada sektor pemerintahan. Berdasarkan temuan praktik yang tidak sesuai dengan prinsip pengadaan, maka dalam penelitian ini dilakukan sebuah analisis mendalam untuk mengevaluasi kegiatan tender pada lembaga kementerian di Indonesia. Pada penelitian ini ditunjukkan bagaimana penambangan data dilakukan pada portal pengadaan nasional untuk menganalisis data tender dan mendapatkan temuan pola tersembunyi yang berguna untuk pengambilan keputusan. Penelitian ini menggunakan metodologi web data mining dengan melakukan pendekatan analisis secara deskriptif dan statistik. Dengan melakukan metode uji chi-square dan multivariance Anova, ditemukan adanya kaitan antara lembaga kementerian dengan pemenang berulang pada tahun anggaran 2018-2019. Di samping itu frekuensi partisipasi peserta tidak memiliki dampak terhadap statistik kemenangan berulang pada Kementerian Perhubungan, tetapi berdampak pada Kementerian PUPR. Penelitian ini juga menemukan adanya hubungan yang sangat kuat antara variabel Harga Perkiraan Sendiri (HPS) dengan nilai pagu. Selain itu pada penelitian ini juga ditemukan anomali data pada harga penawaran pemenang tender dengan nilai 100 kali lebih besar dari harga pagu dan HPS.

 


E-procurement is an electronic procurement system that became a key factor required to manage financial aspect of a country with appropriate controls, and protected by legal policies. According to Asian Development Bank, e-tendering as part of e-procurement, is classified as a strategic application that can enhance performance in the government sector. Based on the finding of practices that are not comply with the principles of good procurement governance, in this study an in-depth analysis was conducted to evaluate the tender activities of the ministry in Indonesia. This research shows how data mining is carried out at the national procurement portal to analyze tender data and findings the hidden pattern that would be useful for decision making. This study uses a web data mining methodology by conducting a descriptive and statistical analysis approach. By using the chi-square and multivariance Anova test method, this study has found that there was a relation between the ministries and repeated winners in year 2018-2019. In addition, the frequency of participation did not have an impact on the statistics of recurring wins at the Ministry of Transportation, but it had an impact on the Ministry of Public Works and Public Housing. This study also found a very strong relationship between the Owner Estimate (OE) value and the threshold value. In addition on this study, it was found anomaly data on the tender bid price of the winner with a value 100 times greater than the threshold value and OE value.

"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
TA-Pdf
UI - Tugas Akhir  Universitas Indonesia Library