Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 36462 dokumen yang sesuai dengan query
cover
Pifi Lutfianti
"ABSTRAK
Temu kembali merupakan tahapan yang penting dalam siklus hidup arsip karena
alasan utama dari penyimpanan arsip adalah arsip-arsip tersebut akan digunakan
lagi oleh pengguna. Namun, ANRI belum melakukan evaluasi terhadap tingkat
efektifitas temu kembali arsip dinamis pada sistem pengelolaan arsip dinamis
yang dibuatnya, yaitu SIKD TIK 2.0. SIKD TIK 2.0 merupakan sistem
pengelolaan arsip dinamis yang dibuat ANRI untuk diaplikasikan di seluruh
lembaga-lembaga pemerintah. Hasil dari penelitian menunjukkan bahwa tingkat
efektifitas temu kembali arsip dinamis melalui fitur pencarian sederhana dalam
SIKD TIK 2.0 adalah rendah. Hal tersebut terbukti dari tingkat rata-rata perolehan
sebesar 30,12% dan tingkat rata-rata ketepatan sebesar 43,23%.

Abstract
Retrieval is important step in the records life cycle because main reasons from
records storage are the records will be used again by the users. However, ANRI
hasn?t been an evaluation of the effectiveness of records retrieval to the records
management system. SIKD TIK 2.0 is a records management system that created
by ANRI to be applied in all government. The results from experiments showed
that the level of effectiveness of records retrieval through a simple search feature
are low. This is evident from the average recall rate of 30.12% and the average
precision rate of 43.23%."
Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2012
S43583
UI - Skripsi Open  Universitas Indonesia Library
cover
Yusuf Kristianto
"Skripsi ini membahas mengenai sistem pemberkasan sebagai temu kembali arsip yang dilaksanakan di kantor pusat PT Tunas Ridean Tbk. Penelitian ini adalah penelitian kualitatif dengan menggunakan metode studi kasus. Hasil penelitian ini menyatakan bahwa sistem pemberkasan arsip di unit kearsipan PT Tunas Ridean Tbk harus dilakukan secara baik dan benar, karena sistem pemberkasan yang dilakukan sangat berpengaruh terhadap temu kembali arsip. Jika proses pemberkasan dilakukan dengan baik, arsip-arsip yang dimiliki PT Tunas Ridean Tbk dapat menjadi informasi penting yang mudah ditemukan oleh pengguna yang membutuhkan.

This thesis discusses the filing system as archive retrieval in PT Tunas Ridean Tbk. This study was a qualitative study using case study method. The results of this study suggest that filling system archive in archival units PT Tunas Ridean Tbk must be done properly and correctly, because the filing system performed very influential on retrieval archive. If the filing system process run well, all the PT Tunas Ridean Tbk archive can be a very important information source that is easy to find for user who need it."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2014
S53795
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nadya Marsa Maula
"Penelitian ini membahas tentang Implementasi Electronic Records Management System (ERMS) pada Layanan Temu Kembali Arsip Publik Berbasis Elektronik dengan Studi Kasus pada Sistem Informasi Arsip (SIAr) DPR RI. Tujuan dari penelitian ini adalah untuk mengetahui bagaimana implementasi SIAr dalam memberikan pelayanan temu kembali arsip publik berbasis elektronik secara cepat, tepat, dan akurat sebagai implementasi dari Undang-Undang Nomor 14 Tahun 2008. Penelitian ini juga menganalisis kekurangan-kekurangan yang menjadi kendala bagi arsiparis dan pengguna selama pelaksanaan SIAr DPR RI. Penelitian ini menggunakan pendekatan kualitatif dengan metode studi kasus. Pengumpulan data dilakukan melalui wawancara secara mendalam, observasi, dan analisis dokumen terkait pengelolaan arsip elektronik di SIAr DPR RI. Hasil penelitian ini menunjukkan bahwa penerapan ERMS dalam memberikan layanan temu kembali arsip sudah dilaksanakan secara efektif dan efisien serta menerapkan KIP dengan baik, namun masih terdapat kendala yaitu tidak memiliki menu login sehingga kepuasan pengguna yang dapat dijadikan sebagai bahan evaluasi untuk SIAr DPR RI belum dilaksanakan.

This research discusses the Implementation of Electronic Records Management System (ERMS) in Electronic-Based Public Archive Retrieval Services with Case Studies at Sistem Informasi Arsip (SIAr) DPR RI. The purpose of this study is to identify how the implementation of SIAr in providing electronic-based public archive retrieval services quickly, precisely, and accurately as the implementation of Undang-Undang Nomor 14 Tahun 2008. In addition, this study also want to analyze the shortcomings that become obstacles for archivists and users during the implementation of SIAr DPR RI. This research uses a qualitative approach with a case study method. Data collection is through through semi-structured and in-depth interviews, observation, and analysis of document related to the management of electronic records in SIAr DPR RI. The results of this study indicate that the implementation of ERMS in providing archive retrieval services has been implemented effectively and efficiently and implemented KIP well, but there are still obstacles, namely not having a login menu so that user satisfaction which can be used as an evaluation for SIAr DPR RI has not been implemented."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2021
MK-pdf
UI - Makalah dan Kertas Kerja  Universitas Indonesia Library
cover
Vilianty Rizki Utami
"Skripsi ini membahas tentang Proses Temu Kembali Arsip Vital di Kantor Arsip Daerah (KAD) Kota Tangerang sebagai upaya untuk meningkatkan temu kembali arsip vital di KAD, khususnya arsip vital Izin Mendirikan Bangunan (IMB). Tujuannya adalah untuk mengetahui proses temu kembali arsip vital IMB, penyebab tidak ditemukannya arsip vital IMB di KAD Kota Tangerang serta hubungan KAD dengan lembaga pencipta arsip vital tersebut. Penelitian ini menggunakan pendekatan kualitatif, dengan metode penelitian studi kasus. Teknik pengumpulan data yang dilakukan yaitu dengan cara observasi, studi literatur dan wawancara semi-struktur.
Hasil penelitian ini menemukan bahwa kurangnya advokasi arsip, kurangnya keamanan akses arsip, arsip vital yang tidak lengkap saat diserahkan dari lembaga pencipta dan tidak dibuatnya daftar pencarian arsip vital yang belum diserahkan oleh lembaga pencipta, merupakan penyebab tidak ditemukannya arsip vital IMB di KAD pada saat pencarian oleh pengguna.

This undergraduate thesis covers Vital Archives Building Permit Retrieval Processing in Regional Archive Office (KAD) on Tangerang City as efforts for increasing vital archives retrieval in KAD, especially Building Permits Vital Archives. The purpose is to find out the retrieval process on building permits vital archives, the reasons behind building permits archives vital which hard to find when it’s needed, and the relationship between KAD and building permits vital archives creator units (lembaga pencipta arsip IMB). This research use qualitative approach, with case study as research methods. Colleting data methods through observation, literature study,and semi-stucture interview.
The result of this research are less of archives advocation, unsecure archives access, uncomplete building permits vital archives when it's need acquisitions, and there is not archive retrieval list for vital archives which has not been aquisitioned from vital archives creator, as the caused for building permits vital archives in KAD hard to finds when it’s needed.
"
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2013
S52888
UI - Skripsi Membership  Universitas Indonesia Library
cover
Adinda Wilhelmina
"Unit Kearsipan FIB UI merupakan salah satu unit kearsipan yang mempunyai tugas dan kewajiban dalam mengawasi penyelenggaraan kearsipan. Pengelolaan arsip dinamis inaktif yang tepat akan menjamin keselamatan arip, menjaga informasi penting organisasi, dan mempermudah temu kembali arsip. Penelitian ini bertujuan untuk menggambarkan strategi Unit Kearsipan FIB UI dalam melakukan pengelolaan arsip dinamis inaktif sebagai upaya menciptakan sarana temu kembali arsip yang efektif. Metode penelitian yang digunakan adalah metode penelitian kualitatif deskriptif. Teknik pengumpulan data melalui observasi, wawancara, dan dokumentasi. Informan dipilih menggunakan metode purposive sampling. Proses analisis data menggunakan reduksi data, penyajian data, dan penarikan kesimpulan. Hasil penelitian menunjukkan bahwa pengelolaan arsip dinamis inaktif di Unit Kearsipan FIB UI dimulai dari proses pemindahan, penataan dan penyimpanan, pelayanan arsip, dan pemusnahan arsip. Upaya dalam menciptakan sarana temu kembali telah dilakukan dengan memfokuskan penataan dan penyimpanan sesuai standar. Sarana temu kembali yang digunakan adalah daftar pencatatan arsip dalam bentuk digital. Namun, terdapat hambatan berupa pencatatan yang belum lengkap dan keterbatasan tempat penyimpanan. Diharapkan hambatan tersebut dapat menjadi acuan perbaikan untuk efektifitas temu kembali arsip.

FIB UI Archives Unit is an archival unit tasked with overseeing archives administration. Proper administration of inactive dynamic records ensures archive safety, protects critical organizational information, and facilitates archive retrieval. The purpose of this research is to outline the FIB UI Archives Unit's strategy for managing inactive dynamic archives in order to develop an effective archive retrieval service. A descriptive-qualitative research method was used for this study. Techniques for collecting data include observation, interviews, and documentation. Purposive sampling was used to identify informants. Data analysis involves the reduction of data, the display of data, and the making of conclusions. The results of the study show that the management of inactive dynamic archives at the FIB UI Archives Unit starts with the processes of moving, organizing, and storing archives, serving archives, and destroying archives. Efforts to develop a retrieval system have focused on standards and storage. The retrieval tool used is a list of archival records in digital form. However, there are obstacles in the form of incomplete records and limited storage space. It is hoped that these obstacles can be used as inspiration for future improvements to archive retrieval's effectiveness."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2023
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Farah Fadhilah
"Arsip adalah informasi yang terekam dari kegiatan atau peristiwa dalam berbagai bentuk seiring perkembangan teknologi informasi dan komunikasi. Arsip dibuat dan diterima oleh lembaga negara, pemerintah, perusahaan, dan organisasi, dan terbagi menjadi arsip aktif dan inaktif. Pengelolaan arsip meliputi penataan hingga pemusnahan, dan dikatakan efektif jika arsip bisa ditemukan kembali saat dibutuhkan. Penelitian ini bertujuan untuk menggambarkan efektivitas penataan arsip inaktif dalam mendukung proses temu kembali arsip, serta memberikan panduan untuk meningkatkan manajemen arsip inaktif di masa mendatang. Metode yang digunakan adalah pendekatan kualitatif dengan teknik pengumpulan data di lapangan melalui observasi, wawancara, dan dokumentasi. Penelitian ini menemukan bahwa unit kearsipan menggunakan jasa pihak ketiga untuk penataan arsip inaktif mereka. Hal ini disebabkan oleh keterbatasan sumber daya manusia dan ruang penyimpanan arsip, yang mempengaruhi efektivitas proses temu kembali arsip inaktif di unit arsip Badan Pengembangan SDM Kementerian KX. Faktor yang menentukan keberhasilan penataan arsip inaktif mencakup pemindahan arsip, penataan, penyimpanan, pemeliharaan serta temu kembali arsip.
Archives are information recorded from activities or events in various forms along with the development of information and communication technology. Archives are created and received by state institutions, governments, companies and organizations, and are divided into active and inactive archives. Archives management includes arrangement to destruction, and is said to be effective if the archives can be found again when needed. This research aims to describe the effectiveness of structuring inactive archives in supporting the archive retrieval process, as well as providing guidance for improving the management of inactive archives in the future. The method used is a qualitative approach with data collection techniques in the field through observation, interviews and documentation. This research found that archives units use third party services to organize their inactive archives. This is caused by limited human resources and archive storage space, which affects the effectiveness of the inactive archive retrieval process in the archives unit of the Human Resources Development Agency of the Ministry of KX. Factors that determine the success of inactive archive management include archive transfer, arrangement, storage, maintenance and archive retrieval."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2024
MK-pdf
UI - Makalah dan Kertas Kerja  Universitas Indonesia Library
cover
Ridwan Andi Kambau
"ABSTRAK
Sistem Temu Kembali Informasi (STKI) tradisional tidak cukup lagi untuk memenuhi kebutuhan informasi pengguna. Volume dan struktur informasi multimedia mengalami peningkatan yang tidak terpikirkan dan terdapat hubungan semantik antar-media. Untuk menemukan kembali informasi semantik antar-media adalah sebuah tantangan. Tulisan ini mengeksplorasi Sistem Temu Kembali Informasi Multimedia Terpadu Berbasis Konsep (STKIM-TBK). STKIM-TBK menggunakan hubungan semantik antar-media informasi dan teknik deep learning untuk mengungkap struktur informasi multimedia yang mungkin ada. Penelitian ini mengusulkan solusi untuk mengakses berbagai koleksi objek multimedia terdistribusi dan menyajikan secara komprehensif objek warisan budaya dalam empat jenis media, teks, gambar, audio, dan video yang direpresentasikan sebagai Konsep. STKIM-TBK menggunakan ontologi untuk menyediakan kosa kata, struktur informasi, dan membangun hubungan antar-konsep pada media yang berbeda. Koleksi objek warisan budaya digunakan sebagai domain penelitian ini. Relasi Ontologi STKIM-TBK memiliki tiga proses utama; Pertama adalah Proses Pengindeksan yang terdiri dari mengumpulkan objek multimedia, pembuatan dataset, mengekstraksi deskrispsi teks dan fitur multimedia dan mengklasifikasikan konsep-konsep dengan Convolutional Neural Network (CNN) dan Recurrent Neural Network (RNN). Objek-objek dalam Konsep terklasifikasi diindeks dan disimpan pada Objek Terindeks. Kedua adalah Pemrosesan Kueri yang terdiri dari penginputan objek multimedia dan mengenalinya sebagai objek dalam suatu konsep terklasifikasi. Ketiga adalah Proses Temu Kembali yang mencocokkan objek terklasifikasi dari input multimedia pada Pemrosesan Kueri dengan Objek-objek dalam Objek Terindeks menggunakan Skema Ontologi. Pengindeksan Terpadu membuat model pengklasifikasi multimedia untuk mengenali dan mengklasifikasi teks, citra, audio, dan video dengan melatih tiga lapisan arsitektur CNN dan 50 lapisan arsitektur RNN menggunakan dataset enam objek pada empat media dari tiga etnis di Indonesia. STKIM-TBK yang merepresentasi konsep dapat mewakili semua fitur dari empat media sekaligus. Skema Ontologi menggunakan teknik Desain Ontologi Sederhana untuk mengorganisasi konsep-konsep terkait dengan konsep yang lain pada etnis yang sama. Relasi Ontologi STKIM-TBK menunjukkan kemampuan sistem mengekstraksi fitur dari empat representasi media menjadi suatu Konsep dan meningkatkan fleksibilitas struktur klasifikasi warisan budaya UNESCO untuk mencari objek terkait yang lebih banyak.

ABSTRACT
Traditional Information Retrieval System is no longer sufficient to satisfy the information need of users. The volume and structure of multimedia information mounted unthinkable, and the semantic relationship among media exists. To retrieve information which semantically intact among media is a challenge. This study explores the Unified Concept-Based Multimedia Information Retrieval System (UCB-MIRS). The UCB-MIRS employs ontological relationship among media of information and deep learning technique to uncover the structure of multimedia information that may exist. It proposes a solution to access various distributed multimedia object collection and present comprehensive media of cultural heritage in four types of media, text, image, audio, and video that represent as a Concept. The UCB-MIRS use an ontology to provide vocabularies, information structure and create relationship among concepts at different media. The collection of cultural heritage object used as a domain research. Ontological relationship in UCB-MIRS has three main processes; the first is Indexing Process which consist of collecting multimedia object, creating a dataset, extracting multimedia textual description and features, then classifying concepts with Convolutional Neural Network (CNN) and Recurrent Neural Network (RNN). The object in the classified concepts are indexed and stored on Object Indexed. The second is Query Processing which consist of inputting multimedia object and recognizing it as an object in classified concepts. The third is Retrieval Process which is matching the the classified object of multimedia input on Query Processing and object in the Object Indexed using Ontology Schema. In Unified indexing, multimedia classifier model recognize and classify text, images, audio and video by training three layers of CNN architecture and 50 layers of RNN architecture using six objects dataset in four media from three ethnicities in Indonesia. UCB-MIRS can represent all features of four media. The ontology using Simple Design Ontology technique to organizes concepts related to another concept in the same ethnics. Ontological relationship in UCB-MIRS shows the capability of the system to extract features of four media representation to become a concept and increasing the flexibility structure of UNESCO cultural heritage classification to find the more related object."
2019
D2653
UI - Disertasi Membership  Universitas Indonesia Library
cover
Nurul Aini Rahayu
"OPAC (Online Public Access Catalog) merupakan salah satu sarana temu kembali informasi yang penting untuk diimplementasi oleh perpustakaan karena tidak hanya dapat membantu pustakawan dalam mengelola koleksi perpustakaan, tetapi juga dapat membantu pengguna menemukan bahan pustaka yang dibutuhkan secara mudah dan fleksibel. Meskipun demikian, OPAC dapat mengalami permasalahan ketika pencarian dilakukan seperti dokumen yang ditemukan tidak relevan dengan kueri yang diberikan oleh pengguna, informasi yang tersedia di OPAC tidak lengkap, dan sebagainya. Oleh sebab itu, peneliti melakukan penelitian ini untuk mengetahui dan menilai seberapa efektif dan efisien kinerja OPAC Perpustakaan UI berdasarkan kriteria evaluasi sistem temu kembali informasi Salton dan McGill. Hasil penelitian ini menunjukkan bahwa kinerja OPAC Perpustakaan UI dinilai efektif dan efisien, hal ini terlihat dari rata-rata nilai precision yang berada di angka 0.87 atau tingkat precision tinggi, rata-rata waktu respons pencarian berada di angka 1,81 yang dinilai cepat, kecilnya upaya pengguna yang dibutuhkan, tampilan antarmuka OPAC Perpustakaan UI dan hasil pencarian yang disajikan dengan yang baik dan mudah untuk dipahami, serta lengkapnya cakupan koleksi yang tersedia di OPAC Perpustakaan UI.

OPAC (Online Public Access Catalog) is an retrieval information tool which is considered important to be implemented by a library because it does not only help the librarians in managing the library’s collections but it also helps the users in retrieving the library materials easily and flexibly. Even so, OPAC might experience some problems such as documents that are retrieved are not relevant to the query given by the user, the information available in the OPAC is incomplete, and so on. Therefore, this study is conducted to find out and assess how effective and efficient the performance of UI Library’s OPAC based on Salton and McGill’s information retrieval system evaluations criteries. The results of this study indicate that the performance of UI Library’s OPAC is considered to be effective and efficient, which can be seen from the average of precision value which is at 0,87 and or a high level precision, the average search response time is at 1,81 seconds which is considered fast, small user effort is required, the interface display of UI Library’s OPAC and the search results that are well-presented and easy to understand, as well as the complete collection coverage that is provided in the UI Library’s OPAC."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2023
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Gema Parasti Mindara
"Dewasa ini, banyak sekali ketersediaan data multimedia yang direkam dalam bentuk digital seperti teks, citra, audio dan video serta tersimpan dalam berbagai database. Data multimedia tersebut dapat diakses dengan menggunakan mesin pencari seperti Google, Yahoo, dan Bing. Namun, hasil pencarian dari mesin pencari tersebut belum bisamenghubungkan berbagai media kedalam suatu konsep yang saling terkait. Hal ini menyebabkan hasil penetapan relevansi (relevance judgement) menjadi tidak optimal. Disisi lain, mesin pencari hanya bisa menerima kueri tipe teks atau citra, seperti Google. Oleh karena itu, dibutuhkan suatu mekanisme identifikasi data multimedia secara terpadu (Unified Indexing) dan Query Interface yang bisa menerima berbagai tipe media.
Proses Unified Indexing terdiri dari beberapa tahapan: (1) Membangun testbed; (2) Perancangan Unified Indexing; (3) Implementasi; (4) Ujicoba dan Evaluasi. Perancangan Unified Indexing terdiri dari: Modul Mono Modal Indexing, Modul Conceptdan Modul Search. Modul Mono Modal Indexing melakukan pengindeksan masing-masing tipe media. Sedangkan ModulConceptmelakukanpemberiankonsepkepada data multimedia dengan proses naming. Selanjutnya, Modul Search melakukan pencarian informasi dengan berbagai tipe kueri multimedia (QueryInterface). Ketiga modul tersebut selanjutnya diimplementasikan pada tahapan implementasi. Tahapan ujicoba dan evaluasi dibangun berdasarkan dua skenario, yaitu sistem yang belum menggunakan UnifiedIndexing dan sistem yang telah menggunakan UnifiedIndexing.
Hasil ujicoba memberikan hasil peningkatan perolehan informasi data terambil untuk kueri teks 77%, kueri citra 60%, kueri audio 62% dan kueri video 60%. Sedangkan rata-rata perolehan data relevan untuk kueri teks 81%, kueri citra 85%, kueri audio 84% dan kueri video 85%.

Today, a lot of recorded multimedia data available in digital form such as text, image, audio and video stored in various databases. Multimedia data could be accessed by using search engine such as Google, Yahoo, and Bing. However, the result has not been able to link variety of media into an interrelated concepts. This causes the results of relevance judgement is not optimal. On the other hand, the search enginesuch as Google could only received query type likes text or image. Therefore, we need a mechanism of identifying multimedia data in integrated way (Unified Indexing) and Query Interface that can accept various type of media.
Unified Indexing and Query Interface processes consist of several stages: (1) Establish a testbed as experimental data; (2) Design of Unified Indexing; (3) Implementation; and (4) Test and Evaluation. The design of Unified Indexing comprises of: Mono Modal Indexing Module, Concept Module and Search Module. Mono Modal Indexing Module performs indexing of each type of media. Concept Module conducts giving concept of multimedia data with naming process. Search Module searchs information with various type of multimedia queries (Query Interface). The modules are implemented in the Implementation Stage. Test and evaluation stage built on two scenarios: a system that is not use Unified Indexing and system that use Unified Indexing
The results showed that by using the Unified Indexing, multimedia data residing on the same concept provides a better retrieval results:using query by text improve by average is 77%, by image is 60%, by audio is 62% and by video is 60%. Furthermore, the increase of relevant data using query by text is 81%, by image is 85%, by audio is 84% and by video is 85%.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2013
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Arya Bintang Pratama Kumaladjati
"Penelitian ini bertujuan untuk meningkatkan efektivitas model Temu-kembali Informasi di bidang hukum dengan memanfaatkan metode Term Expansion. Latar belakang penelitian ini didasarkan pada kebutuhan praktisi hukum akan sistem yang dapat melakukan pencarian informasi secara otomatis dan efisien dalam database dokumen hukum yang besar dan kompleks. Pendekatan yang diusulkan dalam penelitian ini menggunakan arsitektur Cascade-Ranking Model, yang terdiri dari dua tahapan utama: Sparse Retrieval Model untuk pencarian awal dan algoritma Re-ranking untuk penyusunan ulang hasil pencarian. Penelitian ini berfokus pada eksplorasi kinerja Sparse Retrieval Model melalui penerapan teknik Term Expansion, yang mencakup Query Expansion dan Document Expansion. Query Expansion dilakukan dengan berbagai pendekatan, termasuk non-contextual word embedding, contextual word embedding dengan BERT, dan Local Analysis. Document Expansion melibatkan penambahan prediksi query yang relevan ke dalam dokumen untuk meningkatkan kecocokan dengan query pengguna. Hasil dari eksperimen menunjukkan bahwa tidak ada skenario yang secara mutlak unggul dalam semua metrik evaluasi yang digunakan. Beberapa skenario menunjukkan keunggulan dalam satu metrik tertentu namun mengalami penurunan pada metrik lainnya. Pada salah satu skenario berhasil meningkatkan R@20 dari 0,896 menjadi 0,906, selain itu pada skenario lainnya berhasil meningkatkan metrik P@5 dari 0,186 menjadi 0,192. Selain itu, pada skenario yang menggunakan stopword dengan konteks hukum untuk melakukan filter terhadap kata yang ingin diekspansi dengan word embedding, berhasil meningkatkan R@20 dari 0,896 menjadi 0,916 dan mendapatkan p-value sebesar 0,045. P-value yang dibawah 0,05 ini berarti terjadi peningkatan yang signifikan pada skenario tersebut. Meskipun dapat meningkatkan beberapa metrik, Query Expansion tidak selalu meningkatkan efektivitas Sparse Retrieval Model secara signifikan, terutama karena kurang presisinya kata yang diekspansi dan keterbatasan vocabulary model embedding yang digunakan. Penggunaan BERT untuk kontekstual checking juga belum memberikan hasil yang optimal.

This research aims to improve the effectiveness of Information Retrieval models in the legal field by utilizing Term Expansion methods. The background of this research is based on the need of legal practitioners for a system that can automatically and efficiently search for information in large and complex legal document databases. The proposed approach in this research uses a Cascade-Ranking Model architecture, which consists of two main stages: a Sparse Retrieval Model for initial searches and a Re-ranking algorithm for reordering search results. This study focuses on exploring the performance of the Sparse Retrieval Model through the application of Term Expansion techniques, which include Query Expansion and Document Expansion. Query Expansion is conducted using various approaches, including non-contextual word embedding, contextual word embedding with BERT, and Local Analysis. Document Expansion involves adding predicted relevant queries into the documents to enhance their match with user queries.The results of the experiments show that no scenario is absolutely superior in all evaluation metrics used. Some scenarios show advantages in one particular metric but experience a decline in others. In one scenario, the R@20 metric was successfully increased from 0.896 to 0.906, while in another scenario, the P@5 metric was increased from 0.186 to 0.192. Additionally, in a scenario that used legal context stopwords to filter the words to be expanded with word embedding, R@20 was increased from 0.896 to 0.916, achieving a p-value of 0.045. This p-value below 0.05 indicates a significant improvement in that scenario. Although some metrics improved, Query Expansion did not always significantly enhance the effectiveness of the Sparse Retrieval Model, primarily due to the imprecision of the expanded words and the limitations of the embedding model’s vocabulary used. The use of BERT for contextual checking also did not yield optimal results."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>