Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 135480 dokumen yang sesuai dengan query
cover
Muhammad Haddad
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
Unggah3  Universitas Indonesia Library
cover
Muhammad Haddad
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
Unggah3  Universitas Indonesia Library
cover
Aulia Nur Fadhilah
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Halif
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Haddad
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Halif
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nur Siti Muninggar
"Sebagai penganut Teori Fiksi Hukum, pemerintah Indonesia memiliki konsekuensi untuk memastikan dokumen peraturan perundang-undangan mudah diakses publik. Salah satu cara yang ditempuh adalah menyediakan akses dokumen peraturan perundang-undangan secara gratis melalui situs online. Namun, sistem pencarian yang dimiliki oleh situs tersebut, tidak memberikan hasil yang relevan untuk pencarian dokumen yang berelasi dengan dokumen lain seperti peraturan amandemen. Hal ini disebabkan oleh sistem pencarian yang hanya berbasis teks dan tidak dapat menangkap relasi yang ada baik di dalam dokumen maupun relasi yang dimilikinya ke dokumen lain. Penelitian ini mengusulkan konstruksi sebuah knowledge graph (KG), yang dinamai LexID, yang merepresentasikan peraturan perundang-undangan Indonesia yang dapat digunakan untuk meningkatkan sistem pencarian hukum yang telah dimiliki. Penelitian ini juga memperkenalkan LexID-S, sebuah ontologi hukum yang berperan sebagai skema LexiD KG tersebut dan mencakup representasi metadata dan struktur dokumen peraturan, serta representasi semantik klausa hukum. Konstruksi KG yang dilakukan dalam penelitian menggunakan metode rule-based. Kemampuan KG hasil konstruksi untuk menjawab kebutuhan informasi pengguna dievaluasi melalui ketepatan jawaban dari kueri SPARQL yang merepresentasikan kebutuhan informasi kepada semua informasi yang telah diekspresikan dalam ontologi LexID-S dan KG LexID. Dari hasil uji diperoleh bahwa KG LexID berhasil menjawab kebutuhan informasi dengan nilai rerata makro F1 adalah 0.91.

The Indonesian government needs to ensure the accessibility of its legal documents. Because of that, the government provides free access to legal documents through an online site. Unfortunately, there is a challenge while looking for a legal document that relates to another. The site does not give the relevant results because its text-based search system can not capture the relationship within or between the legal documents. In this research, we propose the construction of a knowledge graph (KG), named LexID, to represent the Indonesian legal documents which aim to be used to improve the existing legal search system. We construct the KG using the rule-based method. In this research, we also introduce the legal ontology we use, named LexID-S, as the basis of the construction. The ontology includes a legal document's metadata and structure representation and the semantic representation of legal clauses. In addition, we give some examples to show how to retrieve the information of our KG using SPARQL. We evaluate the ability of our KG to answer the user's information needs using SPARQL and get the macro average of F1 of our KG is about 0.91."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhamad Abdurahman
"Dokumen peraturan perundang-undangan pada umumnya tersedia dalam bentuk PDF
yang bersifat tidak machine-readable, sehingga data tidak dapat diproses secara otoma-tis dan dalam skala besar oleh komputer untuk dimanfaatkan dalam berbagai teknologi digital. Oleh karena itu diperlukan struktur data yang dapat memuat informasi peraturan perundang-undangan, beserta sistem yang melakukan konversi dari PDF menjadi struk-tur data tersebut. Dengan alasan tersebut, pada penelitian ini penulis mengembangkan Lex2KG, framework untuk mengonversi dokumen PDF peraturan perundang-undangan di Indonesia (Lex berasal dari Bahasa Latin yang berarti hukum) menjadi knowledge gra-ph. Knowledge graph (KG) adalah graph yang menggambarkan entitas dunia nyata be-serta keterkaitannya dan memberikan informasi terstruktur yang machine-readable. Pada penelitian ini KG dipilih dari berbagai struktur data yang tersedia karena KG terkate-gori sebagai 5-star data menurut 5-star deployment scheme for Open Data, yaitu data dengan jenis informasi paling bermanfaat, memberikan data dalam bentuk open license,terstruktur, tersedia dalam open format, menggunakan URI sebagai notasi data, dan dapat dihubungkan (linked) dengan data lain. KG peraturan perundang-undangan mengandung berbagai data terstruktur konten tekstual, struktur dokumen, seperti metadata, serta relasi antara peraturan seperti amendemen dan rujukan. Lex2KG memungkinkan pemanfaatan data peraturan perundang-undangan secara advanced, otomatis, dan dalam skala besar pada berbagai lingkup digital terutama pada industrsi hukum dan pengacara. Contoh pemanfaatan data dapat berupa search engine, sistem question answering, dan analisis statistik peraturan perundang-undangan. Menggunakan Lex2KG, penulis berhasil meng-onversi 784 undang-undang menjadi KG dengan ukuran total lebih dari 1,1 juta triple.
Salah satu peraturan yang berhasil dikonversi adalah UU 11/2020 tentang Cipta Kerja
yang kontennya bersifat relatif kompleks dan berukuran besar. Penulis juga menunjuk-
an use case dari KG peraturan perundang-undangan yaitu chat bot sederhana, SPARQL
query, dan visualisasi peraturan perundang-undangan

Most of the legal documents are available as PDF which is not machine-readable, which
means the data could not be processed automatically and in large scale by a computer
to be utilized in various digital technology. Therefore, we need a data structure that can
contain a legal information, and also a system which converts PDF into that structure. For
that reason, in this research, author developed Lex2KG, a framework wh converting legal
PDF documents in Indonesia (Lex comes from Latin which means law) into a Knowledge
Graph. A knowledge graph (KG) is a graph that describes real-world entities and their
relationships as machine-readable and structured information, and linkable to another KG
on different domain. In this research KG is choosen from various data structure available
because KG it categorized as 5-star data according to 5-star deployment scheme for Open
Data, which data comes with most beneficial information, available under an open licen-
se, structured, open format, uses URI to denote things, and linkable to other data. The
legal KG contains various kinds of structured data such as textual content, document stru-
ctures, metadata, and relations between law such as amendments and citations. Lex2KG
enables the advanced and automatic utilization of legal data on a large scale on a various
digital scope especially on legal industry and lawyer. The utilization could be in form
of search engine, question answering system, and statistics analytics for legals. Through
Lex2KG, author have successfully converted 784 Indonesian laws into a KG with a total
size of over 1.1 million triples. One of the regulation that was successfully converted was
Law 11/2020 on Job Creation, which the content is relatively complex and large. Author
also shows use cases of the legal KG for simple chatbots, SPARQL querying, and legal
visualizations.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Jilham Luthfi
"Perkembangan knowledge graph serta penggunaannya meningkat secara masif akhir-akhir ini. Namun, pertumbuhan knowledge graph nyatanya tidak sebanding dengan kualitas data yang dimiliki. Sementara itu, aspek kelengkapan dalam kualitas data knowledge graph memiliki peranan penting dalam pemakaian data yang sesuai dengan kebutuhan. Sayang sekali, hingga saat ini belum ada penelitian tentang penggunaan SHACL dalam melakukan validasi kelengkapan data. Penelitian ini hadir dengan tujuan untuk membuat pola-pola kelengkapan berdasarkan kondisi knowledge graph beserta instance-nya. Penelitian ini mengidentifikasi enam pola kelengkapan yang sering muncul pada knowledge graph. Dari keenam pola kelengkapan tersebut, penelitian ini berhasil membuat 360.162 instance pola kelengkapan dalam bentuk SHACL shape. Pembuatan instance pola kelengkapan menggunakan lima pendekatan, yakni pendekatan manual, otomatis, spreadsheet, ontologi, dan statistik. Semua shape tersebut kemudian digunakan untuk melakukan validasi terhadap 928.310 entitas pada knowledge graph dunia nyata, yakni Wikidata dan DBpedia. Hasil validasi population, no-value, dan label and description completeness pada Wikidata dan DBpedia mencapai skor lebih dari 90%. Sementara itu, hasil validasi property dan interlinking completeness pada Wikidata dan DBpedia berada di rentang skor 60-70%. Terakhir, validasi schema completeness pada Wikidata dan DBpedia mencapai hasil 70-90%. Selain itu, penelitian ini menyediakan aplikasi web bernama SHACL on Completeness Knowledge (SoCK) untuk mengelola dan menyediakan pola kelengkapan beserta instance-nya.

The development of knowledge graphs and their use has increased massively recently. In fact, the growth of the knowledge graph is not proportional to the quality of the data it has. Meanwhile, the completeness aspect in the quality of the knowledge graph data has an essential role in the use of data according to needs. Unfortunately, nobody has previously done research on the use of SHACL in validating data completeness.Therefore, this research focused on identifying completeness patterns based on the condition of the knowledge graph and its instances. This study identified six completeness patterns that often appear in knowledge graphs. Of the six completeness patterns, this study successfully created 360.162 completeness pattern instances in the form of SHACL shape. The instantiation of the completeness pattern used five approaches, that is, manual, automated, spreadsheet, ontology, and statistical approaches. All these shapes are used to validate 928.310 entities in a real-world knowledge graph, namely Wikidata and DBpedia. Based on the population, no-value, and label and description completeness validation, the completeness of Wikidata and DBpedia reached a score of more than 90%. Moreover, the validation results of property and interlinking completeness stated that the Wikidata and DBpedia completeness are 60-70%. Finally, schema completeness validation on Wikidata and DBpedia reached 70-90%. In addition, this research provided a web application called SHACL on Completeness Knowledge (SoCK) to manage and accommodate completeness patterns and their instances."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Ilham Al Ghifari
"Framework Lex2KG dibuat untuk mengekstraksi dokumen PDF peraturan perundang-undangan menjadi dokumen KG berbentuk RDF triple. Setelah pemeriksaan, framework masih memiliki permasalahan pada tahapan ekstraksinya mengakibatkan kurangnya kualitas KG pada aspek kualitas accuracy dan completeness. Sehingga dilakukan perbaikan framework Lex2KG untuk menghindari permasalahan yang muncul dan dibutuhkan sistem lain untuk menjaga dan meningkatkan kualitas. Pada penelitian dilakukan analisis serta perbaikan framework Lex2KG yaitu peningkatan jumlah dokumen yang dapat terekstraksi menjadi KG sehingga dapat mengekstraksi 1353 dokumen Undang-Undang (UU) dan 963 dokumen mempunyai Jumlah Pasal yang lengkap. Sementara itu, framework Lex2KG sebelum perbaikan hanya dapat mengekstraksi 784 dokumen dan 563 dokumen. Selain mengekstraksi dokumen UU, pada penelitian ini framework Lex2KG dapat mengekstraksi 3864 dari 4758 dokumen Peraturan Pemerintah (PP) menjadi data KG. Penelitian ini juga membuat SHACL shape untuk memvalidasi data KG sehingga ditemukan 60 dokumen UU yang tidak memiliki judul dikarenakan perbedaan format penulisan pada dokumen PDF nya. Untuk memahami dan menganalisis data Legal KG, dibuat kode visualisasi data KG. Visualisasi ini berbentuk statistik dan graph. Penulis juga membuat dataset yang berisikan pertanyaan beserta jawabannya untuk menjaga kualitas aplikasi Legal VA menggunakan sumber data hasil ekstraksi Lex2KG guna memastikan kualitas jawaban yang dikembalikan oleh aplikasi Legal VA akurat dan sesuai.

The Lex2KG framework was created to extract PDF documents of laws and regulations into KG documents in the form of triple RDF. After inspection, the framework still has problems at the extraction stage resulting in a lack of KG quality in terms of accuracy and completeness. So that the Lex2KG framework is improved to avoid problems that arise and other systems are needed to maintain and improve quality. In the research, an analysis and improvement of the Lex2KG framework was carried out, namely increasing the number of documents that could be extracted into KG so that 1353 Law documents were extracted and 963 documents had a complete number of articles. Meanwhile, the Lex2KG framework before the repair could only extract 784 documents and 563 documents. In addition to extracting law documents, in this study the Lex2KG framework was able to extract 3,864 out of 4,758 Government Regulation (PP) documents into KG data. This study also created a SHACL shape to validate KG data so that 60 UU documents were found that did not have titles due to differences in the writing format of the PDF documents. To understand and analyze Legal KG data, a KG data visualization code is generated. This visualization is in the form of statistics and graphs. The author also creates a dataset containing questions and answers to maintain the quality of the Legal VA application using data sources extracted from Lex2KG to ensure the quality of the answers returned by the Legal VA application are accurate and appropriate."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>