Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 176491 dokumen yang sesuai dengan query
cover
Emily Lomempow
"ABSTRAK
Latent Semantic Analysis (LSA) adalah metode yang dapat digunakan untuk membandingkan kesamaan antar teks dengan memanfaatkan representasi kata ke dalam komputasi statistik berdasarkan konteksnya dalam teks tersebut. Pada skripsi ini dirancang sistem yang dapat mendeteksi plagiarisme antara paper bahasa Indonesia dengan paper bahasa Inggris. Sistem dirancang berdasar pada metode LSA, tetapi dengan beberapa modifikasi untuk meningkatkan kecepatan komputasi serta keakuratan program. Metode LSA yang digunakan adalah hasil penelitian yang berasal dari program Simple-O. Dimana, metode ini memiliki keunggulan di waktu proses yang lebih cepat karena mengurangi vector space dalam proses SVD. Beberapa modifikasi dirancang untuk memperoleh hasil yang paling akurat, antara lain menghilangkan stopwords sebelum pemrosesan dan pembentukkan matriks term-document dengan keywords dari paragraf referensi saja. Gabungan dari kedua modifikasi tersebut memberikan hasil yang paling akurat dengan persentase 81,82% sampai dengan 90,91%. Kemudian nilai dari pengujian akan dicek berdasarkan batas mutlak, system ranking, maupun perhitungan distribusi normal untuk menentukan adanya indikasi plagiarisme. Hasil pengecekan plagiarisme paling akurat diperoleh menggunakan perhitungan distribusi normal, dengan persentasi 79,49% sampai dengan 87,81%.

ABSTRACT
Latent Semantic Analysis (LSA) is a method to find the similarity between two texts using the statistical representation of the words based by its contextual means in each text. The system in this thesis is designed to be able to detect plagiarism between two paper written in different languages, which are Indonesian and English. The system is designed using modified version of LSA which is first developed for Simple-O program. This modified version of LSA excel in fast computation as the effect of vector space reduction in SVD process. Several forms of modification are developed to bring forward the most accurate algorithm for the program, for instances are excluding stopwords from LSA processing and creating term-document matrix using words from reference paragraph only. The algorithm composed using the two modifications produces the best result with 81,82% to 90,91% accuracy. The value obtained from the test will be used to decide if there is an indication of plagiarism between two paragraphs using an absolute threshold, ranking system, or based by normal distribution calculation. The most accurate results are obtained from normal distribution calculation based detection with 79,49% to 87,81% rate of success."
2014
S59618
UI - Skripsi Membership  Universitas Indonesia Library
cover
Mardiyah
"Pada skripsi ini telah dilakukan modifikasi metode untuk membangun sistem pendeteksian plagiarisme yang disebut dengan LSA atau Latent Semantic Analysis. Metode ini bekerja dengan mengekstrak dan merepresentasikan konteks yang digunakan sebagai sebuah arti kata dengan memanfaatkan komputasi statistik untuk sejumlah korpus yang besar dari teks. Modifikasi yang diterapkan yaitu mengubah panjang definisi dokumen pada Term-Document Matrix serta mengubah metode pengisian matriks pada Term-Document Matrix dari metode frekuensi ke metode biner. Hasil keluaran LSA yang dapat menentukan keakurasian sistem akan bervariasi sebagai akibat modifikasi sistem. Skripsi ini juga akan membahas metode dan alur yang digunakan untuk menganalisa perbedaan hasil keluaran LSA serta menampilkan hasil pengolahan data keluaran LSA yang kemudian akan memberikan nilai keakuratan masing-masing variasi sistem.

This thesis has been modified method to build plagiarism detection system called LSA or Latent Semantic Analysi. This method works by extracting and representing context is used as a meaning of the word by using statistical computing to a large corpus of text. Modifications are applied by changing the length of the document definitions Term-Document Matrix and change the method of charging matrix in Term-Document Matrix of frequency to the binary method. The output of the LSA to determine the accuracy of the system will vary as a result of modifications to the system. This thesis will also discuss the methods and flow of used to analyze differences in the output of the LSA as well as displaying the data processing LSA output which will then provide the value of the accuracy of each of the various systems.
"
Depok: Unversitas Indonesia. Fakultas Teknik, 2016
S64942
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ihsan Ibrahim
"Di Indonesia yang mayoritas karya tulis di dunia akademiknya masih menggunakan bahasa Indonesia dan referensi yang digunakan mayoritas berbahasa Inggris, memudahkan terjadinya tindak plagiarisme daripada penggunaan bahasa yang sama. Departemen Teknik Elektro telah mengembangkan sistem pendeteksi plagiarisme dwibahasa berbasis Latent Semantic Analysis LSA . Lamanya eksekusi, membuat paralelisme menjadi solusi untuk mengurangi waktu eksekusi dari sistem. Pada penelitian ini dilakukan pengembangan dengan pemrosesan paralel terhadap sistem dengan menggunakan OpenMP. Proses yang diparalelkan adalah, yaitu Singular Value Decomposition SVD, operasi-operasi matriks, dan proses Learning Vector Quantization LVQ dengan melakukan pada pendekatan loop-loop-nya.
Pada pengujian yang dilakukan, akurasi dari proses paralel memiliki konsistensi yang baik karena hasil yang sama dengan proses serial dan didapatkan peningkatan kecepatan eksekusi sistem sebesar 4-7,9 . Dengan fenomena pemrosesan paralel dengan menggunakan 1 thread memiliki waktu eksekusi yang lebih lambat daripada proses serial. Sedangkan saat menggunakan 2 thread dan 4 thread, didapatkan hasil yang lebih cepat daripada proses serial meskipun penggunaan 4 thread hanya berbeda sedikit atau cenderung sama dengan 2 thread. Hal ini disebabkan adanya overhead OpenMP yang terjadi saat pemrosesan paralel berjalan sebesar 20 , dan overhead MySQL yang membuat proses menjadi sangat lama karena besarnya yang mencapai 70 saat proses serial dan 50 pada proses paralel.

Majority of academic environment in Indonesia is still using Indonesian language and its references are in English. This condition led to ease the plagiarism acts when compared to same language environment. Due to this problem, Department of Electrical Engineering has developed bilingual plagiarism detection system based on Latent Semantic Analysis LSA . Parallelism becomes a solution to duration of execution problem. Development of parallel processing on the system with using OpenMP was conducted in this research. The parallelized processes were Singular Value Decomposition SVD , matrices operations, and Learning Vector Quantization LVQ with approach on loops.
In the testing process, accuracy of the parallel process had the same accuracy with the serial process. It is mean that the parallel process has good consistency. Then, the result of execution time has 4 7.9 of improvement compared to the serial one. There was a phenomenon that 1 thread of parallel process had worse performance than the serial process. Furthermore, use of 2 threads and 4 threads in the parallel process had a better execution time, even 4 threads is only slightly better or tend to be the same with 2 threads. These happened due to overhead presences. OpenMP overhead appeared at 20 when parallel executed and MySQL had more with 70 of system computation process in serial and 50 when executed in parallel.
"
Depok: Fakultas Teknik Universitas Indonesia, 2018
T50881
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhammad Yusuf Irfan Herusaktiawan
"Penelitian ini mengembangkan dan menganalisa sistem pendeteksi plagiarisme dua bahasa berbasis Latent Semantic Analysis untuk karya tulis berbahasa Indonesia dan referensi berbahasa Inggris. Sistem pendeteksi plagiarisme menggunakan algoritma backpropagation neural network untuk melakukan klasifikasi pasangan karya tulis berbahasa Indonesia dan Inggris yang sudah dinilai tingkatan plagiarismenya secara manual. Sistem dapat memperoleh klasifikasi akurasi F-measure sampai dengan 92.75.
Hasil percobaan menunjukkan bahwa akurasi tertinggi dapat diperoleh jika menggunakan metode term frequency binary dalam penghitungan jumlah kata dan penggunaan frobenius norm, vector angle slice, dan vector angle pad sebagai pilihan fitur untuk masukan backpropagation neural network.

This research aims to develop and analyse dual language plagiarism detection system based on Latent Semantic Analysis for papers with Indonesian language and reference text with English language. The plagiarism detection system uses backpropagation neural network algorithm to classify pairs of Indonesian and English papers which plagiarism levels has been graded manually. The system has reached classification accuracy using F measure metric up to 92.75.
Experiment results show that the highest accuracy obtained when using term frequency binary method in counting frequency of words and using frobenius norm, vector angle slice, and vector angle pad features for backpropagtion neural network input.
"
Depok: Fakultas Teknik Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dian Rismawati
"Departemen Teknik Elektro Universitas Indonesia telah mengembangkan suatu sistem berbasis Latent Semantic Analysis (LSA) untuk mendeteksi plagiarisme pada karya tulis berbahasa Indonesia dan Inggris. Data keluaran sistem deteksi plagiarisme berbasis LSA adalah nilai frobenius norm, slice, dan pad. Pada skripsi ini akan menjelaskan serta memberikan analisis pada pengembangan sistem deteksi plagiarisme yang telah ada yaitu dengan menerapkan algoritma Support Vector Machine (SVM).
Support Vector Machine (SVM) adalah suatu Learning Algoritm yang bertujuan untuk menemukan suatu hipotesis berupa bidang pemisah (hyperplan) terbaik dari sekumpulan data yang dapat dipisahkan secara linear maupun tidak linear. SVM akan memisahkan data hasil keluaran sistem deteksi plagiat bebasis LSA menjadi dua kelas yaitu "plagiat" dan "tidak plagiat" dengan menggunakan 2 metode yaitu kombinasi data input dan kombinasi data output dengan metode AND. Beberapa modifikasi terhadap imput program dilakukan diantaranya memvariasikan parameter-parameter pembelajaran dan memvariasikan data hasil keluaran program deteksi plagiarisme berbasis LSA.
Hasil dari analisis serta pengujian yang telah dilakukan yaitu jika menggunakan parameter serta kombinasi data yang tepat, SVM mampu untuk meningkatkan akurasi sistem dari sistem yang menggunakan metode Learning Vector Quantization (LVQ) pada penelitian sebelumnya hingga menghasilkan akurasi sebesar 63,15% hal ini dilihat jika mempertimbangkan keseimbangan terhadap aspek presisi dan relevansi program sedangkan jika dilihat melalui presentase jumlah data yang berhasil diklasifikasikan dengan tepat, SVM mampu menghasilkan akurasi sebesar 97,04%.

Department of Electrical Engineering, University of Indonesia has developed a system based on Latent Semantic Analysis (LSA) to detect plagiarism between two paper written in different languages, which are Indonesian and English. The output data of plagiarism detection system are frobenius norm, slice, and pad. This thesis will explain and provide analysis of the development of plagiarism detection system that already exist by applying Support Vector Machine (SVM) algorithm.
Support Vector Machine (SVM) is a Learning Algorithm that aims to find a best hypothetical form called hyperplan to separated a set of data that can be separated linearly and nonlinearly. SVM will separate output data of plagiarism detection system into two classes, "plagiat" class and "tidak plagiat" class by using two methods: combination of input data method and output data combined with AND method. Some modifications to input program are made, such as variating the parameters of learning and variating the output data of plagiarism detection program.
The results of analysis and test that has been done are: if the system use correct parameters and correct combinations of the data, SVM is able to improve accuracy of the system from the last research that using Learning Vector Quantization (LVQ). The accuracy of SVM is 63,15% if considering the balance of precision and relevance of the program, while when viewed through a percentage of the amount of data that appropriately classified, the accuracy of SVM is 97.04%.
"
Depok: Fakultas Teknik Universitas Indonesia, 2016
S65023
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nanda Girindratama
"Pada penelitian ini, dikembangkan HPC yang menerapkan multicore processing pada program Sistem Pendeteksi Plagiarisme dengan memanfaatkan infrastruktur komputasi awan berbasis OpenStack. Sistem Pendeteksi Plagiarisme merupakan program yang dikembangkan untuk mendeteksi tingkat plagiarisme dari suatu karya ilmiah. Algoritma program yang digunakan untuk penelitian kali ini adalah latent semantic analysis (LSA). Implementasi HPC dilakukan dengan bantuan library OpenMP yang didesain untuk bahasa pemrograman C. Diterapkan dua jenis paralelisme pada program, yaitu paralelisme fungsi dan paralelisme data. Setelah dilakukan pengujian, didapati hasil bahwa kedua metode paralelisme ini mempercepat eksekusi program. Paralelisme fungsi mempercepat waktu eksekusi hingga sebesar 1,03 kali waktu eksekusi serial dan paralelisme data mempercepat waktu eksekusi hingga 1,34 kali waktu eksekusi serial.

In this research, HPC with multicore processing is developed on Plagiarism Detection System using OpenStack based cloud computing infrastructure. Plagiarism Detection System is a software developed to detect plagiarism level of a scientific papers. The algorithm used in this program is latent semantic analysis (LSA). HPC implementation is done using OpenMP library which is designed to be used in C programming language. There are two types of paralelism in this program, which are function paralelism and data paralelism, both accelerate the execution time. Function paralelism accelerates program by up to 1,03 times of serial execution while data paralelism decreases the execution time by up to 1,34 times serial execution time."
Depok: Fakultas Teknik Universitas Indonesia, 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Paskalis Nandana Yestha Nabhastala
"Penelitian yang dilakukan berupa pengembangan terhadap sistem pendeteksi plagiarisme otomatis sehingga dapat menerapkan jaringan saraf tiruan Self-Organizing Map SOM untuk melakukan klasifikasi terhadap hasil keluaran Latent Semantic Analysis. SOM dipilih untuk melakukan klasifikasi karena algoritma ini tidap perlu melakukan supervisi pada proses pembelajarannya sehingga dapat secara otomatis menentukan tingkat plagiarisme antar paragraf yang tidak mudah ditentukan secara langsung oleh manusia. Selain itu dilakukan perbandingan akurasi penentuan tingkat plagiarisme yang dimiliki oleh sistem apabila hanya menggunakan LSA saja, penggunaan LSA dengan SOM, dan penggunaan LSA dengan Learning Vector Quantization LVQ.
Penggunaan SOM dan LVQ dilakukan untuk melakukan klasifikasi tingkat plagiarisme dari hasil keluaran LSA. Penentuan tingkat plagiarisme sudah cukup dilakukan apabila hanya menggunakan LSA saja, dimana sudah dapat menghasilkan tingkat akurasi paling tinggi yaitu 86,24. Namun, penggunaan SOM dengan jumlah kelas sebanyak 2 dengan 3 parameter memberikan rata-rata tingkat akurasi yang sedikit lebih rendah, yaitu sebesar 82,00. Sedangkan penggunaan LVQ dengan jumlah kelas sebanyak 2 dengan 3 parameter juga memberikan rata-rata tingkat akurasi yang sedikit lebih tinggi dibandingkan, yaitu sebesar 82,10.

This research has concern on deployment of neural network algorithm Self Organizing Map SOM in automatic plagiarism detector so it could be used to classify the output from Latent Semantic Analysis. SOM is chosen because it is an unsupervised neural network algorithm. With unsupervised neural network, it could determine the plagiarism level between paragraf automatically, which hard for human to determine it. Other than deployment of SOM, this research also focusses on the comparison of accuracy of the system if the system only deploys pure LSA, combination of LSA and SOM, and combination of LSA and Learning Vector Quantization LVQ.
SOM and LVQ are used to do classification for the output from LSA. Plagiarism level could be determined by the result of LSA only. It has 86,24 as the highest accuracy level. But, the usage of SOM with 2 classes and 3 parameters gives lower average of accuracy, which is 82,00 . Therefore, usage of LVQ with 2 classes and 3 parameters gives slight better accuracy than SOM, which is 82,10.
"
Depok: Fakultas Teknik Universitas Indonesia, 2018
Spdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Teuku Muhammad Rikza Abdy
"Sistem persamaan kata merupakan suatu algoritma yang dapat digunakan pada sistem penilaian esai secara otomatis yang dapat berfungsi dengan untuk membandingkan kata memiliki makna yang sama (sinonim) sehingga akan diberi bobot yang sama. Hal ini telah dibuktikan dari percobaan dimana SIMPLE-O berbasis GLSA yang ditambahkan sistem persamaan kata dalam kalimat mengungguli sistem yang sama tanpa adanya penambahan persamaan kata.
Dari 6 soal yang diujicobakan dengan 5 sampel pada dua soal dummy dan 30 sampel pada sisa 4 soal percobaan dengan membandingkan nilai selish hasil penilaian sistem terhadap persamaan kata GLSA dengan persamaan kata unggul sebanyak 5 kali atau sebesar 83,33% dibandingkan dua basis algoritma lainnya yaitu LSA dan GLSA tanpa sistem persamaan kata.

Word similiarity detection system is an algorithm that can be used on automatic essay grader to compare word to another of which have similar meaning (synonim) so that can be given the equal value. With this algorithm the word with significant meaning on the text can be detected an the word which have the different terms but have the same meaning from the answer. Experiment conducted has shown that word similiarity algorithm which has embedded to SIMPLE-O based on GLSA outperform the GLSA without word similiarity in term of the accuracy.
From 6 questions data conducted, GLSA with word similiarity outperform the other algorithm which are LSA and GLSA without word similiarity process 5 times or equal to 83,33%. The result from the average delta of the value is also proven that the word similiarity algorithm is have better performance than the other. Word similiarity algorithm proven to increase the accuracy of essay grader for text in Bahasa Indonesia.
"
Depok: Fakultas Teknik Universitas Indonesia, 2016
T45892
UI - Tesis Membership  Universitas Indonesia Library
cover
Nahar Adi Gunawan
"Pada togas akhir ini dilakukan perancangan dan implementasi software sistem penilaian essay otomatis. Program aplikasi sistem penilaian essay otomatis ini berfungsi untuk menilai essay secara otomatis dengan menggunakan metode Latent Semantic Analysis atau LSA. Metode Latent Semantic Analysis (LSA) adalah teori atau metoda untuk menyalin dan merepresentasikan arti kalimat dengan perhitungan matematis atau statistik. LSA mengkonversi essay ke dalam matriks. Setiap kata dalam paragraf kalimat direpresentasikan sebagai bans dan kolom matriks. Dengan menggunakan teknik matrik aljabar SVD (Singular Value Decomposition), matrik didekomposisi menjadi tiga komponen matrik, yaitu dua matriks orthogonal dan satu matriks diagonal singular.
Proses penilaian diambil dari perbandingan normalisasi Frobenius nilai singular positif atau tidak nol padakomponen diagonal matriks referensi dan matriks jawaban. Selanjutnya sistem penilaian essay otomatis metode LSA ini diaplikasikan pada software berbasis web dengan alasan bahwa perkembangan teknologi intemet telah membuat perbedaan jarak dan waktu menjadi seperti tidak berarti lagi, hal ini tentunya sangat efisien untuk program aplikasi seperti sistem penilaian essay otomatis ini karena yang diuji tidak harus ada di satu tempat dan waktu yang bersamaan, tetapi mereka bisa mengakses dari tempatnya masing-masing.
Pada perancangannya sistem penilaian essay otomatis ini berupa algoritma yang terbagi menjadi beberapa bagian, diantaranya yaitu program utama, sub program, dan bagian program terperinci. Dan sistem penilaian essay otomatis ini diimplementasikan pada software berbasis web yang berintegrasi dengan web server sebagai media koneksi, database server sebagai media penyimpanan, dan software matematis sebagai tempat pemprosesan aljabar Singular Value Decomposition yang merupakan metode dari Latent Semantic Analysis atau LSA."
Depok: Fakultas Teknik Universitas Indonesia, 2004
S40167
UI - Skripsi Membership  Universitas Indonesia Library
cover
Agoes Prio Utomo
"Sistem penilaian yang dilakukan oleh penilai manusia untuk menilai jawaban essay dalam jumlah besar dirasakan kurang efisien. Hal ini disebabkan karena penilai manusia memiliki keterbatasan fisik yang tidak dapat dihindari. Untuk meningkatkan efisiensi perlu dibuat suatu sistem penilaian yang pemeriksaannya cepat dan obyektifitias tetap terjaga.
Pada tugas skripsi ini dilakukan perancangan dan implementasi interface software sistem penilaian essay otomatis serta aplikasi keamanan pada databasenya. Program aplikasi sistem penilaian essay otomatis ini berfungsi untuk menilai essay secara otomatis dengan menggunakan metode Latent Semantic Analysis atau LSA. Metode LSA adalah teori atau metoda untuk menyalin dan merepresentasikan arti kalimat dengan perhitungan matematis atau statistik. LSA mengkonversi essay ke dalam matriks. Setiap kata dalam paragraf kalimat direpresentasikan sebagai baris dan kolom matriks. Dengan menggunakan teknik matrik aljabar SVD (Singular Value Decomposition) dan normalisasi Frobenius. Selanjutnya sistem penilaian essay otomatis metode LSA ini diaplikasikan pada software berbasis web.
Pada perancangannya sistem penilaian essay otomatis ini berupa algoritma yang terbagi menjadi beberapa bagian, dengan menggunakan bahasa UML (Unified Modelling Language). Dengan menggunakan metode ini maka interface user dapat dirancang secara lebih efisien dan terstruktur, mulai dari struktur program utama sampai kepada struktur program yang lebih spesifik di dalamnya. Faktor keamanan database diimplementasikan melalui proses enkripsi MD5 bagi password user dan aplikasi session pada aplikasi untuk mencegah user mengakses halaman yang bukan haknya. Dengan menggunakan enkripsi MD5 maka password user dapat lebih terproteksi, karena dengan enkripsi ini, input password user dengan panjang dan karakter yang bervariasi dapat diubah menjadi bit hexadesimal dengan panjang yang tetap dan merupakan proses satu arah (tidak reversibel). Sedangkan dengan menggunakan aplikasi session maka akses user pada sistem menjadi lebih terkontrol dan mencegah penggunaan sistem yang tidak semestinya.
Untuk menguji performa dari sistem aplikasi ini dilakukan beberapa pengujian. Pengujian dilakukan dengan tujuan untuk mengetahui kecepatan sistem dalam melakukan proses penghitungan jawaban essay dengan menggunakan metode LSA, dengan cara memasukkan variasi panjang jawaban, jumlah kata kunci dan jumlah soal pada proses. Dari pengujian didapatkan bahwa jumlah soal, jumlah kata kunci dan panjang jawaban mempengaruhi kecepatan proses, semakin banyak jumlah soal, jumlah kata kunci dan panjang jawaban maka waktu proses yang dibutuhkan sistem juga semakin bertambah (hubungan positif) dengan korelasi sebesar 0,445872325 sampai 0,984473824."
Depok: Fakultas Teknik Universitas Indonesia, 2005
S40179
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>