Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 16 dokumen yang sesuai dengan query
cover
Salton, Gerard
Abstrak :
Presents a theory of indexing capable of ranking index terms, or subject identifiers in decreasing order of importance. This leads to the choice of good document representations, and also accounts for the role of phrases and of thesaurus classes in the indexing process. This study is typical of theoretical work in automatic information organization and retrieval, in that concepts are used from mathematics, computer science, and linguistics. A complete theory of information retrieval may emerge from an appropriate combination of these three disciplines.
Philadelphia: Society for Industrial and Applied Mathematics, 1975
e20450094
eBooks  Universitas Indonesia Library
cover
Cleveland, Donald B.
Colorado: Libraries Unlimited , 2001
025.3 CLE i
Buku Teks  Universitas Indonesia Library
cover
Sutanto Sugii Joji
Abstrak :
Semakin banyaknya dokumen pembicaraan menimbulkan kebutuhan untuk melakukan pencarian terhadap dokumen pembicaraan. Akan tetapi, metode perolehan informasi untuk dokumen teks tidak dapat langsung diterapkan pada dokumen pembicaraan. Isi dari dokumen pembicaraan adalah sinyal suara. Sinyal suara ini harus diproses terlebih dahulu agar didapat isi dari pembicaraan. Proses ini dinamakan pengenalan pembicaraan. Sistem perolehan informasi pembicaraan adalah sebuah sistem yang mengimplementasi teknik-teknik perolehan informasi dan menerapkannya kepada dokumen pembicaraan. Sinyal suara yang ada pada dokumen pembicaraan diproses terlebih dahulu dengan proses pengenalan pembicaraan agar didapat teks transkripsi pembicaraan. Sistem perolehan informasi pembicaraan melakukan pembuatan indeks berdasarkan teks pembicaraan hasil pengenalan pembicaraan. Penelitian ini menggunakan tiga koleksi dokumen. Koleksi pertama berisi 250 dokumen pembicaraan yang didapat dari pembicaraan telepon. Koleksi ini telah dibersihkan dari noise. Koleksi kedua berisi 100 dokumen pembicaraan yang didapat dari pembicaraan radio Pro3 Radio Republik Indonesia. Koleksi ketiga berisi 29.575 dokumen yang berasal dari pembicaraan telepon. Koleksi ketiga tidak dibersihkan dari noise. Word Error Rate dari tiap-tiap koleksi adalah 26.50%, 28.40%, dan 74.20%. Teknik-teknik yang diujicobakan adalah pembuatan indeks dengan masukan hasil pengenalan pembicaraan (Transkripsi), lima alternatif kata hasil pengenalan (Transkripsi-5), alternatif kata hasil pengenalan dengan probabilitas tinggi (Transkripsi-AB), pemetaan kata hasil pengenalan terhadap kamus pengucapan untuk mendapatkan rangkaian fonem (Transkripsi-Fonem), dan rangkaian fonem 3-gram (Transkripsi-3-gram). Selain dengan pengenalan pembicaraan, penelitian ini juga mencoba memberikan variasi pembuatan indeks dengan masukan dari hasil pengenalan pembicaraan yang telah dimodifikasi agar dapat mengenali fonem (Fonem). Setelah mendapatkan hasil fonem, rangkaian 3-gram juga dibuat dari hasil fonem yang didapat (Fonem-3-gram). Penelitian ini juga melakukan eksperimen dengan cara penggabungan indeks kata dan indeks.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Cleveland, Donald B.
Oxford : Libraries Unlimited, 2013
025.3 CLE i
Buku Teks  Universitas Indonesia Library
cover
I Putu Suhartika
Abstrak :
ABSTRAK
Penelitian ini merupakan penelitian tentang penerapan rumus frekuensi kata sebagai salah satu sarana pengindeksan. Dengan menggunakan majalah ilmiah dwi bahasa (bahasa Indonesia dan bahasa Inggris) sebagai sampel penelitian, maka diharapkan dapat diketahui istilah indeks dari kedua bahasa tersebut. Di samping hal tersebut, penelitian ini bertujuan untuk menghitung jumlah kata bahasa Indonesia dan bahasa Inggris, serta membandingkan istilah indeks yang dihasilkan melalui rumus frekuensi kata dengan ahli kehutanan dan subject specialist.

Masalah yang diteliti dalam penelitian ini adalah mengenai penentuan istilah indeks melalui rumus frekuensi kata, ahli kehutanan, dan subject specialist, mengenai perbedaan istilah indeks yang dihasilkan melalui ketiga sarana pengindeksan tersebut, dan mengenai perbedaan jumlah kata bahasa Indonesia dan bahasa Inggris.

Mengacu kepada masalah penelitian di atas, maka metode pengumpulan data yang digunakan dalam penelitian ini adalah metode dokumenter, sedangkan pengolahan data dilakukan dengan komputer memakai program WordStar Tiers/ 7.0. Setelah data tersebut terkumpul, selanjutnya dianalisis dengan menggunakan rumus Zipf. Untuk pengujian hipotesis penelitian digunakan analisis kuantitatif 1-student dan analisis kualitatif.

Hasil penelitian dan kesimpulan yang diperoleh adalah (1) jumlah seluruh kata yang muncul dalam artikel majalah Dula Rimba tahun 1988-1993 adalah 37258 kata, terdiri dari 18430 kata bahasa Indonesia dan 18918 kata bahasa Inggris. Dari jumlah tersebut, 10376 kata merupakan kata unik yang terdiri dari 5324 kata unik bahasa Indonesia dan 5052 kata unik bahasa Inggris, (2) secara statistik, jumlah kata antara kedua bahasa tersebut dinyatakan tidak berbeda secara nyata, (3) istilah indeks yang dihasilkan melalui rumus frekuensi kata berjumlah 187 buah, melalui ahli kehutanan berjumlah 109 buah, dan melalui subject specialist berjumlah 21 buah, dan (4) sebagian besar istilah indeks yang dihasilkan melalui rumus frekuensi kata mempunyai persamaan dengan istilah indeks yang ditentukan oleh ahli kehutanan dan subject specialist, sehingga dapat dikatakan bahwa istilah indeks melalui rumus frekuensi kata dengan ahli kehutanan dan subject specialist tidak berbeda secara nyata.
ABSTRACT
This research is about the application of word frequency formula as one of indexing tools. By using bilingual magazine (Indonesian and English) as research sample, it hopes index terms of both languages can be determined. Beside that, the research aims to calculate the amount of Indonesian words and English, and also to compare index terms produced by word frequency formula with index terms provided by foresters and subject specialist.

The problems observed in the research are about the determination of index terms from word frequency formula, foresters, and subject specialist, about the difference among these index terms, and about the difference between the amount of Indonesian words and English.

Relate to the above problems, the method of collecting data used in this research is documentation method, whereas the word processing is done by computer using WordStar program. After the data is collected, it is then analyzed by using Goffman formula. To test hypothesis, it uses quantitative analysis t-student and qualitative analysis.

Result and conclusion gained in the research are as follows: (I) the total words appear in the article of Duta Rimba magazine in 1988-1993 amount to 37258 words, consist of 18430 Indonesian words and 18918 English words. Of the amount, there are 10376 unique words which consist of 5324 Indonesian unique words and 5052 English unique words, (2) statistically, the amount of Indonesian words and English words are not significantly different, (3) the index terms produced by word frequency formula amount to 187 index terms, provided by foresters amount to 109 index terms, and provided by subject specialist amount to 21 index terms, and (4) 65% index terms provided by foresters are the same as index terms produced by word frequency formula, whereas 61,54% index terms provided by subject specialist are the same as index terms produced by word frequency formula, so that's why, it can be said that there are a' lot of index terms produced by word frequency formula have similarity with index terms provided by foresters and subject specialist.
1997
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
cover
Novanda Rizka Aditya
Abstrak :
Skripsi ini membahas tentang pembentukan portfolio yang terdiri dari 10 saham yang mempunyai nilai kapitalisasi pasar terbesar dengan menggunakan metode market capitalization-weighted indexing, equal-weighted indexing, dan diversity indexing. Portfolio yang sudah dibentuk menggunakan metode tersebut, kemudian diukur kinerjanya dengan menggunakan Treynor, Sharpe, Jensen alpha, dan Information Ratio. Dari hasil penilaian kinerja dan penelitian berdasarkan portfolio yang sudah dibentuk menunjukkan metode market capitalizationweighted merupakan metode yang paling bagus untuk digunakan dalam membentuk suatu portfolio ......This study discusses the establishment of portfolio that composed from 10 biggest market capitalization stock with market capitalization-weighted indexing, equalweighted indexing, diversity indexing. Then, the performance of portfolio measured with Treynor, Sharpe, Jensen alpa, and Information Ratio. Based on research and performance analysis, market capitalization-weighted indexing method is the best method that can be used for composing a portfolio.
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2016
S62345
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dandun Kusuma Yudha
Abstrak :
Skripsi ini membahas tentang perbandingan dua algoritma untuk sistem penilaian esai otomatis (Simple-O), yaitu generalized latent semantic analysis (GLSA) laplacian eigenmaps embedding (LEM) dan hybrid indexing. Kedua algoritma tersebut dibandingkan untuk mengetahui cara kerja kedua algoritma tersebut, kecepatan proses, dan hasil penilaiannya. Perbandingan cara kerja dilakukan dengan membandingkan pseudocode dari masing-masing algoritma. Kecepatan proses dihitung untuk mengetahui algoritma yang lebih cepat dalam menilai esai. Algoritma GLSA hybrid indexing merupakan pengembangan dari algoritma LEM. Perbedaan mendasar dari kedua algoritma tersebut adalah pada perlakuan kata benda dan kata-kata selain kata benda. Penelitian ini menggunakan sampel delapan soal yang dikerjakan oleh 48 mahasiswa (384 data). Dari hasil penelitian, GLSA LEM memiliki total waktu proses 46.51454 detik lebih cepat dari GLSA hybrid indexing. Sedangkan rata-rata waktu proses GLSA LEM dan GLSA hybrid indexing untuk menilai satu jawaban adalah 6-6.6 detik. Hasil penilaian dari GLSA LEM dan GLSA hybrid indexing memiliki tingkat kemiripan tertinggi 95,83% dan terendah 16,67%. Dari percobaan sebanyak delapan soal, lima diantaranya memiliki tingkat kemiripan lebih dari 83,33%. ......This thesis discusses the comparison between two algorithms which used in automated essay grading system (Simple-O). The two algorithms are generalized latent semantic analysis (GLSA) embedding laplacian eigenmaps (LEM) and hybrid indexing. Both algorithms are compared to determine how the algorithms works, processing time, and the scores. Pseudocode can be used to determine how the algorithms are working, The processing time is calculated to find out which algorithm is faster in assessing essays. GLSA hybrid indexing algorithm is a development from GLSA LEM. The fundamental difference of the two algorithms is in the treatment of a subset of nouns and words other than nouns. This research using samples of eight questions which filled by 48 students (384 data). From the research, GLSA LEM has a total processing time of 46.51454 seconds faster than GLSA hybrid indexing. While the average processing time GLSA LEM and hybrid GLSA indexing to grade the answer is 6 to 6.6 seconds. GLSA LEM and GLSA hybrid indexing grades have the highest similarity level of 95.83% and 16.67% for the lowest similarity level. From the eight questions, five questions have similarity level more than 83.33%.
Depok: Fakultas Teknik Universitas Indonesia, 2014
S53110
UI - Skripsi Membership  Universitas Indonesia Library
cover
Gema Parasti Mindara
Abstrak :
Dewasa ini, banyak sekali ketersediaan data multimedia yang direkam dalam bentuk digital seperti teks, citra, audio dan video serta tersimpan dalam berbagai database. Data multimedia tersebut dapat diakses dengan menggunakan mesin pencari seperti Google, Yahoo, dan Bing. Namun, hasil pencarian dari mesin pencari tersebut belum bisamenghubungkan berbagai media kedalam suatu konsep yang saling terkait. Hal ini menyebabkan hasil penetapan relevansi (relevance judgement) menjadi tidak optimal. Disisi lain, mesin pencari hanya bisa menerima kueri tipe teks atau citra, seperti Google. Oleh karena itu, dibutuhkan suatu mekanisme identifikasi data multimedia secara terpadu (Unified Indexing) dan Query Interface yang bisa menerima berbagai tipe media. Proses Unified Indexing terdiri dari beberapa tahapan: (1) Membangun testbed; (2) Perancangan Unified Indexing; (3) Implementasi; (4) Ujicoba dan Evaluasi. Perancangan Unified Indexing terdiri dari: Modul Mono Modal Indexing, Modul Conceptdan Modul Search. Modul Mono Modal Indexing melakukan pengindeksan masing-masing tipe media. Sedangkan ModulConceptmelakukanpemberiankonsepkepada data multimedia dengan proses naming. Selanjutnya, Modul Search melakukan pencarian informasi dengan berbagai tipe kueri multimedia (QueryInterface). Ketiga modul tersebut selanjutnya diimplementasikan pada tahapan implementasi. Tahapan ujicoba dan evaluasi dibangun berdasarkan dua skenario, yaitu sistem yang belum menggunakan UnifiedIndexing dan sistem yang telah menggunakan UnifiedIndexing. Hasil ujicoba memberikan hasil peningkatan perolehan informasi data terambil untuk kueri teks 77%, kueri citra 60%, kueri audio 62% dan kueri video 60%. Sedangkan rata-rata perolehan data relevan untuk kueri teks 81%, kueri citra 85%, kueri audio 84% dan kueri video 85%. ......Today, a lot of recorded multimedia data available in digital form such as text, image, audio and video stored in various databases. Multimedia data could be accessed by using search engine such as Google, Yahoo, and Bing. However, the result has not been able to link variety of media into an interrelated concepts. This causes the results of relevance judgement is not optimal. On the other hand, the search enginesuch as Google could only received query type likes text or image. Therefore, we need a mechanism of identifying multimedia data in integrated way (Unified Indexing) and Query Interface that can accept various type of media. Unified Indexing and Query Interface processes consist of several stages: (1) Establish a testbed as experimental data; (2) Design of Unified Indexing; (3) Implementation; and (4) Test and Evaluation. The design of Unified Indexing comprises of: Mono Modal Indexing Module, Concept Module and Search Module. Mono Modal Indexing Module performs indexing of each type of media. Concept Module conducts giving concept of multimedia data with naming process. Search Module searchs information with various type of multimedia queries (Query Interface). The modules are implemented in the Implementation Stage. Test and evaluation stage built on two scenarios: a system that is not use Unified Indexing and system that use Unified Indexing The results showed that by using the Unified Indexing, multimedia data residing on the same concept provides a better retrieval results:using query by text improve by average is 77%, by image is 60%, by audio is 62% and by video is 60%. Furthermore, the increase of relevant data using query by text is 81%, by image is 85%, by audio is 84% and by video is 85%.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2013
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Adi Wahyu Pribadi
Abstrak :
Setiap dokumen pada koleksi menjelaskan suatu konsep berdasarkan topik yang dibahasnya Konsep tersebut didapat dengan teknik pengindeksan konseptual atau Latenl Semantic Indexing. Teknik tersebut mengakibatkan jumlah dokumen yang terambil lebih banyak karena adanya perluasan kueri (c/uery expansion) secara konseptual. Seiring berjalannya waktu, teijadi penambahan dokumen sehingga indeks menjadi tidak lengkap. Digunakan metode penambahan dokumen secara dinamis pada indeks konseptual yang ada dengan metode folding-in dan SVD- Update. Ujicoba dilakukan pada kumpulan hasil penelitian lembaga BATAN sebanyak 1162 abstrak dokumen. Berdasarkan ujicoba, pada model pengindeksan konseptual dokumen yang terambil lebih banyak yaitu rata-rata 12,63% dibandingkan dengan penggunaan pengindeksan biasa sebanyak 10,37%, Pada ujicoba penambahan dokumen, terjadi penurunan kinerja yang tidak signifikan yaitu 0,5% hingga 2% saja. ......Each document in the collection describes a concept based on particular topics. The concept is obtained with the technique of conceptual or latent Semantic Indexing. The technique resulting in the number of documents fetched more because of the conceptual queiy expansion. Over time, Ihere was the addition of documents so that the indexes are not complete. Using Folding-in and SVD- Update to update the index of document collection conceptually. We use BATAN research collection of 1162 document abstracts. Based on testing, on the conceptual model of the document fetched more with the average of 12.63% compared with the normal indexing of 10.37%. On testing of adding documents, a decline of performance that is not significant, namely 0.5% to 2% only.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009
T25887
UI - Tesis Open  Universitas Indonesia Library
<<   1 2   >>