Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 11 dokumen yang sesuai dengan query
cover
Dina Chahyati
Abstrak :
Pelacakan orang banyak pada video berdasarkan hasil deteksi orang pada setiap frame merupakan problem yang menantang karena kompleksitas yang dimilikinya. Kesalahan deteksi orang pada setiap frame akan menyebabkan kesalahan pelacakan orang pada keseluruhan video. Pada penelitian ini, diusulkan metode pelacakan yang dapat meminimalkan propagasi kesalahan dari kesalahan deteksi dengan waktu pelacakan yang tidak terlalu lama. Penelitian ini menggunakan deep convolutional neural network (DCNN) seperti Faster-RCNN dan RetinaNet sebagai detektor objek dan algoritma Hungarian sebagai metode asosiasi antar orang-orang yang terdeteksi di setiap frame. Matriks masukan untuk algoritma Hungarian terdiri dari kedekatan vektor ciri DCNN yang dihasilkan oleh Siamese Network, jarak titik tengah bounding box, dan perbandingan irisan-gabungan (IoU) dari bounding box. Pada tahap akhir dilakukan interpolasi terhadap hasil pelacakan. Metode yang diusulkan menghasilkan MOTA 61.0 pada dataset benchmark pelacakan orang banyak MOT16. ......Multiple object (human) tracking in video based on object detection in every frame is a challenging problem due to its complexity. Error in the detection phase will cause error in the tracking phase. In this research, a multiple human tracking method is proposed to minimize the error propagation. The method uses deep convolutional neural network (DCNN) such as Faster-RCNN and RetinaNet as object detector and Hungarian algorithm as association method among detected humans in consecutive frames. The input matrix for Hungarian algorithm consists of the similarity of DCNN feature vector resulted from Siamese network, the distance of bounding box centers, and bounding box intersection of union (IoU). In the last step, interpolation is applied to the tracking result. The proposed method achieves 61.0 MOTA in multiple object tracking benchmark MOT16.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2019
D-pdf
UI - Disertasi Membership  Universitas Indonesia Library
cover
Alexander Agung Santoso Gunawan
Abstrak :
ABSTRAK
Pelacakan objek secara visual adalah proses melokalisasi terus menerus entitas visual pada suatu urutan video. Disertasi ini menyelidiki masalah short-term model-free tracking yang mempunyai tujuan utama untuk melacak sembarang objek berdasarkan satu kotak anotasi dari objek dan oleh karena itu disebut sebagai model-free. Short-term di sini berarti bahwa pelacak tidak melakukan deteksi ulang setelah target menghilang dalam pelacakan. Banyak faktor yang mempengaruhi kinerja algoritma pelacakan. Dalam Visual Tracker Benchmark, terdapat sebelas tantangan dalam pelacakan objek, yaitu: variasi iluminasi, variasi skala, oklusi, deformasi, blur, gerakan yang cepat, in-plane rotation, out-of-plane rotation, keluar dari pandangan, latar belakang yang kusut, dan resolusi yang rendah. Selama ini belum ada satu pelacak yang berhasil menangani semua skenario tersebut dengan kokoh robust . Selain itu, implementasi dari pelacak ini harus cukup cepat fast agar berguna dalam aplikasi nyata. Disertasi ini mengusulkan algoritma pelacakan yang baru dalam kerangka Bayesian. Algoritma yang diusulkan dikonstruksi dengan memecahkan optimal particle filter OPF secara efisien menggunakan metode spektral. Oleh karena itu, pelacak yang dikonstruksi disebut sebagai spectral tracker ST . Walaupun pelacak ini dapat melakukan komputasi posisi secara efisien, tetapi tidak dapat mengestimasi skala dan rotasi. Untuk mengatasi kelemahan ini, diusulkan penggunaan banyak titik observasi sekaligus dan menggunakan informasi pergerakan titik-titik observasi ini untuk mengestimasi skala dan rotasi. Selanjutnya dilakukan eksperimen untuk melihat pengaruh pra-pemrosesan citra meliputi warna, tekstur dan saliensi pada kinerja pelacakan dengan membangun 6 variasi model observasi dari pelacak ST. Akhirnya, kinerja variasi pelacak ST ini dibandingkan dengan 9 pelacak pembanding yang relevan pada 100 himpunan data. Hasil secara keseluruhan terdapat sebuah peningkatan unjuk kerja terutama dalam hal kekokohan dan kecepatan. Tetapi pada evaluasi yang lebih rinci dalam menghadapi 11 tantangan, ternyata pendekatan yang berbeda dari setiap pelacak ternyata menghasilkan unjuk kerja yang berlainan dalam menghadapi setiap tantangan tersebut.
ABSTRACT
Visual object tracking is the process of continuously localizating a visual entity or visual entities in a video sequence. This dissertation investigates short term model free tracking which the main purpose is tracking of arbitrary objects based on a single bounding box annotation of the object, which then called as model free. The short term tracking means that the tracker does not perform re detection after the target is lost. Numerous factors affect the performance of a tracking algorithm. In Visual Tracker Benchmark, there are eleven main tracking challenges, including illumination variation, scale variation, occlusion, deformation, motion blur, fast motion, in plane rotation, out of plane rotation, out of view, background clutters, and low resolution. There exists no single robust tracker that successfully handles all scenarios nowadays. Moreover, the implementation of tracker should be fast enough to be useful in real applications. We propose a novel algorithm based on Bayesian paradigm that works in frequency domain and exploits spectral method for solving optimal particle filter scheme in Bayesian framework. Therefore the tracker is called as spectral tracker ST . In order to able to estimate scaling and rotation, we modify the tracker to use multiple observation points. Futhermore, several experiments is done to see impact of observation model by manipulating image in color, texture and saliency. As result, we design six variation of spectral tracker based on the observation model. Finally, the performance of the tracker is compared with other relevant trackers on benchmark dataset sequences. An improvement over state of the art methods is achieved, in term of robustness and speed. Nevertheless, the evaluation of eleven tracking challenges shows that different approaches of tracker have unique performance in each challenge.
2016
D-Pdf
UI - Disertasi Membership  Universitas Indonesia Library
cover
Erdefi Rakun
Abstrak :
ABSTRAK
SIBI merupakan bahasa isyarat resmi bagi penyandang tunarungu di Indonesia. Dalam pembentukan isyarat, SIBI mengikuti aturan tata bahasa Indonesia. Untuk membentuk isyarat kata berimbuhan, maka isyarat imbuhan awalan, akhiran dan partikel ditambahkan ke isyarat kata dasar. Karena banyak isyarat SIBI merupakan isyarat kata berimbuhan dan belum ada penelitian tentang kata tersebut, maka penelitian ini fokus pada membangun sistem penerjemah kata berimbuhan SIBI ke teks. Gerakan isyarat ditangkap oleh kamera Kinect yang menghasilkan data color, depth dan skeleton. Data Kinect ini diolah menjadi fitur yang dipakai oleh model untuk mengenali gerakan. Sistem penerjemah memerlukan teknik ekstraksi fitur, yang dapat menghasilkan sebuah feature vector set dengan ukuran yang minimal. Penelitian ini berusaha untuk dapat memisahkan isyarat imbuhan dan kata dasar pada isyarat kata berimbuhan. Dengan kemampuan ini, sistem penerjemah menghasilkan 3 feature vector set: kata dasar, awalan dan akhiran. Tanpa pemisahan, feature vector set yang harus disediakan adalah sebanyak perkalian cartesian dari ketiga feature vector set tersebut. Perkalian ketiga set ini tentunya akan menghasilkan feature vector set total yang berukuran sangat besar. Model yang dicoba pada penelitian ini adalah Conditional Random Fields, Hidden Markov Model, Long Short-Term Memory Neural Networks LSTM dan Gated Recurrent Unit. Akurasi yang terbaik yang dicapai oleh untuk LSTM 2-layer 77.04 . Keunggulan dari LSTM terletak pada inputnya yang berupa sequence-of-frames dan setiap frame direpresentasi oleh fitur lengkap, bukan fitur hasil clustering. Model sequence-of-frames lebih cocok untuk SIBI, karena gerakan isyarat SIBI memiliki long-term temporal dependencies. Error hasil prediksi banyak terjadi pada kelompok awalan dan akhiran. Hal ini karena miripnya gerakan pada isyarat-isyarat imbuhan SIBI tersebut. LSTM 2-layer yang dipakai untuk mengenali kata dasar saja memberikan akurasi yang tertinggi 95.4 .
ABSTRACT
SIBI is the official sign language system for the Indonesian language. The formation of SIBI gestures follow Indonesian grammar rules, including inflectional words. Inflectional words are root words with prefixes, infixes, and suffixes, or a mix of the three. Inflectional gestures are made from root word gestures, with prefix, suffix and particle gestures added in the order in which they appear, all of which is unique to SIBI. This research aims to find a suitable model that can quickly and reliably perform SIBI to text translation on inflectional word gestures. The hand movement of the signer is captured by a Kinect camera. The Kinect data was then processed to yield features for the models to use recognize the gestures. Extant research have been able to translate the alphabet, root words, and numbers from SIBI to text, but none has been able to translate SIBI inflectional word gestures. In order for the translation system to work as efficiently as possible, this research developed a new method that splits an inflectional word into three feature vector sets root, prefix, suffix . This ensures that a minimally descriptive feature sets are used. Without using this, the feature sets would otherwise be as big as the Cartesian product of the prefixes, suffixes and root words feature sets of the inflectional word gestures. Four types of machine learning models were tested Conditional Random Fields, Hidden Markov Model, Long Short Term Memory Net, dan Gated Recurrent Unit. The 2 layer LSTM, with an accuracy of 77.04 , has been proven to be the most suitable. This model 39 s performance is due to the fact that it can take entire sequences as input and doesn 39 t rely on pre clustered per frame data. The 2 layer LSTM performed the best, being 95.4 accurate with root words. The lower accuracy with inflectional words is due to difficulties in recognizing prefix and suffix gestures.
2016
D2244
UI - Disertasi Membership  Universitas Indonesia Library
cover
Laode Mohammad Rasdi Rere
Abstrak :
ABSTRAK
Dalam beberapa tahun terakhir, Deep Learning DL telah menarik banyak perhatian dalam penelitian pemelajaran mesin. Metode ini telah berhasil dipakai untuk berbagai aplikasi pada pemrosesan suatu, robotika, pengenalan fonetik, pencarian informasi dan bahkan analisa molekul. Meskipun DL telah berhasil sukses untuk diterapkan dalam berbagai bidang aplikasi, training yang diperlukan pada metode ini tidaklah mudah. Sejumlah cara telah diusulkan untuk membuat proses training DL menjadi lebih optimal, beberapa diantanya dengan menambahkan proses pre-training, memutuskan beberapa jaringan dalam lapisan, ataupun mengganti fungsi aktivasi dan metode gradien standar yang dipergunakan. Disertasi ini menggunakan pendekatan lain dalam optimasi DL, yaitu memakai algoritme metaheuristik. Secara umum disertasi ini dibagi dalam dua bagian besar. Bagian pertama adalah studi awal penelitian yang difokuskan pada beberapa eksperimen yang berkaitan dengan algoritme metaheuristik dan aplikasi DL dalam klasifikasi citra. Bagian kedua dari disertasi berkaitan dengan penerapan algoritme metaheuristik dalam DL. Hasil pada bagian ini misalnya untuk optimasi metode Convolutional Neural Nework CNN menggunakan dataset CIFAR10, diperoleh untuk Top-1 error pada validasi adalah 99,05 . Hasil ini lebih baik dari nilai akurasi CNN asli sebesar 88,21 , fine-tuning CNN menggunakan Harmony Search yang diusulkan G. Rosa dkk sebesar 78,28 , dan bahkan State of the art saat ini sebesar 96,53 dengan Fractional Max-Pooling.
ABSTRACT
In recent years, deep Learning DL has drawn many attention in machine learning research. This method has been successfully used in various applications, such as sound process, robotics, phonetic identification, information retrieval, and even molecule analysis. Although DL has been successful to be applied in many fields, it is difficult to train in this method. Various attempts and methods has been proposed to make the DL training process become more optimum, some of them are by adding pre training process, drop out some networks in the layer, or by replacing activation function and standard gradient method being used. This dissertation takes another way to optimize a DL, i.e. using metaheuristic algorithms. Overall, this dissertation will be divided into two main parts. The first part is a preliminary study of research, focusing on several experiments which were related to the metaheuristic algorithm and DL application in image classification. The second part of this dissertation is related to application of metaheuristic algorithm in DL. The results in this part, for example, the optimization of CNN method using CIFAR10 dataset for Top 1 error in validation is 99.05 . This result is higher than the accuracy level from original CNN 88,21 , fine tuning CNN using Harmony Search suggested by G. Rossa et.al 78.28 , and even ldquo State of the art rdquo right now using Fractional Max Pooling 96.53
2017
D-Pdf
UI - Disertasi Membership  Universitas Indonesia Library
cover
Arif Budiman
Abstrak :
ABSTRAK
Tantangan aliran data besar membutuhkan mesin pembelajaran khusus. Ragam, variabilitas dan kompleksitas berkaitan dengan masalah pergeseran konsep CD . Jumlah dan kecepatan berkaitan dengan masalah skalabilitas. Kami mengusulkan pendekatan integrasi jaringan syaraf konvolusi CNN dengan mesin pembelajaran ekstrem ELM yang menggunakan banyak CNNELM secara paralel. Solusi CD pendekatan pertama, CNNELM adaptif ACNNELM-1 menggunakan ELM tunggal dengan banyak CNN dengan menerapkan Adaptif Online Sequential ELM. Pendekatan ke- dua ACNNELM-2 menggunakan paduan penggabungan matriks dari banyak CNNELM. Solusi skalabilitas, Distributed averaging DA CNNELM bekerja dengan konsep MapReduce. CNNELM mulai dengan cetakan bobot yang sama kemudian dilatih secara asinkronus menggunakan partisi dari data pelatihan. Hasil akhir didapat dengan merata-ratakan bobot kernel dan ELM output. Ini menghemat waktu pelatihan dibandingkan satu CNNELM dengan pelatihan keseluruhan data. Kami mempelajari metoda pelatihan propagasi balik untuk memperbaiki akurasi dengan iterasi. Kami melakukan verifikasi dengan data extended MNIST, Not-MNIST dan CIFAR10. Kami men-simulasikan pergeseran virtual, pergeseran nyata , dan pergeseran hibrid. Pelatihan DA membagi data pelatihan menjadi beberapa himpunan partisi lebih kecil. Perangkat yang dipakai adalah Deep Learning toolbox dengan CPU parallel, dan Matconvnet dengan GPU. Kelemahan metoda ini memerlukan pemilihan penambahan parameter pembelajaran dan distribusi data pelatihan.
ABSTRACT
Big stream data challenges need special machine learning. Variety, variability and complexity are related with concept drift CD problem. Volume and velocity are related with scalability problem. We proposed integration approach Convolutional Neural Network CNN with Extreme Learning Machine ELM that used multi parallel CNNELM. For CD, the 1st approach, the Adaptive CNNELM ACNNELM 1 used single ELM with multi CNN by employing Adaptive Online Sequential ELM. The 2nd approach ACNNELM 2 used matrices concatenation ensemble from multi CNNELM. For scalability solution, the distributed averaging DA CNNELM worked with MapReduce concept. CNNELM started with the same weight template afterward trained asynchronously using the partition of training data. Final result obtained by averaging all kernel and ELM output weights. This saved training time instead of single CNNELM trained by the whole data. We studied the backpropagation method to improve the accuracy through iterations. We verified using extended MNIST, not MNIST and CIFAR10 data set. We simulated virtual drift, real drift, and hybrid drift. The DA training divided the training data set to be some smaller partition set. The tools are Deep Learning toolbox with CPU parallel enhancement, and Matconvnet with GPU. The drawbacks need additional learning parameters and the distribution of training data selection.
2017
D-Pdf
UI - Disertasi Membership  Universitas Indonesia Library
cover
Prima Dewi Purnamasari
Abstrak :
Terdapat dua masalah besar yang diselesaikan dalam disertasi ini, yaitu masalah pemrosesan sinyal dan masalah aplikasi sinyal EEG dalam pengenalan keadaan emosi. Masalah tersebut diselesaikan dengan metode kecerdasan komputasional yang terdiri dari bagian utama, ekstraksi fitur dan klasifikasi. Pada bagian ekstraksi fitur, pada disertasi ini dibahas penggunaan metode konvensional ekstraksi fitur berbasis power spectrum yaitu dengan Discrete Wavelet Transform DWT , dan penggunaan metode baru ekstraksi fitur yang diajukan yaitu analisis bispektrum dengan filter piramida 3D, serta dengan Relative wavelet bispectrum RWB. Untuk menyelesaikan permasalahan penerapannya pada sistem otomatis pengenal emosi, maka classifier dengan jenis Artificial Neural Network ANN digunakan.Penggunaan DWT dalam metode ekstraksi fitur menunjukkan bahwa fitur Relative Wavelet Energy DWT RWE memberikan recognition rate terbaik, konsep energi relatif ini kemudian digunakan pada metode baru yang diajukan. Pada metode baru ekstraksi fitur menggunakan analisis bispektrum dengan filter piramida 3D, diketahui bahwa persentase mean bispektrum memberikan recognition rate yang terbaik dengan kompleksitas yang lebih rendah 74.22 untuk arousal dan 77.58 untuk valence. Filter non-overlap dengan ukuran alas yang bervariasi memberikan recognition rate tertinggi, khususnya secara signifikan terlihat untuk jenis emosi arousal. Penurunan jumlah channel EEG sampai dengan 8 channel dapat dilakukan untuk menurunkan biaya komputasi. Metode baru ekstraksi fitur yaitu RWB telah diajukan dalam disertasi ini dan menunjukkan pengenalan yang sangat baik mencapai 90 untuk data sinyal EEG orang alkoholik. Semakin besar lag yang digunakan dalam perhitungan korelasi, semakin tinggi recognition rate yang diperoleh. Capaian dari penelitian ini membuktikan bahwa RWB cocok untuk digunakan sebagai metode ekstraksi fitur untuk klasifikasi orang alkoholik, dan dapat dipertimbangkan untuk digunakan pada aplikasi lainnya. Dari keempat classifier yang diujikan, dari segi recognition rate, PNN sedikit lebih unggul daripada BPNN, namun uji sensitivity, specificity dan PPV serta grafik ROC menunjukkan bahwa BPNN merupakan classifier yang lebih baik dibanding PNN. Di sisi lain, waktu komputasi PNN untuk mencapai recognition rate maksimum adalah sekitar 3,5 kali lebih cepat dibanding BPNN.
There are two major problems resolved in this dissertation, which are signal processing problem and the problem in EEG signal in the application of recognizing human emotional states. The problems were solved by applying a computational intelligence method consists of two main parts, the feature extraction and the classification. In the feature extraction sub system, this study improved a conventional methods using power spectrum from discrete wavelet transform DWT, and proposed a new method for feature extraction by using bispectrum analysis with 3D pyramid flter, as well as using relative wavelet bispectrum RWB. To solve the problem in the application of EEG signal for automatic emotion recognition system, the artificial neural network ANN classifier was used.The use of DWT in the feature extraction method shows that the relative wavelet energy DWT RWE feature provides the best recognition rate, the relative energy concept was then used in the proposed new feature extraction methods. In the proposed feature extraction using bispectrum analysis with 3D pyramid filters, the mean percentage of bispectrum feature gave the best recognition rate with lower complexity i.e. 74.22 for arousal and 77.58 for valence. Non overlap filters with varied base sizes provided the highest recognition rate, and significantly seen for the arousal emotion. The selection of eight EEG channels can be conducted to lower the cost of computing. A novel feature extraction method, the RWB, showed an excellent recognition for the alcoholic person. The larger the lag used in the correlation calculation in RWB, the higher the recognition rate obtained. The achievements of this study proved that RWB is suitable as a feature extraction method for the classification of alcoholic subjects, and may be considered for use in other applications.Of the four classifiers tested, PNN is slightly superior to BPNN in terms of recognition rate however, the sensitivity, specificity and PPV tests and ROC graph shown that BPNN is a better classifier than PNN. On the other hand, the PNN computing time to reach the maximum recognition rate was about 3.5 times faster than BPNN.
Depok: Fakultas Teknik Universitas Indonesia, 2017
D2271
UI - Disertasi Membership  Universitas Indonesia Library
cover
Intan Nurma Yulita
Abstrak :
ABSTRAK
Kurangnya melatonin pada anak-anak dengan Autisme menyebabkan mereka sulit tidur dibandingkan dengan anak-anak lain. Akibatnya, masalah gangguan tidur ini meningkatkan perilaku menyimpang anak-anak dengan autisme. Polisomnografi menjadi salah satu alternatif yang dapat dilakukan untuk mendiagnosis gangguan tidur mereka. Untuk mengatasi masalah ini, kami mengembangkan sistem yang dapat secara otomatis mengklasifikasikan tahap tidur. Penelitian ini juga mengusulkan metode baru untuk klasifikasi tahap tidur, yang disebut metode FastConvolutional. Metode yang diusulkan dievaluasi terhadapdataset yang dikumpulkan di Rumah Sakit Mitra Keluarga Kemayoran, Indonesia. Berdasarkan penelitian yang telah dilakukan, FastConvolutional memiliki kinerja terbaik dibandingkan dengan semua classifier untuk dataset Autisme. F-measure -nya adalah 51,33 . Metode FastConvolutional bekerja dengan baik pada dataset yang diuji. Metode ini mencapai hasil dengan F-measure yang tinggi dan running time yang efisien. Dengan demikian, metode ini dapat menjadi classifier yang menjanjikan untuk klasifikasi tahap tidur.
ABSTRACT
A lack of the melatonin in children with Autism causes them difficult to sleep compared with other children. As a result, the sleep disorder increases the deviant behavior of children with Autism. Polysomnography becomes one of the alternatives that can be done to diagnose their sleep disorders. To overcome this problem, we developed a system that can automatically classify sleep stages. This study also proposes a new method for sleep stage classification, called the FastConvolutional method. The proposed method was evaluated against a sleep datasets that were collected in Mitra Keluarga Kemayoran. Based on research that has been done, the FastConvolutional had the best performance compared to all the classifier for Autism dataset. Its F-measure was 51.33 . The FastConvolutional method worked well on the tested datasets. It achieved a high F-measure result and an efficient running time. Thus, it can be considered a promising tool for sleep stage classification.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2018
D2489
UI - Disertasi Membership  Universitas Indonesia Library
cover
Derwin Suhartono
Abstrak :
ABSTRAK
Argumentation mining merupakan bidang penelitian yang berfokus pada kalimat dengan tipe argumentasi. Kalimat argumentasi sering digunakan pada komunikasi sehari-hari serta memiliki peran penting pada setiap proses pengambilan keputusan atau kesimpulan. Tujuan penelitian ini adalah untuk melakukan observasi mengenai pemanfaatan deep learning dengan mekanisme atensi pada anotasi dan analisa kalimat argumentasi.Anotasi argumentasi merupakan pengelompokan komponen argumen dari sebuah wacana ke dalam beberapa kelas. Kelas didefinisikan menjadi 4, yaitu major claim, claim, premise dan non-argumentative. Analisa argumentasi mengarah kepada karakteristik dan validitas argumentasi yang tersusun pada topik tertentu. Salah satu bentuk analisa adalah penilaian apakah argumentasi yang dibentuk sudah terkategori sufficient atau belum. Dataset yang digunakan untuk anotasi dan analisa argumentasi adalah 402 esai persuasif. Dataset ini juga ditranslasikan ke dalam Bahasa Indonesia untuk memberikan gambaran bagaimana model bekerja pada bahasa lain.Beberapa model deep learning, diantaranya CNN Convolutional Neural Network , LSTM Long Short-Term Memory , dan GRU Gated Recurrent Unit digunakan untuk anotasi dan analisa argumentasi sedangkan HAN Hierarchical Attention Network hanya digunakan untuk analisa argumentasi. Mekanisme atensi ditambahkan pada model sebagai pemberi weighted access untuk performa yang lebih baik. Classifier yang digunakan adalah fully connected layer dan XGBoost.Dari eksperimen yang dilakukan, integrasi deep learning dengan mekanisme atensi untuk anotasi dan analisa kalimat memberikan hasil yang lebih baik dari penelitian sebelumnya.
ABSTRACT
Argumentation mining is a research field which focuses on sentences in type of argumentation. Argumentative sentences are often used in daily communication and have important role in each decision or conclusion making process. The research objective is to do observation in deep learning utilization combined with attention mechanism for argument annotation and analysis.Argument annotation is argument component classification from discourse to several classes. Classes include major claim, claim, premise and non-argumentative. Argument analysis points to argumentation characteristics and validity which are arranged in one topic. One of the analysis is how to assess whether an established argument is categorized as sufficient or insufficient. Datased used for argument annotation and analysis is 402 persuasive essays. This data is translated to Bahasa as well to give overview about how does it work with other language.Several deep learning models such as CNN Convolutional Neural Network , LSTM Long Short-Term Memory , and GRU Gated Recurrent Unit are utilized for argument annotation and analysis while HAN Hierarchical Attention Network is utilized only for argument analysis. Attention mechanism is combined with the model as weighted access setter for a better performance. The classifiers are fully connected layer and XGBoost.From the whole experiments, deep learning and attention mechanism integration for argument annotation and analysis arrives in a better result compared with previous research.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2018
D2502
UI - Disertasi Membership  Universitas Indonesia Library
cover
Dewi Yanti Liliana
Abstrak :
ABSTRAK
Pengenalan emosi melalui analisis ekspresi wajah merupakan bidang riset kecerdasan buatan yang sedang berkembang serta memiliki banyak tantangan. Hal ini disebabkan karena emosi merupakan komponen penting dalam kehidupan manusia terutama dalam berinteraksi dan berkomunikasi, sehingga perlu dikembangkan sebuah sistem cerdas yang mampu mengenali emosi manusia. Permasalahannya adalah banyaknya variasi ekspresi wajah yang menunjukkan emosi manusia. Selain itu, manusia secara subyektif dapat mengekspresikan suatu emosi yang sama dengan beragam cara dan jenis pergerakan komponen wajah yang berbeda, bahkan ambigu antar jenis emosi. Psikolog mengkategorikan emosi menjadi dua kategori, yaitu emosi dasar dan emosi campuran. Penelitian pengenalan emosi dasar (marah, jijik, takut, senang, sedih, terkejut) telah banyak dilakukan, namun pengenalan emosi campuran merupakan tantangan yang belum banyak dieksplorasi karena kompleksitasnya yang tinggi. Kemunculan emosi campuran berbeda dari emosi dasar, karena emosi campuran merupakan kombinasi dari emosi dasar dalam suatu ekspresi wajah. Untuk mengatasi permasalahan subyektifitas dan ambiguitas ekspresi emosi, diperlukan pendekatan fuzzy dalam menganalisis linguistik komponen wajah untuk menentukan jenis emosi. Dalam penelitian ini, diajukan sebuah framework untuk pengenalan emosi berbasis konsep fuzzy emotion yang merupakan representasi pengetahuan pakar psikolog berbasis sistem fuzzy. Tiga tahap dalam framework pengenalan emosi berbasis konsep fuzzy emotion yaitu: ekstraksi fitur wajah dengan Active Appearance Model (AAM) dan analisis geometrik fitur komponen wajah; pemrosesan fitur tingkat tinggi dengan Fuzzy Facial Component Inference System (FFCIS); dan penentuan nilai emosi fuzzy emotion dengan Fuzzy Emotion Inference System (FEIS). Pengujian performa sistem memberikan hasil pengenalan terbaik pada dataset ekspresi wajah extended Cohn Kanade (CK+) dengan akurasi pengenalan linguistik komponen wajah 0.98, dan akurasi pengenalan emosi 0.90. Pengujian pengenalan emosi juga dilakukan menggunakan dataset Indonesian Mixed Emotion Dataset (IMED) yang menghasilkan akurasi pengenalan 0.87. Framework pengenalan emosi berbasis konsep fuzzy emotion berpotensi untuk diterapkan dalam berbagai permasalahan nyata seperti deteksi rasa sakit, deteksi stress, deteksi kebohongan, dan rekonstruksi animasi.
ABSTRACT
Emotion recognition through facial expression analysis is an emerging research in the area of Artificial Intelligence which is still facing many challenges. Emotions are an important component in human life, especially in an interaction and communication. Therefore, an intelligent system that is able to recognize human emotions needs to be developed. The problem is in the variation of facial expressions that displays human emotions. In addition, humans can subjectively express the same emotions in various ways with different facial component movements, even ambiguous between classes of emotions. Psychologist categorized emotion into two classes, basic emotion and mixed emotion. Basic emotion recognition research (anger, disgust, fear, happy, sadness, surprise) has been done a lot, but mixed emotion recognition is an open challenge that has not been widely explored due to the complexity of the problem. The appearance of mixed emotions is different from basic emotions; mixed emotion is a combination of basic emotions in a facial expression. To overcome the problem of subjectivity and ambiguity of emotion expression, a fuzzy approach is developed to analyze the facial components in determining the type of emotion. In this study, we propose a framework for fuzzy emotion recognition which is a representation of the expert psychologist knowledge based on fuzzy systems. Three stages in the fuzzy emotion recognition: facial feature extraction with Active Appearance Model (AAM) and geometric analysis of facial component features; high level feature processing with Fuzzy Facial Component Inference System (FFCIS); and fuzzy emotion recognition with Fuzzy Emotion Inference System (FEIS). System performance testing provided the best results on extended Cohn Kanade (CK+) facial expression dataset, with the accuracy of linguistic facial component recognition 0.98, and accuracy of fuzzy emotion recognition 0.90. Testing was also done using Indonesian Mixed Emotion Dataset (IMED) dataset which resulted in accuracy of 0.87. The fuzzy emotion recognition has a potential to be applied in various real problems such as pain detection, stress detection, lie detection, and animation reconstruction.
2019
D2638
UI - Disertasi Membership  Universitas Indonesia Library
cover
Ida Nurhaida
Abstrak :
Batik adalah kain yang dihias dengan menggunakan teknik dekorasi tekstil yang memanfaatkan malam sebagai perintang warna. Seni batik telah dikembangkan sejak lama di beberapa bagian negara Asia termasuk Indonesia. Pemanfaatan teknologi informasi dalam bentuk metode deteksi motif batik dapat mendukung perkembangan industri kreatif karena sistem ini nantinya dapat dijadikan sebagai acuan bagi perkembangan elemen-elemen desain motif batik. Fokus penelitian ini adalah deteksi motif batik yang memiliki karakteristik kemunculan yang berulang, multi translasi, multi skala, dan multi orientasi. Domain batik dengan pola geometrisnya dipilih sebagai area implementasi terkait dengan karakteristik motif batik yang bersifat simetri, kemunculan obyek yang berulang di beberapa lokasi dalam satu bidang kain, dan sering kali obyek-obyek motif batik tersebut telah mengalami perubahan skala ataupun perubahan orientasi. Kondisi tersebut dapat menyebabkan adanya kesalahan deteksi dan kesalahan klasifikasi. Metode deteksi motif batik yang diusulkan menggunakan fitur SIFT dan serangkaian post processing berupa voting Hough Transform, clustering, smoothing, deteksi peak, penambahan jumlah minimum voting dan penggabungan konfigurasi yang memiliki nilai berdekatan. Pada citra kueri dilakukan ekstraksi fitur menggunakan SIFT. Deskriptor yang dihasilkan dicocokkan dengan deskriptor citra template pada basis data. Pada penelitian ini diusulkan metode pencocokan keypoint yang berbeda dengan metode standar pencocokan SIFT. Seluruh pasangan keypoint diurutkan mulai dari yang memiliki jarak terdekat hingga yang paling jauh. Selanjutnya ditentukan nilai ambang jumlah keypoint sebesar 1%, 5% dan 10%. Pasangan keypoint hasil pencocokan dilakukan voting menggunakan Hough Transform terhadap konsistensi pose geometris obyek citra kueri. Sehubungan dengan permasalahan yang dihadapi dalam deteksi motif batik, proses pencocokan deskriptor citra berupa keypoint yang diperoleh melalui ekstraksi fitur, harus dapat dilakukan dengan baik sehingga kualitas deteksi motif batik menjadi lebih baik. Pada penelitian ini dikembangkan pula beberapa metode deteksi obyek yang berfungsi sebagai pengambil keputusan terhadap keberadaan obyek tertentu pada citra kueri. Metode deteksi obyek ini bekerja dengan cara mengambil hingga maksimum 80% dari nilai peak tertinggi yang terbentuk pada ruang Hough (MDOTresh), penggunaan nilai ambang berdasarkan rumusan rata-rata nilai peak yang terendah dan peak yang tertinggi (MDOAverage), penentuan nilai k berdasarkan nilai-nilai peak tertinggi sesuai dengan jumlah obyek yang terdapat pada groundtruth (MDOTopk), mengambil konfigurasi pada peak yang memiliki minimum nilai sebesar 3 voting pada setiap konfigurasi luaran ruang Hough (MDOMin), penentuan representasi obyek berdasarkan keluaran clustering DBSCAN (MDOScan), dan melakukan proses smoothing menggunakan filter Gaussian pada hasil deteksi dengan jumlah minimum voting sebanyak 3 buah (MDOGauss). Kehandalan metode dalam melakukan deteksi diindikasikan dengan ketepatan dalam menentukan jumlah obyek yang terdapat pada citra kueri dan mampu mengenali motif batik walaupun telah mengalami transformasi geometris melalui perpindahan posisi, perbedaan skala, dan perubahan orientasi. Berdasarkan hasil yang telah diperoleh, metode deteksi motif batik untuk data citra kueri dengan obyek tunggal, kombinasi translasi, skala, dan orientasi mencapai nilai kinerja maksimum 95.28% menggunakan MDOTresh, sedangkan pada citra kueri dengan obyek tunggal dan variasi noise mencapai 100% melalui MDOTresh, MDOAverage, dan MDOTopk. Hal ini menunjukkan bahwa metode deteksi motif batik mampu menangani obyek tunggal dengan berbagai kondisi. Pada deteksi motif batik dengan multi obyek, multi translasi, multi skala dan multi orientasi capaian maksimum kinerja metode usulan adalah 92.13%, sedangkan untuk citra kueri dengan multi obyek, multi translasi, multi skala, multi orientasi, dan variasi noise diperoleh capaian kinerja 89.89%. Keduanya diperoleh melalui pendekatan MDOGauss. Pada kondisi ini, penambahan jumlah obyek motif pada citra kueri menyebabkan bertambahnya jumlah obyek yang tidak berhasil dideteksi. Kasus selanjutnya adalah deteksi obyek motif batik dengan multi motif, multi obyek, multi skala, dan multi orientasi dengan luaran ruang Hough berupa jumlah voting absolut mencapai 96.09% untuk MDOTresh. Transformasi geometris pada obyek motif batik berakibat penurunan kontras citra sehingga berpengaruh pada jumlah voting yang dihasilkan. Untuk komposisi motif teratur dengan jumlah maksimum 16 obyek motif batik untuk motif sejenis mendapatkan hasil 100% melalui MDOAverage, sedangkan untuk multi motif 92.59% melalui pendekatan MDOTresh dan MDOAverage. ......Batik is a fabric printed design of hand-printing textiles by coating with wax. Batik has been developed since a long time in various countries including Indonesia. Nowadays, information technology is being utilized in recognizing batik motif. Therefore, the development of batik motif detection system is expected to support creative industries since the system can be used as a reference for the development pattern design. This study proposes an object recognition system for batik motif based on clustering Scale Invariant Features Transform (SIFT) features in Hough space. Our principal objective is to verify how many instances of the same object to our method detects accurately, when the object motif is posed in different positions, orientations, and scales. The geometric patterns domain is being selected regarding the characteristics of batik motifs. Batik motifs have symmetrical property and repeated in multiple locations. In addition, the objects of batik motif may be changed in terms of scale and orientation. The proposed method in this research consists of the feature extraction process using SIFT and post processing, namely voting Hough Transform, clustering, smoothing and peak detection. The keypoints from query image and the keypoints from template are matched with comparing the Euclidean distance of each keypoints descriptor in query image to all keypoint descriptors in template image. In this study we proposed a new matching keypoints method. All matched keypoints will be sorted from the closets distance to the farthest distance. Then, we determine the number of matched keypoint that will be used in the next process through the threshold 1%, 5%, and 10%. The similarity of primitive pattern and the occurrences of a motif in different location, scale and orientation will interfere the detection process. Consequently, the SIFT local feature representation must be performed well in terms of feature detection and matching. In this study, several object detection methods are proposed as well based on object’s representation resulted from the voting process in Hough space. Object detection method using thresholding (MDOTresh) is taking 80% of maximum peak value, while object detection method with average threshold (MDOAverage) picks the mean value of minimum and maximum peak in the Hough space. Object detection method Top k (MDOTopk) determines k number of objects from the highest peaks found in the Hough space based on the number of objects in ground truth. Object detection method based on Minimum Voting (MDOMin) considers the voting configurations which have a certain number of votes. In this study the minimum number of votes is tuned to 3 as a valid configuration. Object detection method based on DBSCAN (MDOScan) determines the representation of the object from output clustering. Object detection method using Minimum Voting + Gaussian (MDOGauss) implements smoothing process using Gaussian filter for the output configurations which have a minimum number of votes as 3. The reliability of batik motif recognition system is indicated by the ability of the system to find the number of object motif contained in query image and to classify the object motif into one of several batik motif classes even though the objects motif have undergone a geometric transformation. The evaluation of the proposed method is employing several data sets. Based on the evaluation result using query images with a single object, combination of translation, scale and orientation, object detection system MDOTresh gained balanced score 95.28%, while for the query image with a single object and scale variation of noise reached 100% through MDOTresh, and MDOAverage. It is apparent that the recognition system is capable of dealing with a single object with a various conditions. In recognition process for query image with multiple occurrences object, multi translation, multi scale and multi orientation, the highest performance is 92.13%, whereas for the image query with multi object, multi translation, multi-scale, multi- orientation, and variations in noise yielded 89.89%. Both are obtained through MDOGauss approach. In this case, increasing the number of object motif in the query image, a greater number of incorrect detections are obtained. The next case is the object motif recognition from query images with multi motif, multi object, multi scale and multi orientation. This data set has 2 outputs from Hough space namely absolute voting number and normalized voting number. The absolute voting number outputs achieved the best performance at 96.09% for the MDOTresh, while the normalized voting number gained 36.92% for MDOGauss. Geometric transformations on the object motif will be decreased contrast of object in the query image so that affected the number of voting resulted. The last data set is a regular texture, composition of the object motif with a maximum numbers are 16 objects. The best performance is 100% for homogeneous motif achieved from MDOAverage, while for multi motif yielded 92.59% achieves from MDOTresh and MDOAverage as the best.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2016
D-pdf
UI - Disertasi Membership  Universitas Indonesia Library
<<   1 2   >>