Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 8 dokumen yang sesuai dengan query
cover
Aidan Azkafaro Deson
Abstrak :
Di dalam olahraga tenis, pemahaman yang mendalam tentang gerakan lawan sangat penting untuk merespons pukulan dengan efektif. Salah satu tantangan utama yang dihadapi pemain adalah mengantisipasi arah pukulan lawan dengan cepat dan akurat. Faktor utama yang memengaruhi arah pukulan bola tenis adalah sudut kontak bola dengan raket saat memukulnya. Namun, dalam kecepatan permainan yang tinggi, observasi terhadap faktor ini sulit dilakukan. Faktor lain yang dapat memengaruhi arah pukulan adalah pose pemain saat memukul bola. Penelitian ini bertujuan untuk mengevaluasi penerapan machine learning dalam mengatasi masalah ini, dengan menggunakan informasi sekuensial mengenai pergerakan pose pemain sesaat sebelum memukul bola dan meneruskannya ke jaringan neural network untuk klasifikasi arah pukulannya menjadi tiga jenis kelas, yaitu Cross Left, Cross Right, dan Straight. Dataset yang digunakan untuk penelitian ini diambil dari beberapa video pertandingan tenis profesional dari platform YouTube dengan total durasi permainan efektif 43 menit. Untuk mendapatkan informasi mengenai koordinat pose pemain, digunakan YOLOv8-Pose, sementara TrackNet digunakan untuk mendeteksi koordinat bola dan lapangan. Arah pukulan bola ditentukan dari informasi koordinat bola sebelum dan setelah pemain melakukan pukulan. Informasi pose pemain sebanyak 20 frame sebelum pemain memukul bola disimpan dalam suatu array tiga dimensi dan digunakan sebagai input untuk jaringan neural network. Penelitian ini menguji dua jenis neural network, yaitu RNN dan LSTM, dan dilakukan tuning hingga diperoleh performa terbaik pada kedua model tersebut. Model RNN mencapai akurasi sebesar 74%, sedangkan model LSTM mencapai akurasi sebesar 79%. Untuk meningkatkan performa model, diterapkan class weighting agar model memberikan perhatian yang lebih adil terhadap setiap kelas. Hasilnya, akurasi model RNN meningkat menjadi 80% dan akurasi model LSTM meningkat menjadi 82%. ......In the sport of tennis, a deep understanding of the opponent's movements is crucial for effectively responding to their shots. One of the main challenges players face is anticipating the direction of their opponent's shots quickly and accurately. The primary factor influencing the direction of a tennis ball's shot is the angle at which the ball contacts the racket. However, observing this factor is difficult in the high-speed context of the game. Another factor that can influence the shot's direction is the player's pose at the moment of impact. This study aims to evaluate the application of machine learning in addressing this issue by using sequential information about the player's pose movements just before hitting the ball and feeding it into a neural network for shot direction classification into three categories: Cross Left, Cross Right, and Straight. The dataset used for this study was obtained from several professional tennis match videos on YouTube, with a total effective gameplay duration of 43 minutes. To obtain information about the player's pose coordinates, YOLOv8-Pose was used, while TrackNet was used to detect the coordinates of the ball and the court. The shot direction was determined from the ball's coordinates before and after the player made contact. The player's pose information, consisting of 20 frames before hitting the ball, was stored in a three-dimensional array and used as input for the neural network. This study tested two types of neural networks, RNN and LSTM, and tuning was performed to obtain the best-performing models for both. The RNN model achieved an accuracy of 74%, while the LSTM model achieved an accuracy of 79%. To improve model performance, class weighting was applied to ensure the model gave fair attention to each class. As a result, the accuracy of the RNN model increased to 80%, and the accuracy of the LSTM model increased to 82%.
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Winter, Léon de, 1954-
Amsterdam: 1995, In Deknipscheer
BLD 839.313 6 WIN l
Buku Teks  Universitas Indonesia Library
cover
Irvan JP Elliika
Abstrak :
Secara umum, mobile robot merupakan salah satu tipe platform robot yang memiliki tugas yang kompleks karena robot tersebut akan berada pada lingkungan yang juga bersifat kompleks. Secara khusus, mobile robot harus bisa melakukan lokalisasi agar bisa melakukan tugas-tugas pokok selanjutnya. Oleh karenanya diperlukan sistem lokalisasi yang bisa menyelesaikan permasalahan tersebut. Sistem vision merupakan salah satu jawaban yang paling mungkin untuk menyelesaikan masalah pada platform mobile robot. Beranjak dari hasil penelitian sebelumnya mengenai lokalisasi pada map topologi, maka pada penelitian ini akan dikembangkan sistem lokalisasi berbasis map metric dimana nantinya akan didapatkan pose xr,yr,?r dari mobile robot. Untuk menyelesaikan sistem lokalisasi ini akan digunakan metode pose estimation oleh stereovision untuk mendapatkan pose dalam bentuk translasi x,y,z dan rotasi ?, ?, ? yang akan dimaksimalkan dengan penggunaan FAST sebagai algoritma fitur detection dengan kecepatan tinggi. Akhirnya dengan proses integrasi dengan penelitian sebelumnya akan didapatkan global position yang berguna untuk lokalisasi mobile robot. ......Generally, mobile robot is one of robot that has a complex task because the robot will also work in the complex environment. Particularly, service robot should be able to do localization in order to continue its task. Therefore it will need a localization system that could solve the problem. Vision system is one of the most likely answer to solve the problem in mobile robot platform. Based from the results of previous work on the localization of the topological map, this work will developed localization system for building metrics map which will obtain pose in term of xr, yr, ?r of the mobile robot. In order to complete this localization system, pose estimation method base stereovision will be used to get translational pose x, y, z and rotation pose ?, ?, ? which will be maximized by the use of FAST as the high speed feature detection algorithms. Finally the integration process with prior work will obtain global position that is useful for mobile robot localization.
Depok: Fakultas Teknik Universitas Indonesia, 2013
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Yuni Arti
Abstrak :
Sistem pengenalan wajah dapat memberikan hasil yang tepat pada kondisi wajah normal, tetapi dalam lingkungan yang tidak dibatasi menyebabkan hasil pengenalan wajah menjadi tidak akurat, baik pada verifikasi maupun identifikasi. Salah satu masalah yang sering ditemui dalam sistem pengenalan wajah dan terkait dengan sifat intra-class variance pada wajah adalah pose. Penelitian ini bertujuan untuk melakukan pengenalan wajah berdasarkan pose invariant dengan mengimplementasikan Spatial Transformer Netwok (STN) pada arsitektur jaringan ringan MobileFaceNet. STN digunakan sebagai metode penyelarasan wajah untuk menangani variasi pose pada citra input. Berdasarkan evaluasi model, model Single-STN MobileFaceNet memberikan akurasi, AUC dan EER berturut-turut 73.64%, 82.18%, dan 0.2636. Kenaikannya sebesar 1.21% untuk akurasi, 1.56% untuk AUC dan untuk EER turun sebesar 0.0121 dari model Baseline. Penambahan STN pada jaringan ringan MobileFaceNet mempengaruhi hasil verifikasi wajah, tetapi kurang signifikan. Akan tetapi, berdasarkan hasil uji signifikansi McNemar, tidak ada perbedaan yang signifikan dengan adanya metode penyelarasan wajah STN pada model Single-STN MobileFaceNet. Terdapat beberapa kasus pose yang tidak dapat ditangani dengan baik oleh model, seperti pose menengadah atau menengok ke kanan/kiri. Berdasarkan evaluasi robustness model, nilai akurasi, AUC dan EER yang dihasilkan model Single-STN MobileFaceNet berturut-turut 96.86%, 98.51%, 0.0314. Model Single-STN MobileFaceNet termasuk model yang memiliki kinerja baik dalam pengenalan wajah, model mampu membedakan pasangan citra match dan non-match dengan baik pada dataset CFP ......The face recognition system can give precise results in normal facial conditions, but in an unconstrained environment it can result inaccurate face recognition, both in verification and identification. One of the problems that are often encountered in face recognition system and related to intra-class variance on the face is pose. This study aims to perform face recognition based on pose invariant by implementing Spatial Transformer Netwok (STN) on MobileFaceNet lightweight network architecture. STN is used as a face alignment method to handle pose variations in the input image. Based on the evaluation of the model, the Single-STN MobileFaceNet model provides accuracy, AUC and EER of 73.64%, 82.18%, and 0.2636, respectively. The increase is 1.21% for accuracy, 1.56% for AUC and for EER it is down by 0.0121 from the Baseline model. The addition of STN to the MobileFaceNet lightweight network affects the face verification results, but is less significant. However, based on the results of the McNemar significance test, there is no significant difference with the STN face alignment method in the Single-STN MobileFaceNet model. There are some cases of poses that cannot be handled well by the model, such as looking up or looking to the right/left. Based on the evaluation of the robustness of the model, the values ​​of accuracy, AUC and EER generated by the Single-STN MobileFaceNet model are 96.86%, 98.51%, 0.0314, respectively. The Single-STN MobileFaceNet model includes a model that has good performance in face recognition. This model is able to distinguish match and non-match image well on the CFP dataset.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Randy Pangestu Kuswana
Abstrak :
ABSTRAK
Pose estimasi wajah atau head pose estimator merupakan salah satu dari parameter yang penting dalam proses identifikasi wajah dalam bentuk citra muka tiga dimensi. Dikarenakan performanya yang sangat baik, deep learning menggunakan jaringan saraf konvolusi sering digunakan sebagai estimator dari pose wajah. Namun dibalik performanya yang kuat, jaringan saraf konvolusi masih rentan terhadap derau sehingga menyebabkan performa akan turun secara signifikan. Selain itu, performa dari CNN juga tergantung pada kombinasi dari hyper-parameter yang dipilih. Pengembangan CNN yang pesat membuat dikembangkannya beberapa arsitektur dengan setiap arsitektur memiliki performanya tersendiri. Dalam penelitian ini akan dibuat dua jenis estimator pose kepala yang pertama menggunakan arsitektur modifikasi dari LeNet-5 dan yang kedua menggunakan arsitektur modifikasi dari AlexNet. Pada arsitektur LeNet-5 akan dilakukan percobaan terhadap berbagai hyper-parameter tipe pooling dan fungsi aktivasi, untuk mengetahui pengaruhnya terhadap derau gaussian, salt-pepper, dan speckle. Selain itu dua jenis estimator yang dibuat akan dibandingkan juga hasilnya untuk mengetahui performa dari Arsitektur AlexNet Modified yang dibuat terhadap citra dengan noise. Dari hasil percobaan didapatkan nilai performa AlexNet yang memiliki akurasi lebih bagus dibandingkan dengan LeNet-5, baik pada data dengan derau atau pada data tanpa derau.
ABSTRACT
Head pose estimation is one of the important parameter for determination of known face from its three dimensional face images. Due to its superiority, Convolutional Neural Network CNN has been used as a head pose estimator, and has been under a rapid growth in the recent years, with the growth resulting in many architecture were developed to solve a particular task. However, most of the CNN rsquo s performance were significantly dropped when the input face images was exposed to noises. In this research, we will develope two sistem with each of them using a different Architecture, LeNet 5 and AlexNet. Moreover, by using an LeNet 5 system that we built, we test the effect on hyper parameter choices of pooling layer and activation function. It is due, to understand the their effect on a gaussian noise, salt pepper, and speckle noise. After testing the hyper parameter effect on degraded image, we compare the performance of modified LeNet 5 and modified AlexNet. Result of the experiments shows that the modified AlexNet has a better performance on dealing with either normal or degraded images.
2018
T51433
UI - Tesis Membership  Universitas Indonesia Library
cover
Dody Rakhmat Ramadhan
Abstrak :
Degan perkembangan dunia informasi dan teknologi yang sangat pesat mendorong manusia untuk menciptakan sistem simulasi. Sistem simulasi ini bisa digunakan untuk mensimulasikan dunia manufacturing. Untuk membuat simulasi ini menjadi terasa natural maka digunakanlah hand tracking dan hand recognition sebagai media inputnya. Skripsi ini membahas implementasi algoritma SURF, CAMSHIFT dan Convex Hull untuk melakukan Hand Tracking dan Hand Recognition. Input yang diberikan berupa koordinat telapak tangan kemudian sistem akan melakukan tracking dengan membuat boundaries segi empat. Kemudian dilakukan pemisahaan antara citra tangan dan background pada boundaries tersebut. Setelah itu dilakukan perhitunngan pengolahan citra untuk menentukan pose dari tangan tersebut. Hasil akir dari penelitian ini adalah sistem yang akan melakukan tracking dan recognition kemudian mengirimkan hasilnya ketahap berikutnya untuk dilakukan simulasi. ......Development of information and technology very rapidly encourage people to create a simulation system. This simulation system can be used to simulate the manufacturing field. To make this simulation become more naturaly it is used hand tracking and hand recognition as input device. This thesis discusses the implementation of SURF, CAMSHIFT and Convex Hull algorithms for Hand Tracking and Hand Recognition. Input given in the form of palm coordinates then the system will do the tracking by creating boundaries rectangle. Then separated between the hand image and the background on the boundaries. After that done calculate image processing to determine the pose of the hand. The result of this research is a system that will perform tracking and recognition and then send the result next stage to be simulated.
Depok: Fakultas Teknik Universitas Indonesia, 2018
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Adi Nugroho
Abstrak :
Pengolahan citra telah mengalami banyak perkembangan dan semakin umum diaplikasikan. Salah satu pengaplikasiannya rekognisi wajah tiga dimensi, yang juga melibatkan estimasi pose wajah. Salah satu metode rekognisi citra, yaitu jaringan saraf konvolusi, berpotensi menjadi dasar dari sistem estimasi pose wajah. Operasi konvolusi diharapkan mampu meminimalisir pengaruh distorsi dan disorientasi objek, serta mampu mengefisiensikan parameter yang dibutuhkan. Namun, permasalahan noise atau derau belum secara eksplisit terselesaikan oleh jaringan saraf tiruan konvolusi. Penelitian ini bertujuan memasukkan fitur sistem fuzzy yang efektif mengelola data samar ke dalam jaringan saraf tiruan konvolusi yang diaplikasikan untuk estimasi pose wajah. Perancangan dimulai dari menjabarkan fungsi masing-masing lapisan jaringan saraf tiruan, menjabarkan operasi-operasi aritmatika pada bilangan fuzzy, dan mencoba menggantikan neuron crisp pada jaringan saraf tiruan konvolusi umum menjadi neuron fuzzy, dan mengaplikasikannya untuk mengestimasi pose wajah. Sistem yang sudah dibangun kemudian diujicoba pada dataset yang dimiliki Departemen Teknik Elektro UI dan dibandingkan dengan CNN-crisp yang memiliki arsitektur serupa dengan parameter pembelajaran yang sama. Hasil didapat menunjukkan sistem konvolusi fuzzy mencapai nilai kesalahan estimasi pose lebih rendah dari konvolusi crisp pada data berderau tanpa merubah hasil estimasi pada data tidak berderau. ...... Image processing has undergone many developments and is increasingly commonly applied. From limited two-dimensional recogniton, facial recognition has now being developed to be able to recognise three-dimensional features. This ability involves process of face pose estimation. One method of image recognition, the convolution neural network, has the potential to become the basis of the face pose estimation system. Convolution operation is expected to minimize the effect of distortion and disorientation of the object, and able to efficiently reduce the required parameters. However, the image noise problem has not been explicitly resolved by convolution neural networks. This study aims to include features of a fuzzy system that effectively manages fuzzy data into convolutional neural networks applied to head pose estimation. The design begins with describing the function of each layer of artificial neural networks, describing arithmetic operations on fuzzy numbers, and attempting to replace crisp neurons in convolution layer of convolutional neural into fuzzy neurons, and applying them to estimate head poses. The estimator system is then tested on a dataset owned by the Department of Electrical Engineering UI and compared with CNN-crisp that has a similar architecture with the same learning parameters. The results show that the fuzzy convolution system reaches less error of pose estimation value compared to the crisp convolution system, without changing the estimation value of image without noises.
Depok: Fakultas Teknik Universitas Indonesia, 2017
T49040
UI - Tesis Membership  Universitas Indonesia Library
cover
Rama Widragama Putra
Abstrak :
Para penyandang tunarungu berkomunikasi menggunakan bahasa isyarat resmi di Indonesia, yaitu SIBI (Sistem Isyarat Bahasa Indonesia). Dengan menggunakan aplikasi penerjemah Bahasa isyarat ke teks akan membantu komunikasi antara tunarungu maupun non-tunarungu. Dengan menggunakan pre-trained model CPM (EdvardHua, 2018) akan mendapatkan informasi berupa titik-titik skeleton seperti titik tangan, bahu, dan siku. Informasi titik skeleton itu akan digunakan untuk memprediksi kata. Namun, proses tersebut perlu berjalan secara real-time, yaitu ketika pengguna membuka kamera maka akan langsung mendapatkan respon. Untuk mencapai itu diperlukan mobile deep learning framework, sehingga proses inference bisa menjadi lebih cepat dengan bantuan runtime GPU. Penelitian ini berfokus menjalankan inference menggunakan mobile deep learning framework untuk implementasi modul ekstraksi skeleton secara real-time pada Android. Pada penelitian ini digunakan Tensorflow mobile (runtime hanya CPU), MACE, dan SNPE. Dilakukan pengukuran dari sisi latency, penggunaan energi, penggunaan memori, penggunaan daya, dan perubahan suhu. Hasil pengukuran menunjukkan bahwa penggunaan MACE dan SNPE dengan runtime GPU menghasilkan latency yang lebih kecil dibandingkan penggunaan CPU. Penggunaan CPU menyebabkan thermal throttling, sehingga terjadi penurunan kinerja. Dengan runtime GPU menghasilkan penggunaan energi, memori, dan daya yang lebih sedikit dibandingkan CPU. Kenaikan suhu ketika menggunakan runtime GPU lebih kecil dibandingkan CPU. ......People with hearing impairments use the official sign language in Indonesia, namely SIBI (Sistem Isyarat Bahasa Indonesia). Using a sign language-to-text translator application will help the communication between people with hearing impairments and people without hearing impairment. By using the pre-trained CPM model (EdvardHua, 2018), the information in the form of skeleton points such as the points of the hands, shoulders, and elbows will be obtained. The skeleton point information will be used to predict its translation words. However, the translation process needs to be run in real- time, which is when users open their cameras then they will immediately receive a respond. To achieve that goal, we need a mobile deep learning framework, with the result that the inference process is faster with the help of the GPU runtime. This research focuses on running inferences using a mobile deep learning framework to implement real-time skeleton extraction module in Android. This research uses Tensorflow mobile (runtime only for CPU), MACE, and SNPE. Measurements of the latency, energy usage, memory usage, power usage, and temperature change were taken. The measurement results show that the use of MACE and SNPE with GPU runtime is in lower latency than with the use of CPU. Measurement with CPU usage causes thermal throttling, resulting in decreased performance. Measurement with GPU runtime results in lower usage of energy, memory and power compared to the measurement with CPU. The temperature increase when using the GPU runtime is lower than when using the CPU.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library