OCENA WYDAJNOŚCI WYKRYWANIA MASKI NA TWARZY NA PODSTAWIE WIELU MODYFIKACJI ARCHITEKTURY YOLOV8
Muna AL-Shamdeen
muna.jaffer@uomosul.edu.iqUniversity of Mosul, College of Computer Science and Mathematics (Irak)
https://orcid.org/0000-0002-2806-532X
Fawziya Mahmood Ramo
University of Mosul, College of Computer Science and Mathematics (Irak)
Abstrakt
Praca ta ma na celu opracowanie solidnego systemu zdolnego do wykrywania w czasie rzeczywistym, dokładnie rozróżniającego osoby, które przestrzegają lub zaniedbują wymogi dotyczące noszenia masek na twarzy, w różnych scenariuszach obejmujących obrazy, filmy i streaming z kamer na żywo. Niniejsze badanie ulepszyło architekturę YOLOv8n do wykrywania masek na twarzy poprzez zbudowanie nowej, dwumodyfikacyjnej wersji modelu YOLOv8n w celu poprawy ekstrakcji cech i sieci predykcyjnej dla YOLOv8n. W proponowanej wersji YOLOv8n-v1, integracja szkieletu sieci rezydualnej z architekturą YOLOv8n poprzez zastąpienie pierwszych dwóch warstw YOLOv8n modułami ResNet_Stem i ResNet_Block w celu poprawy zdolności modelu do ekstrakcji cech i zastąpienia modułu Spatial Pyramid Pooling Fast (SPPF) modułami Spatial Pyramid Pooling-Cross Stage Partial (SPPCSP), które łączą SPP i CSP w celu stworzenia sieci, która jest zarówno skuteczna, jak i wydajna. Proponowany YOLOv8n-v2 został zbudowany poprzez integrację modułów Ghostconv i ResNet_Downsampling z proponowanym szkieletem YOLOv8n-v1. Wszystkie modele zostały przetestowane i ocenione na dwóch zestawach danych. Pierwszym z nich jest zbiór danych MJFR, który zawiera 23 621 obrazów i został zebrany przez autorów niniejszego artykułu z czterech różnych zbiorów danych, z których wszystkie zostały wykorzystane do wykrywania masek na twarzy. Drugi to zbiór danych wykrywania obiektów MSFM, który został zebrany z grup filmów wideo w prawdziwym życiu i obrazów opartych na technologii uczenia się programu nauczania. Wydajność modelu została oceniona za pomocą następujących wskaźników: mean average precision (mAP50), mAP50-95, recall (R) and precision (P). Stwierdzono, że obie wersje proponowanego YOLOv8n przewyższają oryginalny model pod względem dokładności dla obu zestawów danych. Wreszcie, system został z powodzeniem wdrożony w jednej z klinik medycznych powiązanych z kompleksem medycznym, gdzie wyniki jego zastosowania wykazały wysoką wydajność w różnych aspektach pracy i skutecznie przyczyniły się do poprawy zdrowia i bezpieczeństwa publicznego.
Słowa kluczowe:
YOLOv8, detekcja obiektów, algorytm detekcji, sieć rezydualnaBibliografia
Ahuja A. S. et al.: Artificial intelligence in ophthalmology: A multidisciplinary approach. Integrative Medicine Research 11(4), 2022, 100888.
Google Scholar
Al-Shamdeen M. J., Younis A. N., Younis H. A.: Metaheuristic algorithm for capital letters images recognition. Computer Science 16(2), 2020, 577–588.
Google Scholar
Bhujel S., Shakya S.: Rice Leaf Diseases Classification Using Discriminative Fine Tuning and CLR on EfficientNet. Journal of Soft Computing Paradigm 4(3), 2022, 172–187.
Google Scholar
Chabi Adjobo E. et al.: Automatic Localization of Five Relevant Dermoscopic Structures Based on YOLOv8 for Diagnosis Improvement. Journal of Imaging 9(7), 2023, 148.
Google Scholar
Deng J. et al.: Retinaface: Single-stage dense face localisation in the wild. arXiv preprint arXiv: 1905.00641, 2019.
Google Scholar
Diwan T., Anirudh G., Tembhurne J. V.: Object detection using YOLO: Challenges, architectural successors, datasets and applications. multimedia Tools and Applications 82(6), 2023, 9243–9275.
Google Scholar
Elharrouss O. et al.: Backbones-review: Feature extraction networks for deep learning and deep reinforcement learning approaches. arXiv preprint arXiv: 2206.08016, 2022.
Google Scholar
Gunawan T.S. et al.: Development of video-based emotion recognition using deep learning with Google Colab. TELKOMNIKA (Telecommunication Computing Electronics and Control) 18(5), 2020, 2463–2471.
Google Scholar
Ju R. Y., Cai W.: Fracture Detection in Pediatric Wrist Trauma X-ray Images Using YOLOv8 Algorithm. arXiv preprint arXiv: 2304.05071, 2023.
Google Scholar
Kelleher J. D.: Deep learning. MIT Press, 2019.
Google Scholar
Kumar A., Kalia A., Kalia A.: ETL-YOLO v4: A face mask detection algorithm in era of COVID-19 pandemic. Optik, 259, 2022, 169051.
Google Scholar
Loey M. et al.: A hybrid deep transfer learning model with machine learning methods for face mask detection in the era of the COVID-19 pandemic. Measurement 167, 2021, 108288.
Google Scholar
Lou H. et al.: DC-YOLOv8: Small-Size Object Detection Algorithm Based on Camera Sensor. Electronics 12(10), 2023, 2323.
Google Scholar
Mbunge E. et al.: Application of deep learning and machine learning models to detect COVID-19 face masks-A review. Sustainable Operations and Computers 2, 2021, 235–245.
Google Scholar
Mohammed Ali F. A., Al-Tamimi M. S.: Face mask detection methods and techniques: A review. International Journal of Nonlinear Analysis and Applications 13(1), 2022, 3811–3823.
Google Scholar
Nowrin A. et al.: Comprehensive review on facemask detection techniques in the context of covid-19. IEEE access 9, 2021, 106839–106864.
Google Scholar
Padilla R., Netto S. L., Da Silva E. A.: A survey on performance metrics for object-detection algorithms. in 2020 international conference on systems, signals and image processing (IWSSIP), IEEE, 2020.
Google Scholar
Phan Q. B., Nguyen T.: A Novel Approach for PV Cell Fault Detection using YOLOv8 and Particle Swarm Optimization, 2023.
Google Scholar
Rajeshwari P. et al.: Object detection: an overview. Int. J. Trend Sci. Res. Dev. (IJTSRD) 3(1), 2019, 1663–1665.
Google Scholar
Reis D. et al.: Real-Time Flying Object Detection with YOLOv8. arXiv preprint arXiv: 2305.09972, 2023.
Google Scholar
Solawetz J.: What is YOLOv8? The Ultimate Guide, 2023, [https://blog.roboflow.com/whats-new-in-yolov8/] (available: 1.01.2024).
Google Scholar
Talaat F. M., ZainEldin H.: An improved fire detection approach based on YOLO-v8 for smart cities. Neural Computing and Applications, 2023, 1–16.
Google Scholar
Terven J., Cordova-Esparza D.: A comprehensive review of YOLO: From YOLOv1 and beyond. arXiv 2023. arXiv preprint arXiv: 2304.00501.
Google Scholar
Tian Y. et al.: Role of masks in mitigating viral spread on networks. Physical Review E 108(1), 2023, 014306
Google Scholar
Vibhuti et al.: Face mask detection in COVID-19: a strategic review. Multimedia Tools and Applications 81(28), 2022, 40013–40042.
Google Scholar
Vrigkas M. et al.: Facemask: A new image dataset for the automated identification of people wearing masks in the wild. Sensors 22(3), 2022, 896.
Google Scholar
Wani M. A. et al.: Advances in deep learning. Springer, 2020.
Google Scholar
Wu W. et al.: Application of local fully Convolutional Neural Network combined with YOLO v5 algorithm in small target detection of remote sensing image. PloS one 16(10), 2021, e0259283.
Google Scholar
Yunus E.: YOLO V7 and Computer Vision-Based Mask-Wearing Warning System for Congested Public Areas. Journal of the Institute of Science and Technology 13(1), 2023, 22–32.
Google Scholar
Autorzy
Muna AL-Shamdeenmuna.jaffer@uomosul.edu.iq
University of Mosul, College of Computer Science and Mathematics Irak
https://orcid.org/0000-0002-2806-532X
Autorzy
Fawziya Mahmood RamoUniversity of Mosul, College of Computer Science and Mathematics Irak
Statystyki
Abstract views: 167PDF downloads: 99