OCENA WYDAJNOŚCI WYKRYWANIA MASKI NA TWARZY NA PODSTAWIE WIELU MODYFIKACJI ARCHITEKTURY YOLOV8

Muna AL-Shamdeen

muna.jaffer@uomosul.edu.iq
University of Mosul, College of Computer Science and Mathematics (Irak)
https://orcid.org/0000-0002-2806-532X

Fawziya Mahmood Ramo


University of Mosul, College of Computer Science and Mathematics (Irak)

Abstrakt

Praca ta ma na celu opracowanie solidnego systemu zdolnego do wykrywania w czasie rzeczywistym, dokładnie rozróżniającego osoby, które przestrzegają lub zaniedbują wymogi dotyczące noszenia masek na twarzy, w różnych scenariuszach obejmujących obrazy, filmy i streaming z kamer na żywo. Niniejsze badanie ulepszyło architekturę YOLOv8n do wykrywania masek na twarzy poprzez zbudowanie nowej, dwumodyfikacyjnej wersji modelu YOLOv8n w celu poprawy ekstrakcji cech i sieci predykcyjnej dla YOLOv8n. W proponowanej wersji YOLOv8n-v1, integracja szkieletu sieci rezydualnej z architekturą YOLOv8n poprzez zastąpienie pierwszych dwóch warstw YOLOv8n modułami ResNet_Stem i ResNet_Block w celu poprawy zdolności modelu do ekstrakcji cech i zastąpienia modułu Spatial Pyramid Pooling Fast (SPPF) modułami Spatial Pyramid Pooling-Cross Stage Partial (SPPCSP), które łączą SPP i CSP w celu stworzenia sieci, która jest zarówno skuteczna, jak i wydajna. Proponowany YOLOv8n-v2 został zbudowany poprzez integrację modułów Ghostconv i ResNet_Downsampling z proponowanym szkieletem YOLOv8n-v1. Wszystkie modele zostały przetestowane i ocenione na dwóch zestawach danych. Pierwszym z nich jest zbiór danych MJFR, który zawiera 23 621 obrazów i został zebrany przez autorów niniejszego artykułu z czterech różnych zbiorów danych, z których wszystkie zostały wykorzystane do wykrywania masek na twarzy. Drugi to zbiór danych wykrywania obiektów MSFM, który został zebrany z grup filmów wideo w prawdziwym życiu i obrazów opartych na technologii uczenia się programu nauczania. Wydajność modelu została oceniona za pomocą następujących wskaźników: mean average precision (mAP50), mAP50-95, recall (R) and precision (P). Stwierdzono, że obie wersje proponowanego YOLOv8n przewyższają oryginalny model pod względem dokładności dla obu zestawów danych. Wreszcie, system został z powodzeniem wdrożony w jednej z klinik medycznych powiązanych z kompleksem medycznym, gdzie wyniki jego zastosowania wykazały wysoką wydajność w różnych aspektach pracy i skutecznie przyczyniły się do poprawy zdrowia i bezpieczeństwa publicznego.


Słowa kluczowe:

YOLOv8, detekcja obiektów, algorytm detekcji, sieć rezydualna

Ahuja A. S. et al.: Artificial intelligence in ophthalmology: A multidisciplinary approach. Integrative Medicine Research 11(4), 2022, 100888.
  Google Scholar

Al-Shamdeen M. J., Younis A. N., Younis H. A.: Metaheuristic algorithm for capital letters images recognition. Computer Science 16(2), 2020, 577–588.
  Google Scholar

Bhujel S., Shakya S.: Rice Leaf Diseases Classification Using Discriminative Fine Tuning and CLR on EfficientNet. Journal of Soft Computing Paradigm 4(3), 2022, 172–187.
  Google Scholar

Chabi Adjobo E. et al.: Automatic Localization of Five Relevant Dermoscopic Structures Based on YOLOv8 for Diagnosis Improvement. Journal of Imaging 9(7), 2023, 148.
  Google Scholar

Deng J. et al.: Retinaface: Single-stage dense face localisation in the wild. arXiv preprint arXiv: 1905.00641, 2019.
  Google Scholar

Diwan T., Anirudh G., Tembhurne J. V.: Object detection using YOLO: Challenges, architectural successors, datasets and applications. multimedia Tools and Applications 82(6), 2023, 9243–9275.
  Google Scholar

Elharrouss O. et al.: Backbones-review: Feature extraction networks for deep learning and deep reinforcement learning approaches. arXiv preprint arXiv: 2206.08016, 2022.
  Google Scholar

Gunawan T.S. et al.: Development of video-based emotion recognition using deep learning with Google Colab. TELKOMNIKA (Telecommunication Computing Electronics and Control) 18(5), 2020, 2463–2471.
  Google Scholar

Ju R. Y., Cai W.: Fracture Detection in Pediatric Wrist Trauma X-ray Images Using YOLOv8 Algorithm. arXiv preprint arXiv: 2304.05071, 2023.
  Google Scholar

Kelleher J. D.: Deep learning. MIT Press, 2019.
  Google Scholar

Kumar A., Kalia A., Kalia A.: ETL-YOLO v4: A face mask detection algorithm in era of COVID-19 pandemic. Optik, 259, 2022, 169051.
  Google Scholar

Loey M. et al.: A hybrid deep transfer learning model with machine learning methods for face mask detection in the era of the COVID-19 pandemic. Measurement 167, 2021, 108288.
  Google Scholar

Lou H. et al.: DC-YOLOv8: Small-Size Object Detection Algorithm Based on Camera Sensor. Electronics 12(10), 2023, 2323.
  Google Scholar

Mbunge E. et al.: Application of deep learning and machine learning models to detect COVID-19 face masks-A review. Sustainable Operations and Computers 2, 2021, 235–245.
  Google Scholar

Mohammed Ali F. A., Al-Tamimi M. S.: Face mask detection methods and techniques: A review. International Journal of Nonlinear Analysis and Applications 13(1), 2022, 3811–3823.
  Google Scholar

Nowrin A. et al.: Comprehensive review on facemask detection techniques in the context of covid-19. IEEE access 9, 2021, 106839–106864.
  Google Scholar

Padilla R., Netto S. L., Da Silva E. A.: A survey on performance metrics for object-detection algorithms. in 2020 international conference on systems, signals and image processing (IWSSIP), IEEE, 2020.
  Google Scholar

Phan Q. B., Nguyen T.: A Novel Approach for PV Cell Fault Detection using YOLOv8 and Particle Swarm Optimization, 2023.
  Google Scholar

Rajeshwari P. et al.: Object detection: an overview. Int. J. Trend Sci. Res. Dev. (IJTSRD) 3(1), 2019, 1663–1665.
  Google Scholar

Reis D. et al.: Real-Time Flying Object Detection with YOLOv8. arXiv preprint arXiv: 2305.09972, 2023.
  Google Scholar

Solawetz J.: What is YOLOv8? The Ultimate Guide, 2023, [https://blog.roboflow.com/whats-new-in-yolov8/] (available: 1.01.2024).
  Google Scholar

Talaat F. M., ZainEldin H.: An improved fire detection approach based on YOLO-v8 for smart cities. Neural Computing and Applications, 2023, 1–16.
  Google Scholar

Terven J., Cordova-Esparza D.: A comprehensive review of YOLO: From YOLOv1 and beyond. arXiv 2023. arXiv preprint arXiv: 2304.00501.
  Google Scholar

Tian Y. et al.: Role of masks in mitigating viral spread on networks. Physical Review E 108(1), 2023, 014306
  Google Scholar

Vibhuti et al.: Face mask detection in COVID-19: a strategic review. Multimedia Tools and Applications 81(28), 2022, 40013–40042.
  Google Scholar

Vrigkas M. et al.: Facemask: A new image dataset for the automated identification of people wearing masks in the wild. Sensors 22(3), 2022, 896.
  Google Scholar

Wani M. A. et al.: Advances in deep learning. Springer, 2020.
  Google Scholar

Wu W. et al.: Application of local fully Convolutional Neural Network combined with YOLO v5 algorithm in small target detection of remote sensing image. PloS one 16(10), 2021, e0259283.
  Google Scholar

Yunus E.: YOLO V7 and Computer Vision-Based Mask-Wearing Warning System for Congested Public Areas. Journal of the Institute of Science and Technology 13(1), 2023, 22–32.
  Google Scholar


Opublikowane
2024-06-30

Cited By / Share

AL-Shamdeen, M., & Ramo, F. M. (2024). OCENA WYDAJNOŚCI WYKRYWANIA MASKI NA TWARZY NA PODSTAWIE WIELU MODYFIKACJI ARCHITEKTURY YOLOV8. Informatyka, Automatyka, Pomiary W Gospodarce I Ochronie Środowiska, 14(2), 89–95. https://doi.org/10.35784/iapgos.6056

Autorzy

Muna AL-Shamdeen 
muna.jaffer@uomosul.edu.iq
University of Mosul, College of Computer Science and Mathematics Irak
https://orcid.org/0000-0002-2806-532X

Autorzy

Fawziya Mahmood Ramo 

University of Mosul, College of Computer Science and Mathematics Irak

Statystyki

Abstract views: 167
PDF downloads: 99


Licencja

Creative Commons License

Utwór dostępny jest na licencji Creative Commons Uznanie autorstwa 4.0 Międzynarodowe.