OCENA WYDAJNOŚCI WYKRYWANIA MASKI NA TWARZY NA PODSTAWIE WIELU MODYFIKACJI ARCHITEKTURY YOLOV8

##plugins.themes.bootstrap3.article.main##

DOI

Muna AL-Shamdeen

muna.jaffer@uomosul.edu.iq

https://orcid.org/0000-0002-2806-532X
Fawziya Mahmood Ramo

fawziyaramo@uomosul.edu.iq

Abstrakt

Praca ta ma na celu opracowanie solidnego systemu zdolnego do wykrywania w czasie rzeczywistym, dokładnie rozróżniającego osoby, które przestrzegają lub zaniedbują wymogi dotyczące noszenia masek na twarzy, w różnych scenariuszach obejmujących obrazy, filmy i streaming z kamer na żywo. Niniejsze badanie ulepszyło architekturę YOLOv8n do wykrywania masek na twarzy poprzez zbudowanie nowej, dwumodyfikacyjnej wersji modelu YOLOv8n w celu poprawy ekstrakcji cech i sieci predykcyjnej dla YOLOv8n. W proponowanej wersji YOLOv8n-v1, integracja szkieletu sieci rezydualnej z architekturą YOLOv8n poprzez zastąpienie pierwszych dwóch warstw YOLOv8n modułami ResNet_Stem i ResNet_Block w celu poprawy zdolności modelu do ekstrakcji cech i zastąpienia modułu Spatial Pyramid Pooling Fast (SPPF) modułami Spatial Pyramid Pooling-Cross Stage Partial (SPPCSP), które łączą SPP i CSP w celu stworzenia sieci, która jest zarówno skuteczna, jak i wydajna. Proponowany YOLOv8n-v2 został zbudowany poprzez integrację modułów Ghostconv i ResNet_Downsampling z proponowanym szkieletem YOLOv8n-v1. Wszystkie modele zostały przetestowane i ocenione na dwóch zestawach danych. Pierwszym z nich jest zbiór danych MJFR, który zawiera 23 621 obrazów i został zebrany przez autorów niniejszego artykułu z czterech różnych zbiorów danych, z których wszystkie zostały wykorzystane do wykrywania masek na twarzy. Drugi to zbiór danych wykrywania obiektów MSFM, który został zebrany z grup filmów wideo w prawdziwym życiu i obrazów opartych na technologii uczenia się programu nauczania. Wydajność modelu została oceniona za pomocą następujących wskaźników: mean average precision (mAP50), mAP50-95, recall (R) and precision (P). Stwierdzono, że obie wersje proponowanego YOLOv8n przewyższają oryginalny model pod względem dokładności dla obu zestawów danych. Wreszcie, system został z powodzeniem wdrożony w jednej z klinik medycznych powiązanych z kompleksem medycznym, gdzie wyniki jego zastosowania wykazały wysoką wydajność w różnych aspektach pracy i skutecznie przyczyniły się do poprawy zdrowia i bezpieczeństwa publicznego.

Słowa kluczowe:

YOLOv8, detekcja obiektów, algorytm detekcji, sieć rezydualna

Bibliografia

##plugins.themes.bootstrap3.article.details##

AL-Shamdeen, M., & Ramo, F. M. (2024). OCENA WYDAJNOŚCI WYKRYWANIA MASKI NA TWARZY NA PODSTAWIE WIELU MODYFIKACJI ARCHITEKTURY YOLOV8. Informatyka, Automatyka, Pomiary W Gospodarce I Ochronie Środowiska, 14(2), 89–95. https://doi.org/10.35784/iapgos.6056