METODA ADAPTACYJNEGO KODOWANIA STATYSTYCZNEGO Z UWZGLĘDNIENIEM CECHY STRUKTURALNE OBRAZÓW WIDEO
Volodymyr Barannik
vvbar.off@gmail.comV. N. Karazin Kharkiv National University (Ukraina)
https://orcid.org/0000-0002-2848-4524
Dmytro Havrylov
Іvan Kozhedub Kharkiv National Air Force University (Ukraina)
Serhii Pantas
Heroes of Kruty Military Institute of Telecommunications and Informatization (Ukraina)
Yurii Tsimura
Heroes of Kruty Military Institute of Telecommunications and Informatization (Ukraina)
Tatayna Belikova
Kharkiv National University of Radio Electronics (Ukraina)
Rimma Viedienieva
National University of Civil Defense of Ukraine (Ukraina)
Vasyl Kryshtal
National University of Civil Defense of Ukraine (Ukraina)
Abstrakt
W artykule zaproponowano metodę ulepszonego adaptacyjnego całkowego kodowania arytmetycznego. Metodę tę zaleca się stosować w technologii wielopoziomowego przetwarzania danych wideo w oparciu o metodę JPEG. Technologia opiera się na wykrywaniu kluczowych informacji na kilku etapach przetwarzania danych wideo. Aby zmniejszyć głośność wyjściową, algorytm RLE i całkowe kodowanie arytmetyczne są dostosowywane do nowej struktury danych wejściowych. Tym samym rozwinięto metodę linearyzacji dwuwymiarowych transformantów w oparciu o skanowanie zygzakowate. Różnice metody polegają na przeprowadzeniu zygzakowatej linearyzacji międzytransformacyjnej wektorów z uwzględnieniem doboru składowych widmowych określonych jako komplementarne. Po raz pierwszy opracowano podejście do rozkładu linearyzowanego transformantów w oparciu o wejście w zakresy kontrolne. W związku z obecnością w grupie różnych typów transformantów próg dobierany jest według kryterium całkowitej nieparzystej liczby nierównowagowych składników dopełniających. Na podstawie uwzględnienia prawdopodobieństwa wystąpienia elementów słownikowych udoskonalono zintegrowane kodowanie arytmetyczne (zintegrowane kodowanie arytmetyczne dwusłownikowe). Wyznaczanie bieżących składowych kodu według rozłożonego interwału roboczego w zależności od mocy słowników elementów znaczących i liczby powtórzeń. Pozwala to dodatkowo uwzględnić cechy statystyczne składników linearyzowanych transformantów o strukturze RLE i zmniejszyć długość kodu arytmetycznego; po raz pierwszy stworzono metodę kompresji transformantów, polegającą na redukcji różnego rodzaju redundancji w grupach transformantów. Porównawcza analiza eksperymentalna ze znanymi metodami wykazała, że opracowana technologia charakteryzuje się wyższym stopniem sprężania przy skróconym czasie przetwarzania. Pozwala to zapewnić niezbędny poziom dostępu i niezawodności w warunkach wzrostu pierwotnego wolumenu danych.
Słowa kluczowe:
metoda wielopoziomowego przetwarzania selektywnego, RLE, kodowanie arytmetyczneBibliografia
[1] Alakuijala J. et al.: JPEG XL next-generation image compression architecture and coding tools. Proc. SPIE 11137, 2019, 111370K.
Google Scholar
[2] Alakuijala J.: Image compression benchmark [https://drive.google.com/corp/ drive/folders/0B0w_eoSgaBLXY1JlYUVOMzM5VFk] (access 2024/09/08).
Google Scholar
[3] Barannik D. et. al.: Steganographic Coding Technology for Hiding Information in Infocommunication Systems of Critical Infrastructure. 4th International Conference on Advanced Trends in Information Theory (ATIT). 2022, 88–91 [https://doi.org/10.1109/ATIT58178.2022.10024185].
Google Scholar
[4] Barannik V. et. al.: Evaluation of Effectiveness of Masking Methods of Aerial Photographs. 3rd International Conference on Advanced Information and Communications Technologies (AICT). 2019, 415–418 [https://doi.org/10.1109/AIACT.2019.8847820].
Google Scholar
[5] Barannik V. et. al.: Method of indirect information hiding in the process of video compression. Radioelectronic and Computer Systems 4, 2021, 119–131 [https://doi.org/10.32620/reks.2021.4].
Google Scholar
[6] Bondžulić B. et. al.: Picture-wise just noticeable difference prediction model for JPEG image quality assessment. Vojnotehnički glasnik 70(1), 2022, 62–86 [https://doi.org/10.5937/vojtehg70-34739].
Google Scholar
[7] Cardone B.: Fuzzy Transform Image Compression in the YUV Space. Computation 11(10), 2023, 1–19
Google Scholar
[https://doi.org/10.3390/computation11100191].
Google Scholar
[8] Chen T. et. al.: End-to-End Learnt Image Compression via Non-Local Attention Optimization and Improved Context Modeling. IEEE Transactions on Image Processing, 2021, 3179–3191 [https://doi.org/10.1109/tip.2021.3058615].
Google Scholar
[9] Cho J., Kwon O.-J., Choi S.: Improvement of JPEG XL Lossy Image Coding Using Region Adaptive DCT Block Partitioning Structure. IEEE Access 9, 113213–113225 [https://doi.org/10.1109/ACCESS.2021.3102235].
Google Scholar
[10] Duda J.: Asymmetric Numeral System implementation by Andrew Polar [http://ezcodesample.com/abs/abs_article.html] (access 2023/05/14).
Google Scholar
[11] Duda J.: Asymmetric numeral systems. arXiv:0902.0271. [https://doi.org/10.48550/arXiv.0902.0271] (access 2024/09/08).
Google Scholar
[12] Gonzalez R. et. al.: Digital Image Processing. 4th Edition. Pearson Education, 2018.
Google Scholar
[13] ITU-T Recommendation H.265. High efficiency video coding. 2019 [https://www.itu.int/ rec/T-REC-H.265] (access 2024/09/08).
Google Scholar
[14] Jinming L. et. al.: Learned Image Compression with Mixed Transformer-CNN Architectures. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2023, 14388–14397 [https://doi.org/10.1109/CVPR52729.2023.01383].
Google Scholar
[15] Kim I. et. al.: High efficiency video coding (HEVC) test model 12 (HM12) encoder description. JCTVC 14th meeting, 2013, JCTVC-N1002.
Google Scholar
[16] Landu R. S.: Image Compression Using AI: Brief Insights into Deep Learning Techniques and AI Frameworks. International Journal of Engineering, Science, Technology and Innovation (IJESTI) 2(1), 2022, 1–6.
Google Scholar
[17] Li C. et al.: Yolov6: A single-stage object detection framework for industrial applications. arXiv preprint arXiv:2209.02976, 2022.
Google Scholar
[18] Li H. et al.: Frequency-aware Transformer for Learned Image Compression. ICLR, 2024, 19, arXiv:2310.16387 (access 2024/09/08).
Google Scholar
[19] Liao S. et. al.: Rate-Quality Based Rate Control Model for Neural Video Compression. International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2024, 4215–4219 [https://doi.org/10.1109/ICASSP48485.2024.10447777].
Google Scholar
[20] Lopes F. A. et. al.: FPGA implementation of the JPEG XR for onboard earth observation applications. Journal of Real-Time Image Processing 18(6), 2021, 1–12 [https://doi.org/10.1007/s11554-021-01078-y].
Google Scholar
[21] Park W. et. al.: Fast Computation of Integer DCT-V, DCT-VIII, and DST-VII for Video Coding. IEEE Transactions on Image Processing 28(12), 2019, 5839–5851.
Google Scholar
[22] Ponomarenko N. et. al.: Image database TID2013: Peculiarities, results and perspectives. Signal Processing: Image Communication 30, 2015, 57–77.
Google Scholar
[23] Rao K. et. al.: JPEG Series. 1st edition. River Publishers, 2021.
Google Scholar
[24] Ren S. et al.: Faster R-CNN: Towards real-time object detection with region proposal networks. NeurIPS, 2015, arXiv:1506.01497.
Google Scholar
[25] Russ J. C., Neal F. B.: The Image Processing Handbook. 7th Edition. CRC Press, 2018.
Google Scholar
[26] Sneyers J.: Improve the Web Experience With Progressive Image DecodingImprove the Web Experience With Progressive Image Decoding, 2021 [https://cloudinary.com/blog/improve_the_web_experience_with_progressive_image_decoding] (access 2024/09/08).
Google Scholar
[27] Umbaugh S. E.: Digital Image Processing and Analysis: Computer Vision and Image Analysis 4th Edition. Taylor & Francis Ltd 2023.
Google Scholar
[28] Wassenberg J. et. al.: DIS Text of ISO IEC 18181-1 (JPEG XL), document JPEG (ISO/IEC JTC 1/SC 29/WG 1). 86th Meeting, 2020.
Google Scholar
[29] Wassenberg J., Sneyers J.: JPEG XL White Paper, document JPEG(ISO/IEC JTC 1/SC 29/WG 1). 87th Meeting. Germany, Erlangen, 04.2020, N87021, 27–30.
Google Scholar
[30] Wiegand T. et. al.: Overview of the H.264/AVC Video Coding Standard. IEEE Transactions on Circuits and Systems for Video Technology 13(7), 2003, 560–576.
Google Scholar
[31] Zhang X.: Shufflenet: An extremely efficient convolutional neural network for mobile devices. CVPR, 2018, arXiv:1707.01083.
Google Scholar
Autorzy
Volodymyr Barannikvvbar.off@gmail.com
V. N. Karazin Kharkiv National University Ukraina
https://orcid.org/0000-0002-2848-4524
Autorzy
Dmytro HavrylovІvan Kozhedub Kharkiv National Air Force University Ukraina
Autorzy
Serhii PantasHeroes of Kruty Military Institute of Telecommunications and Informatization Ukraina
Autorzy
Yurii TsimuraHeroes of Kruty Military Institute of Telecommunications and Informatization Ukraina
Autorzy
Tatayna BelikovaKharkiv National University of Radio Electronics Ukraina
Autorzy
Rimma ViedienievaNational University of Civil Defense of Ukraine Ukraina
Autorzy
Vasyl KryshtalNational University of Civil Defense of Ukraine Ukraina
Statystyki
Abstract views: 16PDF downloads: 6
Inne teksty tego samego autora
- Volodymyr Barannik, Natalia Barannik, Oleksandr Slobodyanyuk, TECHNOLOGIA POŚREDNIEGO UKRYWANIA INFORMACJI NA ZASADZIE MULTIADYCZNEJ , Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska: Tom 11 Nr 4 (2021)
- Volodymyr Barannik, Mykola Dvorsky, Valeriy Barannik, Viktoria Himenko, Anton Sorokun, POPRAWA METOD KOMPENSACJI RUCHU PORUSZAJĄCYCH SIĘ OBIEKTÓW DYNAMICZNYCH W STREAMIE WIDEO SYSTEMU WIDEOKONFERENCYJNEGO , Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska: Tom 8 Nr 4 (2018)
- Volodymyr Barannik, Oleg Shatun, Dmitriy Barannik, Veronika Kobtseva, OPRACOWANIE METODY POŚREDNIEGO STEGANOGRAFICZNEGO UKRYWANIA DANYCH W INFORMACJI O KONTURZE , Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska: Tom 8 Nr 4 (2018)
- Volodymyr Barannik, Roman Onyshchenko, Gennady Pris, Mykhailo Babenko, Valeriy Barannik, Vitalii Shmakov, Ivan Pantas, METODA TWORZENIA SYSTEMU SKRÓCONEGO KODU POZYCYJNEGO DLA PRZEKSZTAŁCONYCH OBRAZÓW WIDEO , Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska: Tom 14 Nr 3 (2024)