Применение сверточных нейронных сетей для обнаружения и распознавания изображений на основе самописного генератора

Аннотация

Распознавание объектов является ветвью искусственного зрения и одним из столпов машинного зрения. Оно состоит в идентификации форм, заранее описанных в цифровом изображении и, в общем случае, в цифровом видеопотоке. Хотя, как правило, можно выполнять распознавание по видеофрагментам, процесс обучения обычно выполняется на изображениях. В данной работе рассматривается алгоритм классификации и распознавания объектов с использованием сверточных нейронных сетей. Цель работы – реализовать алгоритм обнаружения и классификации различных графических объектов, подаваемых с веб-камеры. Задача состоит в том, чтобы сначала классифицировать и распознавать объект с высокой точностью по заданному набору данных, а затем продемонстрировать способ генерации изображений для увеличения объема обучающего набора данных путем самописного генератора. Используемый алгоритм классификации и распознания является инвариантным к переносу, сдвигу и повороту. Существенной новизной в этой работе является создание самописного генератора, позволяющего применять различные виды аугментации (искусственное увеличение объема обучающей выборки путем модификации обучающих данных) для формирования каждый раз новых групп измененных изображений.

Сведения об авторах

Moutouama N’dah Bienvenu Mouale, Российский университет дружбы народов

аспирант кафедры прикладной информатики и теории вероятностей факультета физико-математических и естественных наук

Dmitry Vladimirovich Kozyrev, Российский университет дружбы народов

доцент кафедры прикладной информатики и теории вероятностей факультета физико-математических и естественных наук, кандидат физико-математических наук, доцент

Литература

1. Arulogun O.T., Omidiora E.O., Olaniyi O.M., Ipadeola A.A. Development of Security System using Facial Recognition. The Pacific Journal of Science and Technology. 2008;9(2):377-385.
2. Viola P., Jones M. Rapid object detection using a boosted cascade of simple features. In: Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. CVPR 2001. Kauai, HI, USA: IEEE Computer Society; 2001. p. 511-518. doi: https://doi.org/10.1109/CVPR.2001.990517
3. Viola P., Jones M.J. Robust real-time face detection. International Journal of Computer Vision. 2004;57(2):137-154. Available at: https://www.face-rec.org/algorithms/boosting-ensemble/16981346.pdf (accessed 19.07.2022).
4. Canny J. A Computational Approach to Edge Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence. 1986;PAMI-8(6):679-698. doi: https://doi.org/10.1109/TPAMI.1986.4767851
5. Alblushi A. Face Recognition Based on Artificial Neural Network: A Review. Artificial Intelligence & Robotics Development Journal. 2021;1(2):116-131. doi: https://doi.org/10.52098/airdj.202125
6. Girshick R. Fast R-CNN. In: 2015 IEEE International Conference on Computer Vision (ICCV). Santiago, Chile: IEEE Computer Society; 2015. p. 1440-1448. doi: https://doi.org/10.1109/ICCV.2015.169
7. Nguyen D.T., Khachumov V.M., Khachumov M.V., Salpagarov S.I., Yakovlev K.S. On the Estimation of Accuracy and Stability of 3D Face Modeling Using a Pair of Stereo Cameras. CEUR Workshop Proceedings. 2018;2236:56-64. Available at: https://ceur-ws.org/Vol-2236/paper-07-007.pdf (accessed 19.07.2022).
8. He K., Zhang X., Ren S., Sun J. Deep Residual Learning for Image Recognition. In: 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas, NV, USA: IEEE Computer Society; 2016. p. 770-778. doi: https://doi.org/10.1109/CVPR.2016.90
9. Redmon J., Farhadi A. YOLO9000: Better, Faster, Stronger. In: 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA: IEEE Computer Society; 2017. p. 6517-6525. doi: https://doi.org/10.1109/CVPR.2017.690
10. Mouale M.N.B., Kozyrev D.V., Houankpo H.G.K., Nibasumba E. Development of a Neural Network Method in the Problem of Classification and Image Recognition. Modern Information Technologies and IT-Education. 2021;17(3):507-518. (In Russ., abstract in Eng.) doi: https://doi.org/10.25559/SITITO.17.202103.507-518
11. Erhan D., Szegedy C., Toshev A., Anguelov D. Scalable Object Detection Using Deep Neural Networks. In: 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, OH, USA: IEEE Computer Society; 2014. p. 2155-2162. doi: https://doi.org/10.1109/CVPR.2014.276
12. He K., Zhang X., Ren S., Sun J. Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2015;37(9):1904-1916. doi: https://doi.org/10.1109/TPAMI.2015.2389824
13. Krizhevsky A., Sutskever I., Hinton G.E. ImageNet classification with deep convolutional neural networks. Communications of the ACM. 2017;60(6):84-90. doi: https://doi.org/10.1145/3065386
14. Gao Z., Guan S., Guo M. Semantic Segmentation of Street View Image Based on Fully Convolutional Neural Networks. In: 2021 2nd International Seminar on Artificial Intelligence, Networking and Information Technology (AINIT). Shanghai, China: IEEE Computer Society; 2021. p. 400-404. doi: https://doi.org/10.1109/AINIT54228.2021.00084
15. Gao H., Zhang Y., Lv W., Yin J., Qasim T., Wang D. A Deep Convolutional Generative Adversarial Networks-Based Method for Defect Detection in Small Sample Industrial Parts Images. Applied Sciences. 2022;12(13):6569. doi: https://doi.org/10.3390/app12136569
16. Mrong S., Jormanainen I., Toivonen T. Visualization tool for teaching and learning Artificial Neural Networks. In: Ninth International Conference on Technological Ecosystems for Enhancing Multiculturality (TEEM'21) (TEEM'21). New York, NY, USA: Association for Computing Machinery; 2021. p. 58-62. doi: https://doi.org/10.1145/3486011.3486419
17. Houankpo H.G.K., Kozyrev D.V., Nibasumba E., Mouale M.N.B., Sergeeva I.A. A Simulation Approach to Reliability Assessment of a Redundant System with Arbitrary Input Distributions. In: Vishnevskiy V.M., Samouylov K.E., Kozyrev D.V. (eds.). Distributed Computer and Communication Networks. DCCN 2020. Lecture Notes in Computer Science. Vol. 12563. Cham: Springer; 2020. p. 380-392. doi: https://doi.org/10.1007/978-3-030-66471-8_29
18. Panetto H., Cecil J. Information systems for enterprise integration, interoperability and networking: theory and applications. Enterprise Information Systems. 2013;7(1):1-6. doi: https://doi.org/10.1080/17517575.2012.684802
19. Baby C.T., Baby C.J. Image Detection and Recognition Using Convolutional Neural Networks. In: Kumar S., Hiranwal S., Purohit S.D., Prasad M. (eds.). Proceedings of International Conference on Communication and Computational Technologies. Algorithms for Intelligent Systems. Singapore: Springer; 2023. p. 255-266. doi: https://doi.org/10.1007/978-981-19-3951-8_20
20. Poniszewska-Maranda A. Management of access control in information system based on role concept. Scalable Computing: Practice and Experience. 2011;12(1):35-49. Available at: https://www.scpe.org/index.php/scpe/article/view/686 (accessed 19.07.2022).
21. Kharchevnikova A.S., Savchenko A.V. Neural Networks in Video-Based Age and Gender Recognition on Mobile Platforms. Optical Memory and Neural Networks. 2018;27(4):246-259. doi: https://doi.org/10.3103/S1060992X18040021
22. Parkhi O.M., Vedaldi A., Zisserman A. Deep Face Recognition. In: Xie X., Jones M.W., Tam G.K.L. (eds.). Proceedings of the British Machine Vision Conference (BMVC). BMVA Press; 2015. p. 41.1-41.12. doi: https://dx.doi.org/10.5244/C.29.41
23. Cao Q., Shen L., Xie W., Parkhi O.M., Zisserman A. VGGFace2: A Dataset for Recognising Faces across Pose and Age. In: 2018 13th IEEE International Conference on Automatic Face & Gesture Recognition (FG 2018). IEEE Computer Society; 2018. p. 67-74. doi: https://doi.org/10.1109/FG.2018.00020
24. Sharma R., Kim M., Gupta A. Motor imagery classification in brain-machine interface with machine learning algorithms: Classical approach to multi-layer perceptron model. Biomedical Signal Processing and Control. 2022;71(A):103101. doi: https://doi.org/10.1016/j.bspc.2021.103101
25. Simonyan K., Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition. In: 3rd International Conference on Learning Representations (ICLR 2015). Computational and Biological Learning Society; 2015. p. 1-14. doi: https://doi.org/10.48550/arXiv.1409.1556
Опубликована
2022-10-24
Как цитировать
MOUALE, Moutouama N’dah Bienvenu; KOZYREV, Dmitry Vladimirovich. Применение сверточных нейронных сетей для обнаружения и распознавания изображений на основе самописного генератора. Современные информационные технологии и ИТ-образование, [S.l.], v. 18, n. 3, p. 507-515, oct. 2022. ISSN 2411-1473. Доступно на: <http://sitito.cs.msu.ru/index.php/SITITO/article/view/891>. Дата доступа: 08 oct. 2024 doi: https://doi.org/10.25559/SITITO.18.202203.507-515.
Раздел
Теоретические вопросы информатики, прикладной математики, компьютерных наук

Наиболее читаемые статьи этого автора (авторов)