Использование нейросетевого метода для решения задач сегментации изображений

Аннотация

Сегментация изображений играет важную роль при выявлении различных заболеваний и патологий посредством обработки медицинских изображений. За прошедшие годы был разработан целый ряд традиционных подходов такие как бинарный пороговый метод (метод Оцу), метод водоразделов, метод кластеризации с помощью K-средних к выполнению сегментации изображений, использующих специфичные для предметной области знания для эффективного решения проблем сегментации в конкретных областях применения. Но, к сожалению, эти методы являлись не эффективными. На самом деле, суть сегментации изображений является классификацией содержащих каждый пиксель с аналогичными атрибутами. А цель классификации пиксель ‒ это обработать его крупно, нечувствительно к шуму, мелко, и средний звёздочный фильтр. То, что не позволяет сделать традиционные методы. Поэтому есть необходимость предлагать новый метод позволяющий устранять эти недостатки. Мы предлагаем метод основан на автокодировщик (специальная архитектура искусственных нейронных сетей, позволяющая применять обучение без учителя при использовании метода обратного распространения ошибки), позволяющий сжимать любое большое изображение на мелкое, (с тем же свойствами как входное). Этот метод позволяет также сэкономить ресурсы. При этом, мы используем метода обработки изображение под названием "MaxPooling" (U-Net).
В работе, мы создавали собственную метрику для отслеживания результата тренировки сети. В практической части мы попробовали сегментировать на классы изображения со стройки, а также попиксельно определили местонахождения самолета на изображения.

Сведения об авторе

Moutouama N’dah Bienvenu Mouale, Российский университет дружбы народов

аспирант кафедры прикладной информатики и теории вероятностей факультета физико-математических и естественных наук

Литература

1. Girshick R., Donahue J., Darrell T., Malik J. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation. In: 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, OH, USA: IEEE Computer Society; 2014. p. 580-587. doi: https://doi.org/10.1109/CVPR.2014.81
2. Panetto H., Cecil J. Information systems for enterprise integration, interoperability and networking: theory and applications. Enterprise Information Systems. 2013;7(1):1-6. doi: https://doi.org/10.1080/17517575.2012.684802
3. Poniszewska-Maranda A. Management of access control in information system based on role concept. Scalable Computing: Practice and Experience. 2011;12(1):35-49. Available at: https://www.scpe.org/index.php/scpe/article/view/686 (accessed 19.10.2022).
4. Maturana D., Mery D., Soto Á. Face Recognition with Local Binary Patterns, Spatial Pyramid Histograms and Naive Bayes Nearest Neighbor Classification. In: 2009 International Conference of the Chilean Computer Science Society. Santiago, Chile: IEEE Computer Society; 2009. p. 125-132. doi: https://doi.org/10.1109/SCCC.2009.21
5. Otsu N. A Threshold Selection Method from Gray-Level Histograms. IEEE Transactions on Systems, Man, and Cybernetics. 1979;9(1):62-66. doi: https://doi.org/10.1109/TSMC.1979.4310076
6. Pattanayak S. Advanced Neural Networks. In: Pro Deep Learning with TensorFlow 2.0. Berkeley, CA: Apress; 2023. p. 511-634. doi: https://doi.org/10.1007/978-1-4842-8931-0_6
7. LeCun Y., Bengio Y. Convolutional networks for images, speech, and time series. In: The handbook of brain theory and neural networks. Cambridge, MA, USA: MIT Press; 1998. p. 255-258.
8. LeCun Y., Bottou L., Orr G.B., Müller K.R. Efficient BackProp. In: Orr G.B., Müller KR. (eds.) Neural Networks: Tricks of the Trade. Lecture Notes in Computer Science. Vol. 1524. Berlin, Heidelberg: Springer; 1998. p. 9-50. doi: https://doi.org/10.1007/3-540-49430-8_2
9. Mouale M.N.B., Kozyrev D.V., Houankpo H.G.K., Nibasumba E. Development of a Neural Network Method in the Problem of Classification and Image Recognition. Modern Information Technologies and IT-Education. 2021;17(3):507-518. (In Russ., abstract in Eng.) doi: https://doi.org/10.25559/SITITO.17.202103.507-518
10. Mouale M.N.B. Using a Pre-Trained Neural Network (VGG 16) to Solve the Image Style Transfer Problem. Modern Information Technologies and IT-Education. 2022;18(2):241-248. (In Russ., abstract in Eng.) doi: https://doi.org/10.25559/SITITO.18.202202.241-248
11. Ciresan D.C., Gambardella L.M., Giusti A., Schmidhuber J. Deep Neural Networks Segment Neuronal Membranes in Electron Microscopy Images. In: Pereira F., Burges C.J., Bottou L., Weinberger K.Q. (eds.) Advances in Neural Information Processing Systems (NIPS 2012). Vol. 25. Curran Associates, Inc.; 2012. p. 1-9. Available at: https://proceedings.neurips.cc/paper_files/paper/2012/file/459a4ddcb586f24efd9395aa7662bc7c-Paper.pdf (accessed 19.10.2022).
12. Ronneberger O., Fischer P., Brox T. U-Net: Convolutional Networks for Biomedical Image Segmentation. In: Navab N., Hornegger J., Wells W., Frangi A. (eds.) Medical Image Computing and Computer-Assisted Intervention – MICCAI 2015. MICCAI 2015. Lecture Notes in Computer Science. Vol. 9351. Cham: Springer; 2015. p. 234-241. doi: https://doi.org/10.1007/978-3-319-24574-4_28
13. Long J., Shelhamer E., Darrell T. Fully convolutional networks for semantic segmentation. In: 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Boston, MA, USA: IEEE Computer Society; 2015. p. 3431-3440. doi: https://doi.org/10.1109/CVPR.2015.7298965
14. Badrinarayanan V., Kendall A., Cipolla R. SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2017;39(12):2481-2495. doi: https://doi.org/10.1109/TPAMI.2016.2644615
15. Araújo R.L., Araújo F.H.D.d., Silva R.R.V.e. Automatic segmentation of melanoma skin cancer using transfer learning and fine-tuning. Multimedia Systems. 2022;28(4):1239-1250. doi: https://doi.org/10.1007/s00530-021-00840-3
16. He K., Zhang X., Ren S., Sun J. Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2015;37(9):1904-1916. doi: https://doi.org/10.1109/TPAMI.2015.2389824
17. Zhao H., Shi J., Qi X., Wang X., Jia J. Pyramid Scene Parsing Network. In: 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA: IEEE Computer Society; 2017. p. 6230-6239. doi: https://doi.org/10.1109/CVPR.2017.660
18. Vincent P., Larochelle H., Lajoie I., Bengio Y., Manzagol P.-A. Stacked Denoising Autoencoders: Learning Useful Representations in a Deep Network with a Local Denoising Criterion. Journal of Machine Learning Research. 2010;11(110):3371-3408. Available at: http://jmlr.org/papers/v11/vincent10a.html (accessed 19.10.2022).
19. Rifai S., Vincent P., Muller X., Glorot X., Bengio Y. Contractive Auto-Encoders: Explicit Invariance During Feature Extraction. In: Proceedings of the 28th International Conference on International Conference on Machine Learning (ICML'11). Omnipress, Madison, WI, USA; 2011. p. 833-840. Available at: https://icml.cc/2011/papers/455_icmlpaper.pdf (accessed 19.10.2022).
20. Solovyeva E., Abdullah A. Dual Autoencoder Network with Separable Convolutional Layers for Denoising and Deblurring Images. Journal of Imaging. 2022;8(9):250. doi: https://doi.org/10.3390/jimaging8090250
21. Li S.Z., Jain A.K. Handbook of Face Recognition. New York, NY: Springer; 2005. 398 p. doi: https://doi.org/10.1007/b138828
22. Erhan D., Szegedy C., Toshev A., Anguelov D. Scalable Object Detection Using Deep Neural Networks. In: 2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, OH, USA: IEEE Computer Society; 2014. p. 2155-2162. doi: https://doi.org/10.1109/CVPR.2014.276
23. He K., Zhang X., Ren S., Sun J. Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2015;37(9):1904-1916. doi: https://doi.org/10.1109/TPAMI.2015.2389824
24. Shan C., Gong S., McOwan P.W. Facial expression based on Local Binary Patterns: A comprehensive study. Image and Vision Computing. 2009;27(6):803-816. doi: https://doi.org/10.1016/j.imavis.2008.08.005
25. Arulogun O.T., Omidiora E.O., Olaniyi O.M., Ipadeola A.A. Development of Security System using Facial Recognition. The Pacific Journal of Science and Technology. 2008;9(2):377-385.
26. Krizhevsky A., Sutskever I., Hinton G.E. ImageNet classification with deep convolutional neural networks. Communications of the ACM. 2017;60(6):84-90. doi: https://doi.org/10.1145/3065386
Опубликована
2022-12-20
Как цитировать
MOUALE, Moutouama N’dah Bienvenu. Использование нейросетевого метода для решения задач сегментации изображений. Современные информационные технологии и ИТ-образование, [S.l.], v. 18, n. 4, p. 744-755, dec. 2022. ISSN 2411-1473. Доступно на: <http://sitito.cs.msu.ru/index.php/SITITO/article/view/892>. Дата доступа: 24 june 2024 doi: https://doi.org/10.25559/SITITO.18.202204.744-755.
Раздел
Теоретические вопросы информатики, прикладной математики, компьютерных наук

Наиболее читаемые статьи этого автора (авторов)