Символьное моделирование сообщений и извлечение информации

  • Vladimir Dmitrievich Ilyin Федеральный исследовательский центр "Информатика и управление" Российской академии наук http://orcid.org/0000-0002-9761-082X

Аннотация

В обзоре представлены основы обновленного подхода к символьному моделированию (s-моделированию) аудио, видео, графических и др. сообщений и решению задач извлечения информации. Значение задач s-моделирования сообщений и извлечения информации определяется их растущей ролью в различных видах деятельности. Доминирование s-моделей сообщений в интеллектуальной деятельности определяется не только их компактностью и выразительностью, но и отсутствием ограничений на типы носителей, применяемых для их хранения. Носителями могут быть память человека, компьютера, смартфона, цифровой камеры или др. Затраты на построение, копирование, передачу, сохранение и накопление s-моделей сообщений (статей электронных энциклопедий, учебников и научных журналов, навигационных карт, видеосообщений, чертежей машин в системах автоматизированного проектирования, медицинских томограмм, записей музыкальных композиций и др.) несопоставимо меньше, чем аналогичные затраты, связанные с несимвольными моделями (макетами судов, зданий и др.). S-моделирование сообщений рассматривается как их отображение в выбранную среду моделирования, выполненное при заданных ограничениях, соответствующих условиям решения задач извлечения информации. Адекватность s-моделей сообщений определяется степенью их соответствия задачам, для решения которых они созданы, и точностью результатов, получаемых при решении этих задач. Предложены обновленные определения понятий s-(символа, кода, сигнала, сообщения, данных, информации). Рассмотрены уточненные s-модели задачи, алгоритма, программы, системы понятий и системы знаний. Задача извлечения информации из сообщения рассматривается как задача интерпретации сообщения на s-модели системы понятий. Приведен краткий обзор работ А.Н. Колмогорова и К. Шеннона, посвященных задачам передачи сообщений. В этих работах говорится о «количестве информации» и рассматриваются задачи, связанные с этим понятием. Понятие «информация» (как результат интерпретации сообщений на моделях систем понятий) там не рассматривается. Приведен пример применения предложенного подхода к анализу задачи перевода с одного языка на другой.

Сведения об авторе

Vladimir Dmitrievich Ilyin, Федеральный исследовательский центр "Информатика и управление" Российской академии наук

ведущий научный сотрудник Вычислительного центра им. А.А. Дородницына РАН, доктор технических наук, профессор

Литература

1. Cardie C. Empirical Methods in Information Extraction. AI Magazine. 1997; 18(4):65-79. (In Eng.) doi: https://doi.org/10.1609/aimag.v18i4.1322
2. Califf M.E., Mooney R.J. Bottom-Up Relational Learning of Pattern Matching Rules for Information Extraction. Journal of Machine Learning Research. 2003; 4:177-210. Available at: https://www.jmlr.org/papers/volume4/califf03a/califf03a.pdf (accessed 10.09.2021). (In Eng.)
3. Siefkes C., Siniakov P. An Overview and Classification of Adaptive Approaches to Information Extraction. In: Spaccapietra S. (ed.) Journal on Data Semantics IV. Lecture Notes in Computer Science. Vol. 3730. Springer, Berlin, Heidelberg; 2005. p. 172-212. (In Eng.) doi: https://doi.org/10.1007/11603412_6
4. Altınel B., Ganiz M.C. Semantic text classification: A survey of past and recent advances. Information Processing & Management. 2018; 54(6):1129-1153. (In Eng.) doi: https://doi.org/10.1016/j.ipm.2018.08.001
5. Vo D.-T., Al-Obeidat F., Bagheri E. Extracting temporal and causal relations based on event networks. Information Processing & Management. 2020; 57(6): 102319. (In Eng.) doi: https://doi.org/10.1016/j.ipm.2020.102319
6. Zhang N., et al. Contrastive Information Extraction With Generative Transformer. IEEE/ACM Transactions on Audio, Speech, and Language Processing. 2021; 29:3077-3088. (In Eng.) doi: https://doi.org/10.1109/TASLP.2021.3110126
7. Xu R., et al. Joint Extraction of Retinal Vessels and Centerlines Based on Deep Semantics and Multi-Scaled Cross-Task Aggregation. IEEE Journal of Biomedical and Health Informatics. 2021; 25(7):2722-2732. (In Eng.) doi: https://doi.org/10.1109/JBHI.2020.3044957
8. Liu X., Cheng J., Zhang Q. Multi-Stream Semantics-Guided Dynamic Aggregation Graph Convolution Networks to Extract Overlapping Relations. IEEE Access. 2021; 9:41861-41875. (In Eng.) doi: https://doi.org/10.1109/ACCESS.2021.3062231
9. Abdollahi A., Pradhan B., Alamri A. VNet: An End-to-End Fully Convolutional Neural Network for Road Extraction From High-Resolution Remote Sensing Data. IEEE Access. 2020; 8:179424-179436. (In Eng.) doi: https://doi.org/10.1109/ACCESS.2020.3026658
10. Yu X., et al. LSTM-Based End-to-End Framework for Biomedical Event Extraction. IEEE/ACM Transactions on Computational Biology and Bioinformatics. 2020; 17(6):2029-2039. (In Eng.) doi: https://doi.org/10.1109/TCBB.2019.2916346
11. Wang J., Song J., Chen M., Yang Z. Road network extraction: a neural-dynamic framework based on deep learning and a finite state machine. International Journal of Remote Sensing. 2015; 36(12):3144-3169. (In Eng.) doi: https://doi.org/10.1080/01431161.2015.1054049
12. Wang R., Zhang W., Shi W., Wang X., Cao W. GA-ORB: A New Efficient Feature Extraction Algorithm for Multispectral Images Based on Geometric Algebra. IEEE Access. 2019; 7:71235-71244. (In Eng.) doi: https://doi.org/10.1109/ACCESS.2019.2918813
13. Baviskar D., Ahirrao S., Potdar V., Kotecha K. Efficient Automated Processing of the Unstructured Documents Using Artificial Intelligence: A Systematic Literature Review and Future Directions. IEEE Access. 2021; 9:72894-72936. (In Eng.) doi: https://doi.org/10.1109/ACCESS.2021.3072900
14. Ilyin A.V., Ilyin V.D. Towards a Normalized Economic Mechanism Based on E-services. Agris On-line Papers in Economics and Informatics. 2014; (3):39-49. Available at: https://online.agris.cz/archive/2014/03/04 (accessed 10.09.2021). (In Eng.)
15. Newell A., Simon H. Computer science as empirical inquiry: symbols and search. Communications of the ACM. 1976; 19(3):113-126. (In Eng.) doi: https://doi.org/10.1145/360018.360022
16. Ilyin V.D. Symbolic Modeling (S-Modeling): an Introduction to Theory. In: Silhavy R. (ed.) Artificial Intelligence Trends in Systems. CSOC 2022. Lecture Notes in Networks and Systems. Vol. 502. Springer, Cham; 2022. (In Eng.) doi: https://doi.org/10.1007/978-3-031-09076-9_54
17. Cerf V., Kahn R. A Protocol for Packet Network Intercommunication. IEEE Transactions on Communications. 1974; 22(5):637-648. (In Eng.) doi: https://doi.org/10.1109/TCOM.1974.1092259
18. Ilyin A.V., Ilyin V.D. Interval Planning the Supplies of Scarce Product. Contemporary Engineering Sciences. 2015; 8(31):1495-1498. (In Eng.) doi: https://doi.org/10.12988/ces.2015.59263
19. Zhyrnov V., Solonskaya S. Metod preobrazovaniya simvol’nykh radarnykh otmetok malozametnykh podvizhnykh ob”yektov na osnove effekta Tal’bota [Method for transforming symbolic radar marks of low-noticeable moving objects based on the Talbot effect]. Radiotekhnika: All-Ukr. Sci. Interdep. Mag. No. 205. KNURE, Kharkiv; 2021. p. 129-137. (In Russ., abstract in Eng.) doi: https://doi.org/10.30837/rt.2021.2.205.14
20. Shvalov D.V., Kravchenko V.A., Shirapov D.Sh. Automated Logic-Mathematical Modeling of Railway Automation Devices Technical Condition. 2019 International Multi-Conference on Industrial Engineering and Modern Technologies (FarEastCon). IEEE Press, Vladivostok, Russia; 2019. p. 1-7. (In Eng.) doi: https://doi.org/10.1109/FarEastCon.2019.8934943
21. Kravchenko V.A., Shirapov D.Sh. Logic-Functional Modeling of Nonlinear Radio Engineering Systems. 2018 International Multi-Conference on Industrial Engineering and Modern Technologies (FarEastCon). IEEE Press, Vladivostok, Russia; 2018. p. 1-6. (In Eng.) doi: https://doi.org/10.1109/FarEastCon.2018.8602769
22. Ilyin V.D., Sokolov I.A. Informatsiya kak rezul'tat interpretatsii soobshcheniy na simvol'nykh modelyakh sistem ponyatiy [Information as a result of message interpretation based on s-model of systems of concepts]. Informacionnye tekhnologii I I vichslitel’nye sistemy = Journal of Information Technologies and Computing Systems. 2006; (4):74-82. Available at: https://www.elibrary.ru/item.asp?id=12830934 (accessed 10.09.2021). (In Russ., abstract in Eng.)
23. Ilyin A.V., Ilyin V.D. The Technology of Interactive Resource Allocation in Accordance with the Customizable System of Rules. Applied Mathematical Sciences. 2013; 7(143):7105-7111. (In Eng.) doi: http://dx.doi.org/10.12988/ams.2013.311649
24. Shannon C.E. A Mathematical Theory of Communication. The Bell System Technical Journal. 1948; 27(3):379-423. ( In Eng.) doi: https://doi.org/10.1002/j.1538-7305.1948.tb01338.x
25. Kolmogorov A.N. Tri podkhoda k opredeleniyu ponyatiya "Kolichestvo informatsii" [Three approaches to the definition of the concept "quantity of information"]. Problemy peredaсhi informatsii = Problems of Information Thransmission. 1965; 1(1):3-11. Available at: http://mi.mathnet.ru/rus/ppi/v1/i1/p3 (accessed 10.09.2021). (In Russ.)
Опубликована
2021-12-20
Как цитировать
ILYIN, Vladimir Dmitrievich. Символьное моделирование сообщений и извлечение информации. Современные информационные технологии и ИТ-образование, [S.l.], v. 17, n. 4, p. 805-813, dec. 2021. ISSN 2411-1473. Доступно на: <http://sitito.cs.msu.ru/index.php/SITITO/article/view/753>. Дата доступа: 28 mar. 2024 doi: https://doi.org/10.25559/SITITO.17.202104.805-813.
Раздел
Теоретические вопросы информатики, прикладной математики, компьютерных наук