Обогащённая сеть проблем как ядро метаданных электронной библиотеки

  • Andrey Petrovich Gagarin Московский авиационный институт (национальный исследовательский университет) http://orcid.org/0000-0002-0929-2834
  • Ilja Andreevich Filimonov Московский авиационный институт (национальный исследовательский университет) http://orcid.org/0000-0002-2307-0453

Аннотация

Статья направлена на совершенствование объектного поиска в сети проблем электронной библиотеки. Поиск производится «вручную» на экране компьютера, на котором показывается специальная разновидность графа знаний, представляющего как документы, хранящиеся в библиотеке, так и относящиеся к ним метаданные.  Одна часть узлов графа изображает хранящиеся документы в то время, как другая часть представляет технические и научные проблемы, обсуждаемые в документах, фазы решения этих проблем, места публикаций, если таковые имели место, и авторов. Рёбра графа отражают различные отношения между этими сущностями. Различаются три уровня метаданных. Верхний уровень состоит из кластеров, которые образованы уздами и рёбрами и соответствуют конкретным по своему содержанию темам, распознаваемым в библиотечном контенте. Следующие два уровня имеют словесную природу. Метки узлов, не обязательные сами по себе, образуют второй уровень метаданных. Метка представляет собой краткое номинативное словосочетание, которое присваивается узлу, когда он включается в библиотеку. Метка содействует объектному поиску, который начинается с распознавания кластеров по когнитивному отображению их конфигураций в памяти пользователя. Поиск продолжается путём перемещения в пространстве графа и изменения масштаба, в каком он показывается на экране компьютера. При достижении определённого масштаба метки становятся видимыми и начинают влиять на поиск. Третий уровень метаданных лежит вне пространства графа и представлен таблицей. Путём выделения узла, который заинтересовал пользователя, в таблице показывается строка, в которой пользователь может получить такие сведения об узле, как библиографическую запись документа или характеристику проблемы. Этот процесс даёт информацию, достаточную, чтобы принять решение о завершении или продолжении поиска. В обоих случаях пользователь получает полный доступ к требуемым документам, хранящимся в библиотеке с помощью специального браузера. Нахождение конкретного документа оказывается значимым, но не единственным исходом пользования библиотекой. Во многих случаях к библиотеке обращаются, чтобы получить сведения о состоянии некоторой научной или технической области в сжатом и, по возможности, обобщённом виде. Предлагается обогащение метаданных путём расширения номенклатуры узлов графа, делающее метаданные библиотеки более информативными и, следовательно, более пригодными для сценариев эксплуатации библиотеки, указанных выше. Рассмотрены трудности, возникающие при обогащении метаданных, и сформулированы соответствующие рекомендации. Доклад содержит пример библиотечной коллекции, сформированной согласно этим рекомендациям.

Сведения об авторах

Andrey Petrovich Gagarin, Московский авиационный институт (национальный исследовательский университет)

профессор кафедры вычислительных машин, систем и сетей, Институт № 3 "Системы управления, информатика и электроэнергетика", кандидат технических наук, профессор

Ilja Andreevich Filimonov, Московский авиационный институт (национальный исследовательский университет)

аспирант кафедры вычислительных машин, систем и сетей, Институт № 3 "Системы управления, информатика и электроэнергетика"

Литература

1. Balog K. Entity-Oriented Search. The Information Retrieval Series. Vol. 39. Springer Cham; 2018. 351 p. (In Eng.) doi: http://doi.org/10.1007/978-3-319-93935-3, 2018
2. Siew C.S.Q., Wulff D.U., Beckage N.M., Kenett Y.N., Meštrović A. Cognitive Network Science: A Review of Research on Cognition through the Lens of Network Representations, Processes, and Dynamics. Complex. 2019; 2019:24. (In Eng.) doi: https://doi.org/10.1155/2019/2108423
3. Gagarin A.P., Filimonov I.A. Problem Network as Access Gate into a Document Repository. Sovremennye informacionnye tehnologii i IT-obrazovanie = Modern Information Technologies and IT-Education. 2020; 16(3):582-597. (In Russ., abstract in Eng.) doi: https://doi.org/10.25559/SITITO.16.202003.582-597
4. Heymann S., Grand B.L. Visual Analysis of Complex Networks for Business Intelligence with Gephi. 2013 17th International Conference on Information Visualisation. IEEE Press, London, UK; 2013. p. 307-312. (In Eng.) doi: https://doi.org/10.1109/IV.2013.39
5. Bastian M., Heymann S., Jacomy M. Gephi: An Open Source Software for Exploring and Manipulating Networks. Proceedings of the International AAAI Conference on Web and Social Media. 2009; 3(1):361-362. Available at: https://ojs.aaai.org/index.php/ICWSM/article/view/13937 (accessed 17.09.2021). (In Eng.)
6. Ait El Mouden Z., Jakimi A., Hajar M. An Algorithm of Conversion Between Relational Data and Graph Schema. In: Rocha Á., Serrhini M. (eds.) Information Systems and Technologies to Support Learning. EMENA-ISTL 2018. Smart Innovation, Systems and Technologies. Vol. 111. Springer, Cham; 2019. p. 594-602. (In Eng.) doi: https://doi.org/10.1007/978-3-030-03577-8_65
7. Brandes U., Eiglsperger M., Lerner J., Pich C. Graph Markup Language (GraphML). In: Tamassia R. (ed.) Handbook of Graph Drawing and Visualization. 1st ed. Chapman and Hall/CRC, New York; 2013. p. 517-541. (In Eng.) doi: https://doi.org/10.1201/b15385-19
8. Borgman C.L. What are digital libraries? Competing visions. Information Processing and Management. 1999; 35(3):227-243. (In Eng.) doi: https://doi.org/10.1016/S0306-4573(98)00059-4
9. Fox E.A., Akscyn R.M., Furuta R.K., Leggett J.J. Digital libraries. Communications of the ACM. 1995; 38(4):22-28. (In Eng.) doi: https://doi.org/10.1145/205323.205325
10. Gonçalves M.A., Fox E.A., Watson L.T., Kipp N.A. Streams, Structures, Spaces, Scenarios, Societies (5S): A Formal Model for Digital Libraries. ACM Transactions on Information Systems. 2004; 22(2):270-312. (In Eng.) doi: https://doi.org/10.1145/984321.984325
11. Ferro N., Silvello G. NESTOR: A formal model for digital archives. Information Processing & Management. 2013; 49(6):1206-1240. (In Eng.) doi: https://doi.org/10.1016/j.ipm.2013.05.001
12. Constantin A., Peroni S., Pettifer S., Shotton D., Vitali F. The Document Components Ontology (Do-CO). Semantic Web. 2016; 7(2):167-181. (In Eng.) doi: https://doi.org/10.3233/SW-150177
13. Mann W.C., Thompson S.A. Rhetorical Structure Theory: Toward a functional theory of text organization. Text ‒ Interdisciplinary Journal for the Study of Discourse. 1988; 8(3):243-281. (In Eng.) doi: https://doi.org/10.1515/text.1.1988.8.3.243
14. Taboada M., Mann W.C. Rhetorical Structure Theory: Looking Back and Moving Ahead. Discourse Studies. 2006; 8(3):423-459. (In Eng.) doi: https://doi.org/10.1177/1461445606061881
15. Marcu D. The Rhetorical Parsing of Unrestricted Texts: A Surface-based Approach. Computational Linguistics. 2000; 26(3):395-448. (In Eng.) doi: https://doi.org/10.1162/089120100561755
16. Gagarin A.P., Serdyukov V.V. Dynamic ontology based retrieval and analysis of information on science and engineering. Sovremennye informacionnye tehnologii i IT-obrazovanie = Modern Information Technologies and IT-Education. 2018; 14(3):654-662. (In Russ., abstract in Eng.) doi: https://doi.org/10.25559/SITITO.14.201803.654-662
17. Fatimi S., El Saili C., Alaoui L. Semantic Oriented Text Clustering Based on RDF. 2020 International Conference on Intelligent Systems and Computer Vision (ISCV). IEEE Press, Fez, Morocco; 2020. p. 1-8. (In Eng.) doi: https://doi.org/10.1109/ISCV49265.2020.9204133
18. Khan J.A., Kumar S. Deep analysis for development of RDF, RDFS and OWL ontologies with protégé. Proceedings of 3rd International Conference on Reliability, Infocom Technologies and Optimization. IEEE Press, Noida, India; 2014. p. 1-6. (In Eng.) doi: https://doi.org/10.1109/ICRITO.2014.7014747
19. Brack A., Hoppe A., Stocker M., Auer S., Ewerth R. Requirements Analysis for an Open Research Knowledge Graph. Proceedings of the 24th International Conference on Theory and Practice of Digital Libraries (TPDL 2020). Lyon, France; 2020. p. 1-15. (In Eng.) doi: https://doi.org/10.48550/arXiv.2005.10334
20. Färber M. The Microsoft Academic Knowledge Graph: A Linked Data Source with 8 Billion Triples of Scholarly Data. In: Ghidini C., et al. (eds.) The Semantic Web – ISWC 2019. ISWC 2019. Lecture Notes in Computer Science. Vol. 11779. Springer, Cham; 2019. p. 113-129. (In Eng.) doi: https://doi.org/10.1007/978-3-030-30796-7_8
21. Brodaric B., Reitsma F., Qiang Y. SKIing with DOLCE : toward an e-Science knowledge infrastructure. In: Eschenbach C., Gruninger M. (eds.) Frontiers in Artificial Intelligence and Applications. Vol. 193. Amsterdam, The Netherlands: IOS Press; 2008. p. 208-219. Available at: https://biblio.ugent.be/publication/723935 (accessed 17.09.2021). (In Eng.)
22. Borlund P. Interactive Information Retrieval: An Introduction. Journal of Information Science Theory and Practice. 2013; 1(3):12-32. (In Eng.) doi: https://doi.org/10.1633/JISTaP.2013.1.3.2
23. Shen J., Xiao J., He X., Shang J., Sinha S., Han J. Entity Set Search of Scientific Literature: An Unsupervised Ranking Approach. Proceedings of the 41st International ACM SIGIR Conference on Research & Development in Information Retrieval (SIGIR '18). ACM, New York, NY, USA; 2018. p. 565-574. (In Eng.) doi: https://doi.org/10.1145/3209978.3210055
24. Wu J., Williams K.M., Chen H.-H., Khabsa M., Caragea C., Tuarob S., Ororbia A.G., Jordan D., Mitra P., Giles C.L. CiteSeerX: AI in a Digital Library Search Engine. AI Magazine. 2015; 36(3):35-48. (In Eng.) doi: https://doi.org/10.1609/aimag.v36i3.2601
25. Otasek D., Morris J.H., Bouças J., Pico A.R., Demchak B. Cytoscape Automation: empowering workflow-based network analysis. Genome Biology. 2019; 20:185. (In Eng.) doi: https://doi.org/10.1186/s13059-019-1758-4
Опубликована
2021-12-20
Как цитировать
GAGARIN, Andrey Petrovich; FILIMONOV, Ilja Andreevich. Обогащённая сеть проблем как ядро метаданных электронной библиотеки. Современные информационные технологии и ИТ-образование, [S.l.], v. 17, n. 4, p. 860-870, dec. 2021. ISSN 2411-1473. Доступно на: <http://sitito.cs.msu.ru/index.php/SITITO/article/view/805>. Дата доступа: 10 dec. 2022 doi: https://doi.org/10.25559/SITITO.17.202104.860-870.