Разработка банка алгоритмов и метода поиска программ в соответствии с требованиями пользователей

Anna Alexeyevna Kulikovskaya; Elizaveta Alexandrovna Dorenskaya; Yuri Alexeyevich Semenov

doi:10.25559/SITITO.16.202001.81-89

Anna Alexeyevna Kulikovskaya Институт теоретической и экспериментальной физики имени А.И. Алиханова Национального исследовательского центра "Курчатовский институт"; Национальный исследовательский центр "Курчатовский институт" http://orcid.org/0000-0002-0214-1697
Elizaveta Alexandrovna Dorenskaya Институт теоретической и экспериментальной физики имени А.И. Алиханова Национального исследовательского центра "Курчатовский институт" http://orcid.org/0000-0002-4249-5131
Yuri Alexeyevich Semenov Институт теоретической и экспериментальной физики имени А.И. Алиханова Национального исследовательского центра "Курчатовский институт"; Московский физико-технический институт (национальный исследовательский университет) http://orcid.org/0000-0002-3855-3650

DOI: https://doi.org/10.25559/SITITO.16.202001.81-89

Аннотация

Создан банк программ на языке Perl. Каждый программный модуль снабжен описанием и списком ключевых слов. По данным ключевым словам, пользователь может указать область, к которой относится интересующая его программа. В данной статье рассматривается алгоритм, выполняющий поиск программы в созданной базе данных. Поиск основан на выявлении совпадений между ключевыми словами, которые были указаны авторами программ и выбраны пользователем из предлагаемого списка диалоговым методом. Пользователь последовательно добавляет ключевые слова и в интерактивном режиме может посмотреть, нашлась ли интересующая его программа. Исследования выполнены в ФГБУ "Институт теоретической и экспериментальной физики имени А.И. Алиханова Национального исследовательского центра "Курчатовский институт". Предлагаемый алгоритм гарантирует однозначность поиска. Многократное использование программ разными людьми с использованием различных исходных данных приводит к уменьшению количества ошибок. При обнаружении неправильной работы программ или при нахождении ошибок в коде пользователи имеют возможность сообщить об этом администратору базы данных, либо автору программы. Предполагается, что пользователи, при отсутствии желаемой программы в базе данных, могут написать ее и предложить для добавления в существующий банк. Таким образом, количество программ будет расти. Статистический анализ показывает, что данный метод можно использовать и для значительно большего числа программ в базе (порядка 10000 и более), чем существует на текущий момент.

Сведения об авторах

Anna Alexeyevna Kulikovskaya, Институт теоретической и экспериментальной физики имени А.И. Алиханова Национального исследовательского центра "Курчатовский институт"; Национальный исследовательский центр "Курчатовский институт"

младший научный сотрудник; аспирант

Elizaveta Alexandrovna Dorenskaya, Институт теоретической и экспериментальной физики имени А.И. Алиханова Национального исследовательского центра "Курчатовский институт"

инженер-программист

Yuri Alexeyevich Semenov, Институт теоретической и экспериментальной физики имени А.И. Алиханова Национального исследовательского центра "Курчатовский институт"; Московский физико-технический институт (национальный исследовательский университет)

ведущий научный сотрудник; заместитель заведующего кафедрой информатики и вычислительных сетей, Институт нано-, био-, информационных, когнитивных и социогуманитарных наук и технологий, кандидат физико-математических наук

Литература

[1] Kim J. A Statistical Ontology-Based Approach to Ranking for Multiword Search: dis. . Ph.D. (Computer Science). University of Southern California, ProQuest LLC, Ann Arbor; 2013. (In Eng.).
[2] Beall J. The Weaknesses of Full-Text Searching. Journal of Academic Librarianship. 2008; 34(5):438-444. (In Eng.) DOI: https://doi.org/10.1016/j.acalib.2008.6.7
[3] Shannon G. Cognition-Based Approaches for High-Precision Text Mining: dis. . Ph.D. (Engineering). Missouri University of Science and Technology, ProQuest LLC, Ann Arbor; 2017. (In Eng.).
[4] Gurin N.I., Zhuk Ya.A. The Information System Semantic Network to a Relational Database Table Generator. Proceedings of BSTU. 2015; (6):181-185. Available at: https://elib.belstu.by/bitstream/123456789/15302/1/generator-semanticheskoi-seti-informacionnoi-sistemy-v-tablicu-
relyacionnoi-bazy-dannyx-n.-i.-gurin-ya.-a.-zhuk.pdf (accessed 17.1.2020). (In Russ., abstract in Eng.).
[5] Dorenskaya E.A., Semenov Yu.A. About the Programming Techniques, Oriented to Minimize Errors. Sovremennye informacionnye tehnologii i IT-obrazovanie = Modern Information Technologies and IT-Education. 2017; 13(2):50-56. (In Russ., abstract in Eng.) DOI: https://doi.org/10.25559/SITITO.2017.2.226
[6] Johns B.T., Jamieson R.K. A Large-Scale Analysis of Variance in Written Language. Cognitive Science. 2018; 42(4):1360-1374. (In Eng.) DOI: https://doi.org/10.1111/cogs.12583
[7] Dikovitskiy V.V. Improving Quality of Visualization by Changing the Convergence Angle. Proceedings of Kola Science Centre of the Russian Academy of Sciences. 2017; 8(3-8):109-115. Available at: https://www.elibrary.ru/item.asp?id=35093836 (accessed 17.1.2020). (In Russ., abstract in Eng.).
[8] Dorenskaya E.A., Semenov Yu.A. New Methods of Minimizing the Errors in the Software. In: CEUR Workshop Proceedings: Proceedings of the VIII International Conference “Distributed Computing and Grid-technologies in Science and Education” (GRID 2018). Dubna, Moscow region, Russia, September 10 -14, 2018, vol.2267. p. 150-154. Available at: http://ceur-ws.org/Vol-2267/150-154-paper-27.pdf (accessed 17.1.2020). (In Eng.).
[9] Eidlin A.A., Eidlina M.A., Samsonovich A.V. Analyzing Weak Semantic Map of Word Senses. Procedia Computer Science. 2018; 123:140-148. (In Eng.) DOI: https://doi.org/10.1016/j.procs.2018.1.23
[10] Yan E., Williams J., Chen Z. Understanding disciplinary vocab-ularies using a full-text enabled domain-independent term extraction approach. PLoS ONE. 2017; 12(11):e0187762. (In Eng.) DOI: https://doi.org/10.1371/journal.pone.187762
[11] Vyugin V.V. Discrete Mathematics. Part 1. Elements of Set Theory. Combinatorics. Functions of the Algebra of Logic. Moscow; 2009. Available at: http://iitp.ru/upload/publications/5948/discret1.pdf (accessed 17.1.2020). (In Russ.).
[12] Zhang H., Magooda A., Litman D., Correnti R., Wang E., Matsumura L.C., Howe E., Quintana R. eRerevise: Using Natural Language Processing to Provide Formative Feedback on Text Evidence Usage in Student Writing. Proceedings of the AAAI Conference on Artificial Intelligence. 2019; 33(01):9619-9625. (In Eng.) DOI: https://doi.org/10.1609/aaai.v33i01.33019619
[13] Kintz S., Wright H.H. Semantic Knowledge Use in Discourse: Influence of Age. Discourse Processes. 2017; 54(8):670-681. (In Eng.) DOI: https://doi.org/10.1080/0163853X.2016.1150652
[14] Snyder R.M. Ideas on Learning a New Language Intertwined with the Current State of Natural Language Processing and Computational Linguistics. In: P. Smith (ed.) Proceedings of the 2015 ASCUE Summer Conference. 48th, Myrtle Beach, SC; 2015. p. 75-85. Available at: https://files.eric.ed.gov/fulltext/ED571276.pdf (accessed 17.1.2020). (In Eng.).
[15] Crossley S.A., Skalicky S., Dascalu M., McNamara D.S., Kyle K. Predicting Text Comprehension, Processing, and Familiarity in Adult Readers: New Approaches to Readability Formulas. Discourse Processes. 2017; 54(5-6):340-359. (In Eng.) DOI: https://doi.org/10.1080/0163853X.2017.1296264
[16] Crossley S.A., Allen L.K., Kyle K., McNamara D.S. Analyzing Discourse Processing Using a Simple Natural Language Processing Tool. Discourse Processes. 2014; 51(5-6):511-534. (In Eng.) DOI: https://doi.org/10.1080/0163853X.2014.910723
[17] Sedova Ya.A. Development of Intellectual Search System for Scientific Social Networks. Vestnik of Astrakhan State Technical University. Series: Management, Computer Sciences and Informatics. 2015; (4):124-133. Available at: https://www.elibrary.ru/item.asp?id=24891131 (accessed 17.1.2020). (In Russ., abstract in Eng.).
[18] Kotov E.M., Tselykh A.N. Research of Models for Information Retrieval. Izvestiya SFedU. Engineering Sciences. 2009; ( 4):163-168. Available at: https://www.elibrary.ru/item.asp?id=12834639 (accessed 17.1.2020). (In Russ., abstract in Eng.).
[19] Pismak A.E., Kharitonova A.E., Tsopa E.A., Klimenkov S.V. Evaluation of semantic similarity for sentences in natural language by mathematical statistics methods. Scientific and Technical Journal of Information Technologies, Mechanics and Optics. 2016; 16(2):324-330. (In Russ., abstract in Eng.) DOI: https://doi.org/10.17586/2226-1494-2016-16-2-324-330
[20] Bermudez S.J.G., Kerimova S.U. About Method of Determination of Textual Proximity, Based on the Semantics Classe. Inženernyj vestnik Dona = Engineering journal of Don. 2016; ( 4):70. Available at: https://www.elibrary.ru/item.asp?id=28945370 (accessed 17.1.2020). (In Russ., abstract in Eng.).
[21] Ustalov D.A., Sozykin A.V. A Software System for Automatic Construction of a Semantic Word Network. Bulletin of the South Ural State University. Series "Computational Mathematics and Software Engineering". 2017; 6(2):69-83. (In Russ., abstract in Eng.) DOI: https://doi.org/10.14529/cmse170205
[22] Savotchenko S.E. Indicators of Quality Assessment Results Pertinence Automated Search in Information Systems. Belgorod State University. Scientific Bulletin. Series: Economics. Information technologies. 2016; ( 9):135-138. Available at: https://www.elibrary.ru/item.asp?id=27176703 (accessed 17.1.2020). (In Russ., abstract in Eng.).
[23] Savotchenko S.E., Proskurina E.A. Mathematical Methods of Investigation of Semantic Features of Search Subsystem in Automated Information Systems. Vestnik Sibirskogo Instituta Biznesa I Informatsionnykh Tekhnologii. 2015; ( 1):69-76. Available at: https://www.elibrary.ru/item.asp?id=23567314 (accessed 17.1.2020). (In Russ., abstract in Eng.).
[24] Fedotov A.M., Barakhnin V.B. Problems of Information Retrieval: History and Technologies. Vestnik NSU. Series: Information Technologies. 2009; 7(2):3-14. Available at: https://www.elibrary.ru/item.asp?id=12916756 accessed 17.1.2020). (In Russ., abstract in Eng.).
[25] Grekova L.V. Information Search in Computer Science and Library Science. Belgorod State University. Scientific Bulletin. Series: Economics. Information technologies. 2013; ( 1):95-100. Available at: https://www.elibrary.ru/item.asp?id=20926084 (accessed 17.1.2020). (In Russ., abstract in Eng.).
[26] Kenett Y.N., Levi E., Anaki D., Faust M. The semantic distance task: Quantifying semantic distance with semantic network path length. Journal of Experimental Psychology: Learning, Memory, and Cognition. 2017; 43(9):1470-1489. (In Eng.) DOI: https://doi.org/10.1037/xlm0000391
[27] Mimeau C., Laroche A., Deacon S.H. The Relation between Syntactic Awareness and Contextual Facilitation in Word Reading: What Is the Role of Semantics? Journal of Research in Reading. 2019; 42(1):178-192. (In Eng.) DOI: https://doi.org/10.1111/1467-9817.12260
[28] Gagné C.L., Spalding T.L. Effects of morphology and semantic transparency on typing latencies in english compound and pseudocompound words. Journal of Experimental Psychology: Learning, Memory, and Cognition. 2016; 42(9):1489-1495. (In Eng.) DOI: https://doi.org/10.1037/xlm0000258
[29] Uba S.Ya. Semantic Categories of Reporting Verbs across Four Disciplines in Research Articles. English Language Teaching. 2020; 13(1):89-98. (In Eng.) DOI: https://doi.org/10.5539/elt.v13n1p89

Разработка банка алгоритмов и метода поиска программ в соответствии с требованиями пользователей

Аннотация

Сведения об авторах

Литература

Наиболее читаемые статьи этого автора (авторов)