Комплексный сетевой алгоритм формирования глоссария контекстно-близких прогностических терминов
Аннотация
Сбор словаря терминов, составляющего ознакомительное проявление концепций предметной области, является одним из первых шагов к моделированию определенной области знаний. В условиях конвергентных тенденций «стыковых» междисциплинарных связей при развитии сложных систем приоритетное значение приобретает сфера моделирования информационно-коммуникационных технологий (ИКТ) и компьютерных наук. При формировании глоссария прогностических терминов применен комплексный алгоритмический подход, согласно которому интегрирован ряд условий, объединяющих возможности сетевого (графового) и семантического подходов: автоматическая генерация графов, учет ранжирования при оценке результатов поиска, контекстно-семантическая фильтрация. В результате разработан комплексный алгоритм и программный код, позволяющий формировать на базе сетевого сервиса «Википедия» глоссарий контекстно-близких специализированных терминов и тематических словосочетаний от изначально заданных терминов с ранжированием по средней арифметической оценке двух алгоритмов - PageRank и HITS. Визуализация работы алгоритма представлена на примере генерации графа от первичного термина «Quantum computing». Проанализированы данные, обосновывающие объективность представленного подхода к оценке веса термина, а также демонстрирующие результат работы алгоритма на примере расширения контекста прогностических терминов в рамках категории «Computing engineering». В качестве финальной демонстрации приведён вывод фрагмента глоссария, структурированного по категориям прогностических ИКТ. Результаты исследования будут использованы как базовый корпус знаний предметной области, необходимый для формирования обоснованных формул запросов при последующем анализе тематических статей, размещенных в библиографических базах данных и внешних сетевых ресурсах.
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Редакционная политика журнала основывается на традиционных этических принципах российской научной периодики и строится с учетом этических норм работы редакторов и издателей, закрепленных в Кодексе поведения и руководящих принципах наилучшей практики для редактора журнала (Code of Conduct and Best Practice Guidelines for Journal Editors) и Кодексе поведения для издателя журнала (Code of Conduct for Journal Publishers), разработанных Комитетом по публикационной этике - Committee on Publication Ethics (COPE). В процессе издательской деятельности редколлегия журнала руководствуется международными правилами охраны авторского права, нормами действующего законодательства РФ, международными издательскими стандартами и обязательной ссылке на первоисточник.
Журнал позволяет авторам сохранять авторское право без ограничений. Журнал позволяет авторам сохранить права на публикацию без ограничений.
Издательская политика в области авторского права и архивирования определяются «зеленым цветом» в базе данных SHERPA/RoMEO.
Все статьи распространяются на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная, которая позволяет другим использовать, распространять, дополнять эту работу с обязательной ссылкой на оригинальную работу и публикацию в этом журналe.