Дообучение больших языковых моделей в контексте архитектур мониторинга научно-технической информации

  • Ilja Andreevich Filimonov Московский авиационный институт (национальный исследовательский университет) http://orcid.org/0000-0002-2307-0453

Аннотация

Статья посвящена исследованию и опытной реализации алгоритмов и архитектур мониторинга научно-технической информации, направленных на минимизацию времени обслуживания мониторинга и повышение доступности мониторинга как инструмента персонально-ориентированного информирования и поддержки аналитической деятельности пользователя по интересующим его вопросам научно-технического развития. Предложен алгоритм модели мониторинга научно-технических публикаций в сети Интернет, позволяющий параллельно с обработкой метаданных базы знаний проводить генерацию прогнозных отчётов. Разработан механизм автоматического вывода прогнозных справок о развитии отрасли науки и техники, построенный на базе искусственной нейронной сети, основанной на принципах большой языковой модели, дообученной на фактах из сети понятий разработанной автором базы знаний. Разработан алгоритм применения дообученной искусственной нейронной сети типа «Большая языковая модель (Large Language Model)» на 1000-узловом видеопроцессоре для распознавания научно-технических проблем, а также формирования аннотаций и отчётов о состоянии области техники, позволяющий ускорить процесс мониторинга в десятки раз по сравнению с применением общедоступных необучаемых сетей, работающих на CPU. Предложен способ эксплуатации дообученной искусственной нейронной сети, основанный на обработке большой языковой модели с применением видеопроцессора с поддержкой технологии CUDA и размещением большой языковой модели локально в ОЗУ. Полученные автором результаты позволяют выдвинуть новый класс информационно-справочных систем – персонально-адаптируемые информационно-справочные и аналитические мониторинговые системы, обеспечивающие накопление и актуализацию знаний по вопросам развития науки и техники в соответствии с индивидуальными интересами и предпочтениями пользователя.

Сведения об авторе

Ilja Andreevich Filimonov, Московский авиационный институт (национальный исследовательский университет)

ассистент кафедры вычислительных машин, систем и сетей Института № 3 "Системы управления, информатика и электроэнергетика"

Опубликована
2024-12-15
Как цитировать
FILIMONOV, Ilja Andreevich. Дообучение больших языковых моделей в контексте архитектур мониторинга научно-технической информации. Современные информационные технологии и ИТ-образование, [S.l.], v. 20, n. 4, dec. 2024. ISSN 2411-1473. Доступно на: <http://sitito.cs.msu.ru/index.php/SITITO/article/view/1160>. Дата доступа: 26 mar. 2025