Цифровой сервис для подготовки аттестационных листов обучающихся
Аннотация
В статье представлен конвейер автоматизированной обработки учебной документации. Для создания числовой модели текстовой информации используется векторное представление данных, для повышения качества извлечения и предобработки данных из документов используются технологии OCR и регулярные выражения. Особое внимание уделено исследованию возможностей Chroma DB, которая предоставляет эффективные средства для хранения и поиска информации по векторным данным. На основе семантического сопоставления справок об обучении и детального сравнения по дисциплинам учебного плана реализован механизм рекомендации наиболее подходящего направления подготовки. Реализация представлена как автономный микросервис, развёрнутый в Docker и доступный через FastAPI. В результате создано гибкое решение, которое значительно сокращает время ручной сверки учебных планов и справок об обучении, обеспечивает высокую точность обнаружения сходства в наименованиях дисциплин и объёмах часов, а также легко масштабируется и интегрируется в существующие корпоративные информационные системы, благодаря стандартизированному REST-интерфейсу. Использование разработанного цифрового сервиса позволяет, с одной стороны, повысить объективность анализа учебных планов, сравнения дисциплин и выделения ключевых компетенций, что обеспечивает максимально корректное распределение обучающихся по направлениям подготовки. С другой стороны, цифровой сервис значительно ускоряет процесс подготовки документов и уменьшает нагрузку на учебные отделы образовательных организаций.

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Редакционная политика журнала основывается на традиционных этических принципах российской научной периодики и строится с учетом этических норм работы редакторов и издателей, закрепленных в Кодексе поведения и руководящих принципах наилучшей практики для редактора журнала (Code of Conduct and Best Practice Guidelines for Journal Editors) и Кодексе поведения для издателя журнала (Code of Conduct for Journal Publishers), разработанных Комитетом по публикационной этике - Committee on Publication Ethics (COPE). В процессе издательской деятельности редколлегия журнала руководствуется международными правилами охраны авторского права, нормами действующего законодательства РФ, международными издательскими стандартами и обязательной ссылке на первоисточник.
Журнал позволяет авторам сохранять авторское право без ограничений. Журнал позволяет авторам сохранить права на публикацию без ограничений.
Издательская политика в области авторского права и архивирования определяются «зеленым цветом» в базе данных SHERPA/RoMEO.
Все статьи распространяются на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная, которая позволяет другим использовать, распространять, дополнять эту работу с обязательной ссылкой на оригинальную работу и публикацию в этом журналe.
