Объектно-алгебраическая модель массовой обработки структурированных больших данных

Аннотация

В статье рассматривается алгебраическая модель для массовой обработки высокоактивных структурированных больших данных. Этот тип данных характеризуется тем, что в обработку включается большинство данных, а чаще всего все данные, – высокая активность, организация данных в виде строго определенных агрегатов двух уровней: записей и файлов, имеющих имена и строго определенные структуры, а также большие объемы в гигабайтах и более. Показано, что в основу обработки рассматриваемого типа данных первоначально было положено понятие информационного массива, в настоящее время называемое файлом. Проведен ретроспективный анализ систем совместной обработки файлов, основанных на математической теории файлов, позволяющей формализовать операции над файлами и записями. Предложен объектно-алгебраический метод формализации, основанный на определении абстрактного типа данных как универсальной многоосновной алгебраической системы. Рассмотрены интуитивное и алгебраическое определения абстрактного типа данных, и приведены примеры, которые подтверждают их соответствие. Введено понятие абстрактной алгебраической машины как двухосновной алгебраической системы, одно из основных множеств которой называется структурой, а второе – типом. Сигнатуры операций и предикатов определены на этих основных множествах и их декартовом произведении. Для формализации агрегата данных первого уровня – записей, разработан абстрактный тип данных Кортеж. Определены операции над кортежами и приведены примеры, демонстрирующие аддитивную и мультипликативную операции. На основе этого абстрактного типа данных построен тип данных Запись, для которого определено понятие ключа. Введены понятия множества ключей и экземпляра этого множества. На основе абстрактного типа данных Запись введено понятие множества однотипных записей. Файл определен как фактор-множество множества однотипных записей по порожденному множеством ключей отношению эквивалентности. Введено понятие универсальной неопределенной записи, которое необходимо для формализации операций над файлами. Определены операции над файлами: сортировка, выборка, сжатие, слияние строго упорядоченных файлов и слияние нестрого упорядоченных файлов. Таким образом построена мета-конструкция универсальная алгебраическая файл-машина.

Сведения об авторах

Victor Iosifovich Munerman, Смоленский государственный университет

профессор кафедры прикладной математики и информатики физико-математического факультета, доктор технических наук, доцент

Daniel Victorovich Munerman, Смоленский государственный университет

лаборант-стажер кафедры прикладной математики и информатики физико-математического факультета

Опубликована
2025-12-29
Как цитировать
MUNERMAN, Victor Iosifovich; MUNERMAN, Daniel Victorovich. Объектно-алгебраическая модель массовой обработки структурированных больших данных. Современные информационные технологии и ИТ-образование, [S.l.], v. 21, n. 4, dec. 2025. ISSN 2411-1473. Доступно на: <http://sitito.cs.msu.ru/index.php/SITITO/article/view/1264>. Дата доступа: 09 jan. 2026
Раздел
Параллельное и распределенное программирование, грид-технологии

Наиболее читаемые статьи этого автора (авторов)

1 2 > >>