Прогнозирование температуры поверхности льда с использованием больших языковых моделей в задачах предиктивного управления холодильными системами
Аннотация
В работе представлен подход к прогнозированию температуры поверхности льда на основе метода перепрограммирования предобученных языковых моделей (patch-reprogramming LLM). Объектом исследования является ледовая арена, оснащённая системой цифрового мониторинга холодильного оборудования и микроклимата. Задача прогнозирования формулируется как аппроксимация зависимости между многомерным окном наблюдений и будущим состоянием системы с горизонтом 30 минут. Используются минутные данные более чем за три месяца наблюдений, включающие температурные, энергетические и микроклиматические параметры. Проведено сравнительное моделирование с использованием статистических (ARIMA), машинных (XGBoost) и нейросетевых (LSTM, CNN, PatchTST) методов. Предложенный метод LLM с перепрограммированием патчей, основанный на замороженном ядре LLaMA-3.2-3B с добавлением адаптивных слоёв, показал наилучшие результаты: средняя абсолютная ошибка (MAE) составила 0.22 °C, а коэффициент детерминации R² достиг 0.94. Модель устойчиво воспроизводит переходные режимы и фазовые сдвиги температуры после заливок, корректно сглаживая шумовые пики и кратковременные возмущения. Результаты показывают, что механизм patch-reprogramming позволяет использовать большие языковые модели для анализа физических временных рядов без необходимости длительного дообучения. Такой подход обеспечивает баланс между точностью и устойчивостью, что делает его перспективным инструментом для внедрения в контуры предиктивного управления (MPC) холодильными системами и оптимизации энергопотребления спортивных объектов.
Литература
2. Uremović N., et al. A new framework for multivariate time series forecasting in energy management system. IEEE Transactions on Smart Grid. 2022;14(4):2934-2947. https://doi.org/10.1109/TSG.2022.3224559
3. Gruver N., et al. Large language models are zero-shot time series forecasters. Advances in Neural Information Processing Systems. 2023;36:19622-19635. https://doi.org/10.48550/arXiv.2310.07820
4. Ma Q., et al. A survey on time-series pre-trained models. IEEE Transactions on Knowledge and Data Engineering. 2024;36(12):7536-7555. https://doi.org/10.1109/TKDE.2024.3475809
5. Ansari A.F., et al. Chronos: Learning the language of time series. arXiv:2403.07815. 2024. https://doi.org/10.48550/arXiv.2403.07815
6. Jin M., et al. Time-LLM: Time series forecasting by reprogramming large language models. arXiv:2310.01728. 2023. https://doi.org/10.48550/arXiv.2310.01728
7. Wang J., et al. Dual cross-attention transformer networks for temporal predictive modeling of industrial process. IEEE Transactions on Instrumentation and Measurement. 2024;73:1-11. https://doi.org/10.1109/TIM.2024.3385820
8. Nadkarni P.M., Ohno-Machado L., Chapman W.W. Natural language processing: an introduction. Journal of the American Medical Informatics Association. 2011;18(5):544-551. https://doi.org/10.1136/amiajnl-2011-000464
9. Wu H., et al. TimesNet: Temporal 2D-variation modeling for general time series analysis. arXiv:2210.02186. 2022. https://doi.org/10.48550/arXiv.2210.02186
10. Das A., et al. A decoder-only foundation model for time-series forecasting. In: Proceedings of the 41st International Conference on Machine Learning (ICML). 2024. https://doi.org/10.48550/arXiv.2310.10688
11. Pourpanah F., et al. A review of generalized zero-shot learning methods. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2022;45(4):4051-4070. https://doi.org/10.1109/TPAMI.2022.3191696
12. Chen P., et al. Time series forecasting of temperatures using SARIMA: An example from Nanjing. IOP Conference Series: Materials Science and Engineering. 2018;394(5):052024. https://doi.org/10.1088/1757-899X/394/5/052024
13. Chen T., Guestrin C. XGBoost: A scalable tree boosting system. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '16). New York, NY, USA: Association for Computing Machinery; 2016. p. 785-794. https://doi.org/10.1145/2939672.2939785
14. Livieris I.E., Pintelas E., Pintelas P. A CNN-LSTM model for gold price time-series forecasting. Neural Computing and Applications. 2020;32(23):17351-17360. https://doi.org/10.1007/s00521-020-04867-x
15. Inan H., et al. Llama Guard: LLM-based input-output safeguard for human-AI conversations. arXiv:2312.06674. 2023. https://doi.org/10.48550/arXiv.2312.06674
16. Zhang Z. Improved Adam optimizer for deep neural networks. In: IEEE/ACM 26th International Symposium on Quality of Service (IWQoS). Banff, AB, Canada: IEEE Press; 2018. p. 1-2. https://doi.org/10.1109/IWQoS.2018.8624183
17. Lu T., Lü X., Viljanen M. Prediction of water evaporation rate for indoor swimming hall using neural networks. Energy and buildings. 2014;81:268-280. https://doi.org/10.1016/j.enbuild.2014.06.027
18. Joe J., Karava P. A model predictive control strategy to optimize the performance of radiant floor heating and cooling systems in office buildings. Applied Energy. 2019;245:65-77. https://doi.org/10.1016/j.apenergy.2019.03.209
19. Xiao-wei X. Study on the intelligent system of sports culture centers by combining machine learning with big data. Personal and Ubiquitous Computing. 2020;24:151-163. https://doi.org/10.1007/s00779-019-01307-z
20. Camacho E.F., Alba C.B. Model predictive control. Springer science & business media. 2007. 405 p. https://doi.org/10.1007/978-0-85729-398-5
21. Hou J., Li H., Nord N., Huang G. Model predictive control under weather forecast uncertainty for HVAC systems in university buildings. Energy and Buildings. 2022;257:111793. https://doi.org/10.1016/j.enbuild.2021.111793
22. Fotopoulou M.C., Drosatos P., Petridis S., Rakopoulos D., Stergiopoulos F., Nikolopoulos N. Model predictive control for the energy management in a district of buildings equipped with building integrated photovoltaic systems and batteries. Energies. 2021;14:3369. https://doi.org/10.3390/en14123369
23. Feng X., Weng C., He X., Han X., Lu L., Ren D., Ouyang M. Online state-of-health estimation for Li-Ion battery using partial charging segment based on support vector machine. IEEE Transactions on Vehicular Technology. 2019;68:8583-8592. https://doi.org/10.1109/TVT.2019.2927120
24. Martínez F., Frías M.P., Pérez M.D., Rivera A.J. A methodology for applying k-nearest neighbor to time series forecasting. Artificial Intelligence Review. 2019;52:2019-2037. https://doi.org/10.1007/s10462-017-9593-z
25. Yu Z., Haghighat F., Fung B.C., Yoshino H. A decision tree method for building energy demand modeling. Energy and Buildings. 2010;42:1637-1646. https://doi.org/10.1016/j.enbuild.2010.04.006

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Редакционная политика журнала основывается на традиционных этических принципах российской научной периодики и строится с учетом этических норм работы редакторов и издателей, закрепленных в Кодексе поведения и руководящих принципах наилучшей практики для редактора журнала (Code of Conduct and Best Practice Guidelines for Journal Editors) и Кодексе поведения для издателя журнала (Code of Conduct for Journal Publishers), разработанных Комитетом по публикационной этике - Committee on Publication Ethics (COPE). В процессе издательской деятельности редколлегия журнала руководствуется международными правилами охраны авторского права, нормами действующего законодательства РФ, международными издательскими стандартами и обязательной ссылке на первоисточник.
Журнал позволяет авторам сохранять авторское право без ограничений. Журнал позволяет авторам сохранить права на публикацию без ограничений.
Издательская политика в области авторского права и архивирования определяются «зеленым цветом» в базе данных SHERPA/RoMEO.
Все статьи распространяются на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная, которая позволяет другим использовать, распространять, дополнять эту работу с обязательной ссылкой на оригинальную работу и публикацию в этом журналe.
