Методы сжатия пространства для скрытых диффузионных моделей

Аннотация

Диффузионные модели представляют собой семейство генеративных моделей, позволяющих получить наилучшее качество во многих областях, таких как генерация изображений, видео и аудио. Из-за итеративного характера работы диффузионных моделей их скорость в разы уступает другим методам генерации из-за чего кратно увеличивается стоимость и время обучения.
В качестве решения этой проблемы было предложено сжать рабочее пространство диффузионной модели. Используя методы сжатия пространства удается решить основные проблемы диффузионных моделей, а также получать ранее недоступное качество генерации (например, генерация изображения с разрешением 4К).
На текущий момент многие новые работы по тематике сжатия пространства направлены на работу с видео, поскольку при генерации видео в высоком разрешении по-прежнему требуется слишком большое количество ресурсов, из-за чего ограничивается максимальная длительность сгенерированного видео.
Развитие методов сжатия пространства помогает решать многие практические задачи. В работе представлен обзор методов сжатия пространства для скрытых диффузионных моделей.

Сведения об авторах

Vladimir Gennadievich Abramov, Московский государственный университет имени М.В. Ломоносова

доцент кафедры алгоритмических языков факультета вычислительной математики и кибернетики, кандидат физико-математических наук, доцент

Mikhail Alexeyevich Gromov, Московский государственный университет имени М.В. Ломоносова

аспирант кафедры алгоритмических языков факультета вычислительной математики и кибернетики

Опубликована
2025-04-28
Как цитировать
ABRAMOV, Vladimir Gennadievich; GROMOV, Mikhail Alexeyevich. Методы сжатия пространства для скрытых диффузионных моделей. Современные информационные технологии и ИТ-образование, [S.l.], v. 21, n. 1, apr. 2025. ISSN 2411-1473. Доступно на: <http://sitito.cs.msu.ru/index.php/SITITO/article/view/1189>. Дата доступа: 02 june 2025
Раздел
Исследования и разработки в области новых ИТ и их приложений