Методы сжатия пространства для скрытых диффузионных моделей
Аннотация
Диффузионные модели представляют собой семейство генеративных моделей, позволяющих получить наилучшее качество во многих областях, таких как генерация изображений, видео и аудио. Из-за итеративного характера работы диффузионных моделей их скорость в разы уступает другим методам генерации из-за чего кратно увеличивается стоимость и время обучения.
В качестве решения этой проблемы было предложено сжать рабочее пространство диффузионной модели. Используя методы сжатия пространства удается решить основные проблемы диффузионных моделей, а также получать ранее недоступное качество генерации (например, генерация изображения с разрешением 4К).
На текущий момент многие новые работы по тематике сжатия пространства направлены на работу с видео, поскольку при генерации видео в высоком разрешении по-прежнему требуется слишком большое количество ресурсов, из-за чего ограничивается максимальная длительность сгенерированного видео.
Развитие методов сжатия пространства помогает решать многие практические задачи. В работе представлен обзор методов сжатия пространства для скрытых диффузионных моделей.

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Редакционная политика журнала основывается на традиционных этических принципах российской научной периодики и строится с учетом этических норм работы редакторов и издателей, закрепленных в Кодексе поведения и руководящих принципах наилучшей практики для редактора журнала (Code of Conduct and Best Practice Guidelines for Journal Editors) и Кодексе поведения для издателя журнала (Code of Conduct for Journal Publishers), разработанных Комитетом по публикационной этике - Committee on Publication Ethics (COPE). В процессе издательской деятельности редколлегия журнала руководствуется международными правилами охраны авторского права, нормами действующего законодательства РФ, международными издательскими стандартами и обязательной ссылке на первоисточник.
Журнал позволяет авторам сохранять авторское право без ограничений. Журнал позволяет авторам сохранить права на публикацию без ограничений.
Издательская политика в области авторского права и архивирования определяются «зеленым цветом» в базе данных SHERPA/RoMEO.
Все статьи распространяются на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная, которая позволяет другим использовать, распространять, дополнять эту работу с обязательной ссылкой на оригинальную работу и публикацию в этом журналe.