Исходный размер 2434x3417
Проект принимает участие в конкурсе

Введение

Проект посвящён исследованию эстетики лиминальных пространств, сформированных в рамках конкретного цифрового медиума — игрового движка Source Engine.

В отличие от обобщённой «лиминальности», в данном случае внимание сосредоточено на её специфической форме, возникающей из ограничений и особенностей движка: плоского освещения, пережатых фототекстур, характерной геометрии и особенностей рендеринга первой половины 2000-х годов. Эти технические ограничения формируют уникальный визуальный язык, отличающийся от современной фотореалистичной графики.

В качестве источника данных использовались скриншоты сцен из Garry’s Mod, основанных в свою очередь на визуальной базе Half-Life 2.

Автор также выдвинул следующую гипотезу: артефакты генеративной модели и определённая «нелогичность» изображений в сочетании с исходным стилем могут не мешать, а наоборот усиливать ощущение лиминальности, придавая сценам более выраженное чувство сна и нереальности происходящего.

В связи с этим одной из задач проекта стало не буквальное воспроизведение графики Source Engine, а предоставление модели определённой степени свободы — возможности «галлюцинировать» и тем самым усиливать и концентрировать характерную эстетику.

Цель проекта — обучить генеративную модель воспроизводить не просто лиминальные сцены, а именно этот специфический визуальный стиль, обусловленный технологическими и художественными особенностями Source Engine, и исследовать, насколько он переносим на новые, ранее не существовавшие сцены.

Датасет и исходные изображения

Примеры изображений из датасета (Garry’s Mod / Half-Life 2)

Примеры изображений из датасета (Garry’s Mod / Half-Life 2)

Примеры изображений из датасета (Garry’s Mod / Half-Life 2)

Примеры изображений из датасета (Garry’s Mod / Half-Life 2)

Для обучения был собран датасет из 40 наиболее характерных изображений. Все изображения представляют собой скриншоты, сделанные автором в игровой среде с использованием различных карт, как оригинальных, так и пользовательских, созданных с использованием оригинальных ресурсов.

Датасет включает:

— пустые интерьеры и коридоры — индустриальные пространства — городские и прибрежные сцены — подземные коммуникации

Все изображения были приведены к квадратному формату (1:1), разрешению 2048×2048 и очищены от интерфейса, чтобы исключить лишние визуальные элементы.

Процесс обучения модели

В проекте использовалась модель Stable Diffusion XL (SDXL), дообученная с помощью метода LoRA (Low-Rank Adaptation). Этот подход позволяет адаптировать модель под конкретный стиль без полного переобучения, что значительно снижает вычислительные требования.

Обучение проводилось на основе подготовленного датасета с использованием единого текстового описания (prompt), задающего стиль:

in LIMINALGMOD style, liminal space, eerie atmosphere, fluorescent lighting

Использование единого описания позволило сосредоточить обучение на визуальных характеристиках, а не на содержании отдельных сцен.

Параметры обучения:

— разрешение: 512–768 px — количество шагов: ~800–1000 — batch size: 1 — оптимизация через 8-bit Adam

Результирующая серия изображений

В результате обучения была получена серия изображений, демонстрирующих различные вариации лиминальных пространств.

Серия включает: — индустриальные зоны и заводы — пустые прибрежные территории — городские районы без людей — изолированные здания в пустом пространстве

Исходный размер 1280x720

Анализ результатов

Одним из ключевых результатов проекта стало подтверждение гипотезы о позитивной роли артефактов генерации.

В ряде изображений наблюдаются: — незначительные нарушения геометрии — странные пропорции объектов — «нелогичные» композиционные решения

Однако данные особенности не воспринимаются как ошибки. Напротив, они усиливают ощущение нереальности, создают эффект «сна» и размывают границу между игровым пространством и абстрактной средой

Таким образом, генеративные искажения работают не против стиля, а в его пользу, усиливая лиминальный эффект.

В остальном же, в сгенерированных изображениях отчётливо прослеживаются ключевые особенности движка:

— плоское, равномерное освещение — низкая контрастность и приглушённая цветовая палитра — упрощённые материалы и текстуры — характерная геометрия и «игровая» композиция пространства

Эти элементы формируют узнаваемый визуальный код, связанный с эстетикой Half-Life 2 и производных от него сред, включая Garry’s Mod.

Ограничения

К ограничениям можно отнести:

склонность к повторению композиционных решений и периодическое выпадение из нужного стиля (уход в детализированный реализм)

Тем не менее, в контексте поставленной задачи эти особенности частично становятся частью художественного языка и не снижают выразительность результата.

Использование генеративных моделей

В проекте использовались следующие инструменты:

Stable Diffusion XL — базовая генеративная модель

LoRA — метод дообучения

ChatGPT — для: — редактирование текстов — подбора и уточнения промптов — помощи с кодом для дообучения

Код обучения

Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше