
цель данного проекта — исследовать возможности генеративных нейросетей для создания изображений в стиле одного из величайших художников авангарда XX века, Василия Кандинского


картины Кандинского
стиль Кандинского был новаторским и многослойным, отличавшимся абстракцией, динамикой формы и яркостью цвета. Основное внимание было уделено передаче эмоций и впечатлений через цвета и геометрические формы


картины Кандинского
проект использует алгоритм Stable Diffusion, чтобы воссоздать уникальные визуальные элементы, характерные для картин Кандинского, в цифровом формате


картины Кандинского
процесс обучения нейросети
первым делом я собрала датасет из картин художника, изменив формат под подходящее для нейросети разрешение

далее — я подготовила среду: установила зависимости, загрузила необходимые библиотеки и проверила доступность GPU

следующий шаг — подготовка данных: создается директория для хранения данных и загружаются изображения, стилизованные под Кандинского
затем — настройка параметров обучения
для дообучения модели используется DreamBooth с LoRA-адаптацией. Основные параметры:
Модель: Stable Diffusion XL
Метод адаптации: LoRA (Low-Rank Adaptation)
Обучающий датасет: набор изображений в стиле Кандинского
Гиперпараметры: количество шагов, скорость обучения (learning rate), параметры генерации
пример настройки гиперпараметров:
следующий шаг — запуск обучения
тренировка модели проводится с использованием загруженного скрипта DreamBooth
после обучения модель используется для создания изображений в стиле Кандинского


сгенерированные изображения


сгенерированные изображения
итоговый результат
Генерация изображений позволила получить несколько вариантов в духе Кандинского, с характерными чертами:
- Геометрические формы: круги, линии, трапеции, расположенные в динамичной композиции.
- Контрастные цвета: яркие, насыщенные палитры, передающие эмоциональную выразительность.
- Абстрактный стиль: отказ от реалистичных объектов в пользу чистой формы и цвета.
- Движение и баланс: игра между хаосом и структурой, создающая визуальную динамику.


сгенерированные изображения
характеристики итоговых изображений
Композиция и геометрия
Генеративная нейросеть успешно воспроизвела характерные формы, встречающиеся в работах Кандинского: круги, прямые и изогнутые линии, многослойные фигуры.
Некоторые изображения получили четкую структурированность, другие демонстрируют хаотичные формы, создавая эффект спонтанности.


сгенерированные изображения
Цветовые решения
Присутствуют характерные для художника сочетания контрастных цветов.


сгенерированные изображения
Текстуры и детализация
DreamBooth LoRA позволил сохранить текстурные особенности оригинального стиля, при этом сохранив высокое качество деталей.
В некоторых вариациях заметно влияние работы нейросети с шумами и цветовыми артефактами, которые могут быть интерпретированы как цифровая имитация мазков кисти.
связь с первоначальной идеей проекта
Проект был направлен на исследование возможности генеративного ИИ в создании изображений, стилизованных под работы Кандинского. Итоговые изображения демонстрируют, что нейросеть:
Успешно распознала ключевые элементы стиля художника и воспроизвела их.
Добавила новые вариации, создавая оригинальные интерпретации его работ.
Внесла неожиданные решения, сохранив дух абстрактной композиции.


сгенерированные изображения
дополнительные методы улучшения
Для повышения качества изображений использовались:
Upscaling (повышение разрешения): улучшение четкости мелких деталей.
Fine-tuning: дополнительная адаптация модели для лучшего переноса стиля.
Разные текстовые промпты: экспериментирование с описанием сцены для получения разнообразных вариаций.


сгенерированные изображения
визуальный анализ итоговых изображений
Разные сгенерированные изображения отличаются как композицией, так и балансом форм.
Нейросеть создала вариации, некоторые из которых ближе к раннему периоду творчества Кандинского, а другие напоминают его поздние работы.
Экспериментирование с параметрами привело к различным уровням детализации — от минималистичных форм до сложных структурированных композиций.


сгенерированные изображения
использование нейросетей в проекте
- ChatGPT (для написания экспликации, сжатия процесса обучения нейросети и дальнейшего пошагового описания, аналитики, корректировки структуры проекта)
- Mistral.ai (в помощи написания кода)
- Upscaler (для повышения разрешения и детализации итоговых изображений)
- Adobe Photoshop AI (для обложки проекта)