Original size 2480x3500

Обучение генеративной нейросети Stable Diffusion под стиль Кандинского

PROTECT STATUS: not protected
15

цель данного проекта — исследовать возможности генеративных нейросетей для создания изображений в стиле одного из величайших художников авангарда XX века, Василия Кандинского

картины Кандинского

стиль Кандинского был новаторским и многослойным, отличавшимся абстракцией, динамикой формы и яркостью цвета. Основное внимание было уделено передаче эмоций и впечатлений через цвета и геометрические формы

картины Кандинского

проект использует алгоритм Stable Diffusion, чтобы воссоздать уникальные визуальные элементы, характерные для картин Кандинского, в цифровом формате

картины Кандинского

процесс обучения нейросети

первым делом я собрала датасет из картин художника, изменив формат под подходящее для нейросети разрешение

big
Original size 2549x493

далее — я подготовила среду: установила зависимости, загрузила необходимые библиотеки и проверила доступность GPU

big
Original size 1142x210

следующий шаг — подготовка данных: создается директория для хранения данных и загружаются изображения, стилизованные под Кандинского

Original size 1086x172

затем — настройка параметров обучения

для дообучения модели используется DreamBooth с LoRA-адаптацией. Основные параметры:

Модель: Stable Diffusion XL

Метод адаптации: LoRA (Low-Rank Adaptation)

Обучающий датасет: набор изображений в стиле Кандинского

Гиперпараметры: количество шагов, скорость обучения (learning rate), параметры генерации

пример настройки гиперпараметров:

Original size 1139x463

следующий шаг — запуск обучения

тренировка модели проводится с использованием загруженного скрипта DreamBooth

после обучения модель используется для создания изображений в стиле Кандинского

сгенерированные изображения

сгенерированные изображения

итоговый результат

Генерация изображений позволила получить несколько вариантов в духе Кандинского, с характерными чертами:

- Геометрические формы: круги, линии, трапеции, расположенные в динамичной композиции.

- Контрастные цвета: яркие, насыщенные палитры, передающие эмоциональную выразительность.

- Абстрактный стиль: отказ от реалистичных объектов в пользу чистой формы и цвета.

- Движение и баланс: игра между хаосом и структурой, создающая визуальную динамику.

сгенерированные изображения

характеристики итоговых изображений

Композиция и геометрия

Генеративная нейросеть успешно воспроизвела характерные формы, встречающиеся в работах Кандинского: круги, прямые и изогнутые линии, многослойные фигуры.

Некоторые изображения получили четкую структурированность, другие демонстрируют хаотичные формы, создавая эффект спонтанности.

сгенерированные изображения

Цветовые решения

Присутствуют характерные для художника сочетания контрастных цветов.

сгенерированные изображения

Текстуры и детализация

DreamBooth LoRA позволил сохранить текстурные особенности оригинального стиля, при этом сохранив высокое качество деталей.

В некоторых вариациях заметно влияние работы нейросети с шумами и цветовыми артефактами, которые могут быть интерпретированы как цифровая имитация мазков кисти.

связь с первоначальной идеей проекта

Проект был направлен на исследование возможности генеративного ИИ в создании изображений, стилизованных под работы Кандинского. Итоговые изображения демонстрируют, что нейросеть:

Успешно распознала ключевые элементы стиля художника и воспроизвела их.

Добавила новые вариации, создавая оригинальные интерпретации его работ.

Внесла неожиданные решения, сохранив дух абстрактной композиции.

сгенерированные изображения

дополнительные методы улучшения

Для повышения качества изображений использовались:

Upscaling (повышение разрешения): улучшение четкости мелких деталей.

Fine-tuning: дополнительная адаптация модели для лучшего переноса стиля.

Разные текстовые промпты: экспериментирование с описанием сцены для получения разнообразных вариаций.

сгенерированные изображения

визуальный анализ итоговых изображений

Разные сгенерированные изображения отличаются как композицией, так и балансом форм.

Нейросеть создала вариации, некоторые из которых ближе к раннему периоду творчества Кандинского, а другие напоминают его поздние работы.

Экспериментирование с параметрами привело к различным уровням детализации — от минималистичных форм до сложных структурированных композиций.

сгенерированные изображения

использование нейросетей в проекте

- ChatGPT (для написания экспликации, сжатия процесса обучения нейросети и дальнейшего пошагового описания, аналитики, корректировки структуры проекта)

- Mistral.ai (в помощи написания кода)

- Upscaler (для повышения разрешения и детализации итоговых изображений)

- Adobe Photoshop AI (для обложки проекта)

Обучение генеративной нейросети Stable Diffusion под стиль Кандинского
15
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more