Original size 652x870

Обучение генеративной нейросети стилю художника Клода Моне.

Идея проекта заключается в обучении генеративной нейросети создания рисунков на основе картин известного художника Клода Моне.

Материал обучения нейросети состоял из 35 картин художника.

Примеры обучения

Итоговая серия

промт для обеих картинок: «саt fight»

Original size 767x765

barbie

Original size 760x762

disney cartoon the lion king portait

Original size 764x769

couple sitting on a bench in a garden

Original size 759x763

chickens are taking a dinner of humans

Original size 761x763

anthropomorphic Fantastic Mr. Fox

Original size 758x761

Grinch is taking christmas gift

Анализ итоговых работ

Можно заметить, что нейросеть отлично повторяет индивидуальный стиль художника. Она способна воссоздавать схожую работу мазками, присущими Клоду Моне и подбирать похожую палитру цветов: не очень яркую, но выразительную.

работа нейросети и работа художника

Как и у любой современной нейросети, у этой модели присутствуют некоторые невнятные огрехи в картинках. Однако они не бросаются в глаза и не являются центром композиции.

Несмотря на единство стиля во всех работах, можно обратить внимание, что палитра работ крайне разнообразная. Как и художник, нейросеть создает разное настроение с помощью цвета для разных задач.

темная и яркая работа нейросети

схожие темная и яркая палитры в картинах художника

Анализ кода

Чтобы обучить нейросеть создавать картинки по написанному промту в стиле определенного художника в первую очередь нужно было собрать датасет из картин автора, в моем случае — Клода Моне, а затем обработать их. Нейросеть реализовалась на Kaggle. Для обучения нейросети потребовалось применение таких методов как Fine-tuning Stable Diffusion XL — чтобы, использовав собранный датасет изображений, улучшить генеративную модель SDXL и добиться стилистики рисунка Клода Моне, DreamBooth — способная создавать изображения на основе текстового описания, и LoRA — позволившая без сильной нагрузки вычислительными затратами и нужды обновления параметров нейросети, облегчая потребление ресурсов, сделать обучение более продуктивным.

Первым делом в коде производилась подготовка среды

Original size 991x408

Следующей частью кода является создание директории и копирование датасета в нее.

Original size 456x129

Original size 635x450

Превью

Следующим шагом было создание авто подписи для каждой картинки, чтобы нейросеть смогла распознавать конкретные объекты на изображении и в принципе что она видит.

Original size 1845x752

Далее началась тренировка модели Stable Diffusion XL. Для обучения использовалось 1000 шагов, промежуточные шаги не потребовались, а чекпоинты совершались каждые 500 шагов.

Original size 602x435

Завершающим шагом является сама генерация картинок.

Original size 470x77

Такой результат получился по промту «crows».

Original size 759x764

Описание применения генеративной модели

Искусственный интеллект применялся для обучения стилю художника и воспроизведения изображений в стилистике Клода Моне, чтобы передать атмосферу произведений. Модель базирована на stable-diffusion-xl-base-1.0.

https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0

Ссылка на Google Colab: https://colab.research.google.com/drive/1nA3SJX4u_5FXJPO5Y6yIZvWAJzaOkazm?usp=sharing

Ссылка на архив: https://drive.google.com/drive/folders/1K8Ha2Ktm1L3uvUfxqkAsdhuG5EBrTQG2?usp=sharing

Обучение генеративной нейросети стилю художника Клода Моне.

Kamilla Sabirova

artificial intelligence

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...