Original size 2480x3500

Обучение генеративной нейросети под объект

PROTECT STATUS: not protected
5

Концепция

Цель моего проекта — обучить нейросеть понимать и воспроизводить изображение объекта: лошадей. Для обучения используются фотографии лошадей в различных позах, ракурсах и локациях. В разделе «Исходные изображения» представлены фото, включенные в базу данных для анализа и обучения.

Исходные изображения

big
Original size 4256x2832
big
Original size 800x495

Сгенерированные изображения

big
Original size 1024x1024

A photo of TOK horse a horse running in a field of flowers

Original size 1024x1024

A photo of TOK horse a horse standing in a field with the sun setting behind it

Original size 3500x1109

Итоговая серия изображений представляет собой генерацию фотореалистичного объекта — лошадей.

Сгенерированные изображения демонстрируют успехи в имитации такого сложного объекта, как лошадь. Получилось создать фото с разными ракурсами, планами, локациями и светом. Особенно удачно нейросети удалось передать гриву, отлив шерсти, а также динамику поз лошадей, присутствующую на референсах в базе данных.

Работа с кодом

Original size 1131x590

Просмотр датасета (первые 5 изображений)

Было собрано 20 изображений с лошадьми для базы данных. Подбирались фотографии с разными ракурсами, позами, фоном, планами и другими характеристиками.

Original size 3500x3348

Генерируем описание к изображению

Original size 1123x602

Обучение (500 шагов, сохранение каждые 250 шагов)

Код и датасет

Файл с кодом: https://disk.yandex.ru/d/cbB3TUQYlCy8kw

Датасет с фотографиями: https://disk.yandex.ru/d/NBhcSbswuP1Nmg

Обучение генеративной нейросети под объект
5
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more