
Вашему вниманию представляется анализ данных со списком фильмов всех времен с самым высоким рейтингом по версии IMDb. Я выбрала именно эти данные, поскольку тема кино меня интересует с детства. Фильмы давно стали неотъемлемой частью нашей жизни, поэтому, данный анализ будет интересен многим пользователям сети. Моя работа поможет глубже проанализировать, какое кино нравится людям больше всего, какую оценку мы ставим чаще остальных и так далее. Данные я нашла на сайте «Kaggle», в котором соревнуются специалисты по Data Science со всего мира.
В своем исследовании я использовала несколько типов графиков: Гистограммы, круговые диаграммы и точечные диаграммы, такая разновидность графиков создана для того, чтобы наилучшим образом представить информацию и выявить важные закономерности или тенденции.
Датасет
Этапы работы
Для начала я ознакомилась с самой базой данных (в ней 100 строк и 9 столбцов), выделила интересующие меня части и стала думать, как создать для нее наилучшую визуализацию.

Для внешнего вида графиков я выбрала спокойные и понятные цвета, для того, чтобы зрителю было максимально легко ознакомляться с информацией.
Гистограммы

Точечная диаграмма
Круговые диаграммы
Выводы
В ходе выполнения работы я не только научилась создавать визуализацию анализа данных, но и открыла для себя много нового: например, узнала, что с течением времени, хронометраж фильмов стабильно увеличивается, или же, что наибольшее количество фильмов в топе относится к жанру «драма». Лично для меня задание оказалось очень полезным и интересным.
Блокнот
Описание применения генеративной модели
В ходе написания кодов я сталкивалась с некоторыми трудностями, с ними я обращалась к чат-боту «Chat GPT"(https://gpt-chatbot.ru/)
Обложка была сгенерирована нейросетью ideogram.ai