
Для анализа я выбрала набор данных о сериалах Netflix, который был получен из открытого источника data.world. Этот набор данных содержит информацию о различных сериалах, включая их жанр, статус, год премьеры, количество сезонов и рейтинги IMDB. Я решила проанализировать эти данные, так как индустрия сериалов продолжает активно развиваться и привлекает внимание широкой аудитории. Анализ таких данных может дать полезные инсайты как для создателей контента, так и для зрителей. Например, можно выяснить, какие жанры более популярны, какие шоу имеют лучшие рейтинги, и как изменяется количество выпускаемых шоу в зависимости от года. Эти данные помогают понять предпочтения аудитории и тенденции в производстве телешоу.
Анализ и виды графиков
Я решила использовать несколько видов графиков для представления различных аспектов данных:
Круговые диаграммы: для отображения распределения статусов сериалов (законченные, выходящие и тд.) по жанрам. Линейные графики: для анализа динамики выпуска шоу по годам и по месяцам. Столбчатую диаграмму: для анализа популярности жанров. Эти виды графиков были выбраны, потому что они позволяют наглядно представить данные и выявить важные тенденции и закономерности.
Этапы работы
Для начала я определилась с видами анализов. Использовала среду Google Colab. Дальше начала писать код, использовала библиотеку pandas для анализа данных и matplotlib.pyplot для создания графиков:
import pandas as pd import matplotlib.pyplot as plt
Далее загружала данные для анализа:
url = ’https://query.data.world/s/lfwws7jon66sriobu3w5aucwyfs6g5?dws=00000′ df = pd.read_excel (url)
Описание применения генеративной модели
Дальнейшие операции для разных графиков отличались. Для их создания также пользовалась ChatGPT в основном для четкой структуры и для улучшения внешнего вида графиков. Также использовала ideogram для создания обложки проекта.
Популярность жанров
Динамика выхода сериалов по жанрам и годам
Распределение сериалов по месяцам выпуска
Распределения статусов сериалов по жанрам