Концепция
Для данного проекта я использовал набор данных с сайта Kaggle.com, который включает список самых популярных видеоигр за период с 1980 по 2023 год.
Работа с этими данными была увлекательной, особенно потому, что я обучаюсь в области гейм-дизайна. Анализ статистики игр, которые мне лично нравятся, а также открытие для себя новых игр, представлял особый интерес.
Виды получившихся графиков
- Распределение рейтингов игр (Violin Plot).
- Количество отзывов по годам (Bar Plot).
- Средний рейтинг по жанрам (Violin Plot).
- Топ-10 игр по количеству отзывов (Dot Plot).
- Сравнение количества отзывов по жанрам (Horizontal Bar Plot).
- Количество игр, выпущенных по годам (Step Plot).
- Соотношение количества желаемого к покупке (wishlist) и рейтинга (Hexbin Plot).
- 100 Самых популярных игр по рейтингу снизу (Bubble Plot).
Особенности графиков:
• Использование единой цветовой палитры для лучшей визуальной согласованности.
• Добавление заголовков, меток осей и сетки для улучшения читаемости.
• Размеры графиков подобраны так, чтобы обеспечить оптимальное отображение информации.
Прошу заметить: в графиках «Количество отзывов по годам» и «Количество игр выпущенных по годам» наблюдается спад, так-как список заканчивается на 2023 году, и дальше даты не учитывает.
На самом деле рост этих графиков до сих пор наблюдается!
Этапы работы
- Загрузка данных из файла CSV.
- Выбор интересующих столбцов.
- Преобразование значений столбцов в числовой формат и дату.
- Очистка данных от некорректных записей.
- Обработка и преобразование данных (например, количество команд разработчиков).
- Визуализация данных с помощью различных типов графиков.
Графики
Распределение рейтингов
Количество отзывов по годам
Средний рейтинг по жанрам
Топ-10 игр по количеству отзывов
Сравнение количества отзывов по жанрам
Количество игр, выпущенных по годам
Соотношение в wishlist и рейтинга
Соотношение Топ-100 игр снизу с их рейтингом