
Рубрикатор (01) Выбор данных (02) Обработка данных и итоговые графики (03) Ссылка на код и датасет
(01) Выбор данных
Данные я выбрала на сайте Kaggle (сайт соревнований для специалистов по Data Science). Меня интересует маркетинг, поэтому я выбрала данные именно в этой сфере.
Среди типов графиков я выбрала: - карта корреляции - диаграммы рассеяния - пайчарт - столбчатые диаграммы
Я считаю, что именно эти типы графиков отображают выбранные для анализа данные в наиболее наглядном и понятном ключе.
(02) Обработка данных
Импортируем: библиотека для табличного представления и анализа данных; библиотеку для визуализации; ещё одну библиотеку для визуализации.

Считываем файл в переменную.

Выводим информацию о данных.

Получаем информацию о количестве пустых ячеек в таблице.
Строим карту корреляции.
Заголовки на карте:
«Impressions» — количество показов рекламы «Clicks» — количество кликов «Spent» — количество денег, затраченных на рекламную кампанию «Total_Conversion» — количество переходов по рекламе «Approved_Conversion» — колличесто переходов, повлекших дальнейшую сделку, покупку и прочее
карта корреляции
Данный график демонстрирует общую несостоятельность рекламной кампании всех трёх социальных сетей (они находятся в столбце «xyz_campaign_id»), поскольку к дальнейшей сделке приводят лишь ~25% всех кликов по рекламе.
пайчарт
Рассчитываем процентное соотношение кликов с показами.
Выводим шапку таблицы. И заменяем ID компании на понятные значения.
Построим диаграмму рассеяния для первой рекламной кампании («compaign_a»). В качестве основы возьмём данные из столбцов «Spent» (ось X) и «ClickPerToImpres» (ось Y).
диаграмма рассеяния
Вывод: заметно сосредоточение кликов при малых бюджетах у социальной сети «a».
Делаем то же самое, но для второй компании «compaign_b»
Вывод: более высокий бюджет компании «b» по сравнению с «a» приводит к сопоставимым результатам по кликам относительно компании «a». Пока что социальная сеть «a» показывает более эффективный результат. То есть у рекламной кампании «b» затраты существенно выше, но количество переходов по рекламе примерно такое же.
Делаем то же самое, но для второй компании «compaign_c»
Вывод: Компания «c» вложила существенно бОльшие финансы в рекламу, однако результат по кликам не возрос соразмерно этому. Интуитивно понятно, что это самая неэффективная рекламная кампания.
Группируем некоторые столбцы из исходной таблицы в новую и сразу вычисляем среднее значение для каждого столбца у каждой рекламной кампании.
Строим столбчатую диаграмму на основе данных о соотношении кликов и показов, а также рекламных кампаний.
столбчатый график 1
Вывод: можно отметить, что социальная сеть «a» показала самый эффективный результат рекламной кампании, потому что у неё процент переходов (кликов) по показанной рекламе почти такой же, что и у «b», однако бюджет, как мы помним, был существенно ниже. При этом, интуитивные догадки о неэффективности «c» пока подтверждаются.
Строим столбчатую диаграмму, отображающую соотношение переходов по рекламе («Total_Conversion») с общим количеством кликов («Clicks»).
столбчатый график 2
Вывод: компания «a» демонстрирует большее количество кликов при меньшем количестве показов. То есть ~0.5 всех кликов было именно по рекламе. У компаний «b» и «c» результаты скромнее.
Строим график, отображающий соотношение кликов по рекламе и затрат на них
столбчатый график 3
Вывод: рекламная кампания «a» при наименьших затратах добилась большего количества «рекламных» кликов. То есть данная социальная сеть получает наибольший «выхлоп» из своей рекламной кампании, так как им удаётся получать большее количество переходов.
(03) Ссылка на код и датасет