
Вводная часть
Мной были использованы данные о пассажирах знаменитого «Титаника», трагически затонувшего в 1912 году.
Я выбрал данные на сайте Kaggle.
Мне было интересно исследовать данные именно о «Титанике» потому, что я много слышал о том, что информация о пасажирах затонувшего судна может многое сказать об обществе того времени.
Чтобы продемонстрировать данные максимально наглядно, создал несколько графиков. Каждый из них раскрывает тот или иной тип данных с наибольшей ясностью. Это круговая и столбчатая диограммы, а также гистограмма.
Этапы работы
Данные загружались из CSV-файла, анализировались с помощью базовых статистик (среднее, медиана, распределение), а также группировались по полу, классу и возрасту для анализа выживаемости.
Весь анализ выполнен с помощью библиотек Pandas, Matplotlib и Seaborn.
Графики созданы с использованием оттенков синего цвета для того, чтобы показать связь темы исследования с морем.
Итоговые графики

Вывод
Из-за социального неравенства в общесте времён «Титаника», пассажиры первого класса имели больше шансов выжить, нежели второго и, тем более, третьего.
Женщины также имели приемущество, так как были спасены по принципу «женщины и дети в первую очередь». Соответсвенно, у детей тоже был высокий процент выживаемости, в отличие от мужчин.
Таким образом, социально-экономический статус, возраст и пол играл сильную роль в обществе времен «Титаника». Подтверждение этому мы можем найти в культуре того времени, например, в произведении А. П. Чехова «Толстый и тонкий».
Блокнот с кодом
Дополнительные материалы
Midjourney — генерация обложки