Original size 1240x1750

Анализ дорожных происшествий

PROTECT STATUS: not protected

Описание

Для исследования я использовала набор данных о дорожно-транспортных происшествиях, которые я нашла на платформе Kaggle в наборе Traffic Accidents. Этот датасет содержит подробную информацию по каждой аварии — дату и время случившегося, погодные условия, состояние дорожного покрытия, наличие освещения, число задействованных транспортных средств, количество пострадавших, степень тяжести травм и другие важные параметры.

Несмотря на то что тема дорожно-транспортных происшествий является довольно сложной и даже трагичной, мне понравился этот датасет. Он оказался очень информативным и позволил глубже понять, какие факторы чаще всего приводят к авариям. Особенно интересно было видеть, как человеческий фактор — например, невнимательность или нарушение правил — взаимодействует с внешними условиями, такими как погода или время суток.

Мне понравилось, что данные хорошо структурированы и охватывают сразу несколько аспектов ДТП: от погодных условий до времени происшествий и их основных причин. Благодаря этому можно не просто исследовать статистику, но и сделать выводы, которые потенциально могут помочь в повышении безопасности на дорогах.

big
Original size 1536x1024

В ходе анализа датасета я посчитала наиболее подходящими следующие виды графиков:

[01] Круговая диаграмма — для наглядного представления распределения погодных условий при ДТП. [02] Гистограмма — для изучения часового распределения аварий по 24-часовому циклу. [03] Линейный график — для анализа сезонной динамики числа ДТП по месяцам. [04] Горизонтальная столбчатая диаграмма — для выделения топа основных причин аварий по частоте. [05] Групповой столбчатый график — для сравнения процентного распределения уровней тяжести травм днём и ночью.

В своём проекте я использовала: pandas — для загрузки, очистки и трансформации данных в удобные табличные структуры (DataFrame); matplotlib.pyplot — для построения базовых графиков и тонкой настройки их элементов (ось, подписи, легенда и т. д.); seaborn — поверх matplotlib для быстрого создания стильных, информативных диаграмм с развёрнутой палитрой и встроенными статистическими элементами.

Original size 1920x1080

Этапы работы

Для создания цветовой палитры диаграмм были использованы оттенки красного, тесно связанные с риском и опасностью, и символизирующие предупреждение и необходимость остановки.

Original size 1920x1080
Original size 1920x1080

Загрузка датасета и предобработка данных

[1] Погодное распределение ДТП

Анализируя распределение погодных условий при ДТП, я убедилась, что, вопреки распространённому мнению, подавляющее большинство аварий (76,9%) происходит в ясную, сухую погоду. На втором месте по частоте — дождь с долей 11,2%, а снег и облачность занимают лишь 3,9% и 3,6% соответственно. Остальные состояния, включая «неизвестно», вместе составляют менее 5% всех случаев. По моему мнению, это подчёркивает, что главная опасность на дороге — не экстремальные погодные явления, а невнимательность и несоблюдение правил даже при, казалось бы, идеальном покрытии.

Original size 989x790
Original size 1920x1080

[2] Гистаграмма распределения ДТП по часам в сутках

При анализе часового распределения ДТП оказалось, что аварии случаются неравномерно: утренний «пиковый» период (7–9 ч) и вечерний «час пик» (15–17 ч) дают заметно больше инцидентов, чем другие часы. В утренние часы количество ДТП поднимается с ~2 000 случаев в 5 ч до ~10 000 в 8 ч, а утром пик приходится на 8 ч. Ещё более выражена вечерняя волна: с 13 ч аварий становится всё больше, достигая максимума в 16 ч (около 14 000 случаев), и остаётся высоким до 18 ч. В ночные и ранние утренние часы (0–5 ч) число ДТП значительно ниже — порядка 2–4 тыс., что подчёркивает влияние трафика и интенсивности движения в часы коммерческого и школьного пика.

Original size 872x552
Original size 1920x1080

В дополнение к предыдущему графику я разбила его по признаку «будни-выходные». В будние дни распределение аварий проявляет чётко выраженную двухволновую структуру, обусловленную пиковыми нагрузками на утренние и вечерние часы в связи с массовыми поездками на работу и обратно. В противоположность этому в выходные наблюдается более ровное, монотонное распределение событий: интенсивность аварий плавно повышается в светлое время суток и постепенно снижается с наступлением темноты, без отчётливых всплесков. Данный контраст указывает на то, что в будние дни ДТП в значительной мере детерминируются регламентированными маршрутами и временем поездок, тогда как в выходные трафик распределяется более непринуждённо и равномерно.

Original size 713x470
Original size 1920x1080

[3] График распределения ДТП по месяцам

После детального рассмотрения суточных и недельных паттернов аварий перейдём к сезонному анализу. На линейном графике видно, что наименьшее количество ДТП приходится на конец зимы — февраль–март, когда интенсивность дорожного движения традиционно снижается из-за холода и неблагоприятных условий. Затем с весны начинается постепенный рост: уже в мае–июне число аварий стабильно превышает 15 000, что связано с увеличением мобильности и теплой погодой. Пик регистрации ДТП наблюдается в октябре — около 18 000 случаев, вероятно, из-за ухудшения видимости и повышенной влажности, а к концу года в декабре наблюдается вторичный подъём, обусловленный праздничным трафиком. Таким образом, сезонность явно проявляет свой вклад в интенсивность аварий: минимум в глубокой зиме, плавный рост в тёплое время и максимум в период переходной осенней погоды.

Original size 717x475
Original size 1920x1080

[4] Диаграмма основных причин ДТП

Чаще всего аварии происходят из-за того, что водители не уступают дорогу, в результате чего происходит ДТП. На втором месте — когда едут буквально впритык к впереди идущему авто, не оставляя запаса для экстренного торможения. Третья частая ошибка — попытки проскочить на красный или игнорировать светофор. Ещё нередко водители внезапно поворачивают без включённого поворотника или не сбрасывают скорость при приближении к препятствию, что тоже приводит к серьёзным последствиям.

Original size 989x590
Original size 1920x1080

[5] График распределения травм по погодным условиям и времени суток

Я проанализировала диаграмму и заметила, что ночью аварии всегда чуть более травмоопасны. Даже в ясную погоду среднее число травм растёт с примерно 0,4 днём до почти 0,5 ночью. Аналогичная история наблюдается в облачную и дождливую погоду — ночные столкновения приносят больше травм, чем дневные. Интересно, что при снегопаде разница тоже не заглушается, а в остальных условиях ночные аварии и вообще вдвое чаще заканчиваются травмами, чем днём. В общем, независимо от погоды, поездка в темноте оказывается более опасной.

Original size 691x562
Original size 1920x1080

Вывод

ДТП чаще всего происходят в дневное время, при хорошей погоде, и в будние дни, что указывает на человеческий фактор как основную причину аварий. Основные источники риска — нарушения правил дорожного движения, спешка и невнимательность. Меры по повышению безопасности должны быть сосредоточены на обучении водителей, усилении контроля за соблюдением ПДД и управлении транспортными потоками в часы пик.

Анализ дорожных происшествий
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more