Анализ здоровья больших городов на Mediiia

Введение

На платформе data.world я наткнулась на датасет «Big Cities Health», который показался мне интересным и важным выбором для анализа. Для данного анализа я использовала язык программирования Python, а также Google Colab.

Этот набор данных иллюстрирует состояние здоровья в 26 крупнейших и наиболее урбанизированных городах страны, зафиксированное 34 показателями здоровья и шестью показателями демографической ситуации. Эти показатели отражают некоторые из основных причин заболеваемости и смертности в Соединенных Штатах и основные приоритеты национальных, государственных и местных органов здравоохранения.

Данные общественного здравоохранения были получены по девяти всеобъемлющим категориям: ВИЧ/СПИД, рак, питание/физическая активность/ожирение, безопасность пищевых продуктов, инфекционные заболевания, здоровье матери и ребенка, табак, травмы/насилие и поведенческое здоровье/злоупотребление психоактивными веществами.

Обработка данных

На первом этапе работы я загрузила данный датсет в Google Colab. Для проверки корректности открытия файла я решила просмотреть его первые строки.

Исходный размер 2872x1568

Цветовая палитра для стилизации графиков, созданная с помощью сайта coolors.co

Исходный размер 2880x1348

Для построения графиков и их стилизации я использовала сайт designcap.ru

В шаблона заносила данные и цветовую палитру. Для подписей к графиком воспользовалась программой Adobe illustrator

1. Анализ показателя здоровья в зависимости от года

Исходный размер 2251x2251

По результатом становится понятно, что наиболее высокий коэффициент здорового населения приходится на 2012 год.

Анализ осуществлялся по всем приведенным характеристикам в датсет (заболевания, вредные привычки и полезные продукты)

Исходный размер 2302x408

2. Анализ покателей здорового населения городов с сортировкой по полу

Исходный размер 2251x2251

По результатом анализа видно, что в каждом из 26-ти городов по статистике преобладает здоровое у женского пола.

Исходный размер 1934x212

3. Анализ показателей здорового населения наиболее крупных городов по критерию отсутсвие заболеваний и сортировки по полу

Исходный размер 2086x2188

Исходный размер 1758x468

4. Анализ общего показателя здорового населения по всем городам

Исходный размер 2469x2590

Исходный размер 1628x210

Результатом анализа является наиболее высокий показатель у Phoenix

Описание применения генеративной модели

1. Генерация кода на Pythone

Для генерации кода я использовала коды в предложенных вариантах графиков с Google Colab с учетом изменений видов графиков и критерий для анализа.

С данной задачей мне помог сайт replit.com и функция Assistant Ai. Благодаря этому была ускорена работа с кодом и созданием разных видов графиков.

Исходный размер 2734x402

Рекомендованные графики в Google Colab

Исходный размер 1678x1198

Промт для Replit ai

2. Стилизация графиков

Для стилизации графиков и изменений цветовой гаммы я использовала сайт designcap.com, это позволило упростить работу с кодом и быстрее воссоздать графики с учетом выведенных переменных из Google Colab.

Переменные и их значения, расположенные на графиках я выводила через функцию print

Исходный размер 2880x1626

Design cap

Для добавления подписей я использjвала программу Adobe illustrator.

Это позволило упростить работу с кодом

Исходный размер 2854x1664

Ссылки

https://replit.com/~
https://coolors.co/
https://www.designcap.com/
Блокнот с кодом и датасет: https://drive.google.com/drive/folders/1Zum75BcS_w66Tm-rjknbrpi1Yeg74bb6?usp=sharing
Google Collab: https://colab.research.google.com/
https://data.world/
ChatGPT-3.5: https://chatgpt.com/
Ideogram: https://ideogram.ai/