Введение
На платформе data.world я наткнулась на датасет «Big Cities Health», который показался мне интересным и важным выбором для анализа. Для данного анализа я использовала язык программирования Python, а также Google Colab.
Этот набор данных иллюстрирует состояние здоровья в 26 крупнейших и наиболее урбанизированных городах страны, зафиксированное 34 показателями здоровья и шестью показателями демографической ситуации. Эти показатели отражают некоторые из основных причин заболеваемости и смертности в Соединенных Штатах и основные приоритеты национальных, государственных и местных органов здравоохранения.
Данные общественного здравоохранения были получены по девяти всеобъемлющим категориям: ВИЧ/СПИД, рак, питание/физическая активность/ожирение, безопасность пищевых продуктов, инфекционные заболевания, здоровье матери и ребенка, табак, травмы/насилие и поведенческое здоровье/злоупотребление психоактивными веществами.
Обработка данных
На первом этапе работы я загрузила данный датсет в Google Colab. Для проверки корректности открытия файла я решила просмотреть его первые строки.
Цветовая палитра для стилизации графиков, созданная с помощью сайта coolors.co
Для построения графиков и их стилизации я использовала сайт designcap.ru
В шаблона заносила данные и цветовую палитру. Для подписей к графиком воспользовалась программой Adobe illustrator
1. Анализ показателя здоровья в зависимости от года
По результатом становится понятно, что наиболее высокий коэффициент здорового населения приходится на 2012 год.
Анализ осуществлялся по всем приведенным характеристикам в датсет (заболевания, вредные привычки и полезные продукты)
2. Анализ покателей здорового населения городов с сортировкой по полу
По результатом анализа видно, что в каждом из 26-ти городов по статистике преобладает здоровое у женского пола.
3. Анализ показателей здорового населения наиболее крупных городов по критерию отсутсвие заболеваний и сортировки по полу
4. Анализ общего показателя здорового населения по всем городам
Результатом анализа является наиболее высокий показатель у Phoenix
Описание применения генеративной модели
1. Генерация кода на Pythone
Для генерации кода я использовала коды в предложенных вариантах графиков с Google Colab с учетом изменений видов графиков и критерий для анализа.
С данной задачей мне помог сайт replit.com и функция Assistant Ai. Благодаря этому была ускорена работа с кодом и созданием разных видов графиков.
Рекомендованные графики в Google Colab
Промт для Replit ai
2. Стилизация графиков
Для стилизации графиков и изменений цветовой гаммы я использовала сайт designcap.com, это позволило упростить работу с кодом и быстрее воссоздать графики с учетом выведенных переменных из Google Colab.
Переменные и их значения, расположенные на графиках я выводила через функцию print
Design cap
Для добавления подписей я использjвала программу Adobe illustrator.
Это позволило упростить работу с кодом
Ссылки
- https://replit.com/~
- https://coolors.co/
- https://www.designcap.com/
- Блокнот с кодом и датасет: https://drive.google.com/drive/folders/1Zum75BcS_w66Tm-rjknbrpi1Yeg74bb6?usp=sharing
- Google Collab: https://colab.research.google.com/
- https://data.world/
- ChatGPT-3.5: https://chatgpt.com/
- Ideogram: https://ideogram.ai/




