
Введение
Меня всегда интересовала медицина и биология.
Но особое внимание я обращала на такое заболевание, как Рак. Поэтому я взяла датасет, связанный с данной тематикой.
В данном случае, речь идёт о линейной регрессии рака.
Описание датасета от его автора (перевод с английского)
Учебное пособие по модели линейной регрессии рака
Аннотированный пример линейной регрессии с использованием открытых данных с порталов открытого правительства резюме Пошаговое руководство по линейной регрессии
Этот пример построен с использованием Python. Он охватывает:
- Как автор получал и импортировал данные - Подготовка данных - Исследовательский анализ - Выбор модели - Диагностика модели
(Обратите внимание, что это первая попытка прохождения, и ее следует рассматривать как базовую модель для сравнения с будущими итерациями.)
Работа над созданием графиков/диаграмм
Датасет я нашла на данном ресурсе: https://data.world/datasets/open-data

Далее я преобразовала файл csv в ссылку на датасет с помощью сайта: https://github.com
Затем я вписала данную ссылку в Google Collab и уже там приступила к работе с кодом.
Там мне предложили несколько варианта графиков, код которых я стала переделывать с помощью чата GPT.


Графики
Мой код и получившиеся диаграммы выглядят данным образом:








Для визуального и информационного упрощения я сократила все диаграммы до топ-10.
И теперь они выглядят так:








Итоговые графики
Цветовая палитра создана на сайте: https://coolors.co
Модифицированные под единый стиль (за счёт единой палитры и пары шрифтов) диаграммы:
В заключении
Подобные датасеты достаточно важны для медицины. Они могут поспособствовать дополнительному анализу данного заболевания, что имеет возможность помочь в её изучении и дальнейшем способе лечения.
Ссылки