
Воспользовавшись сайтом Kaggle, мною был выбран датасет Airbnb по Нью-Йорку. Данные заинтересовали меня своим разнообразием — было доступно сразу много колонок как с географическими, так и с финансовыми параметрами.
Использовались четыре варианта графиков: гистограммы, точечные, линейные и круговые диаграммы. Гистограммы — для построения распределения по нескольким категориям. Линейные — для демонстрации трендов. Круговые — для данных, которые представляют одно целое (в нашем случае — один район Нью-Йорка). Точечные — для указания конкретных точек на карте.
Первый шаг — визуализация предложений
Увидев в данных конкретные координаты предложений, было решено воспользоваться этим и нарисовать точки на карте.
Для такой неочевидной задачи пришлось обратиться к нейросетям:

Код для визуализации карты
Нейросети подсказали, как воспользоваться пакетом mpl_tooklits.basemap для того, чтобы добавлять точки на снимок со спутника Google Maps.

Карта Нью-Йорка
Код для гистограммы и пай-чарта
Я добавила отсесчку (threshold) для мелких микрорайонов Манхэттена, чтобы сделать пай-чарт более красивым.
Порог выставила в 5 процента, ориентируясь на читаемость текста на самом чарте.
Вывод: больше всего предложений — в Манхэттене, а точнее в Гарлеме.
Код для получения средних цен
Предложения в датасете делятся на две категории — «Private room» и «Entire home/apt».
Для того, чтобы сравнить цены на комнаты и целые квартиры отдельно, я создала два отдельных датафрейма private_rooms и entire_home.
В среднем и квартиры, и комнаты дороже всего в Манхэттене. Дешевле всех — Бронкс. Удивляет Статен-Айленд, где квартиры намного дороже одиночных комнат.