Как парцел с балончета разкрива най-добрите градове за живеене в САЩ

В тази статия ще ви покажа някои вълнуващи факти за американските градове, стойността на балонните парцели при решаването в кой град да живеете и как да ги създадете.

Мислите ли да инвестирате в недвижими имоти през 2018 г.? Преместване в нов град? Когато разглеждате тези решения, трябва да претегляте различни фактори като безработица, цена на жилищата, големина на града, безопасност и т.н. Дори при всички тези данни и четири съответни лентови диаграми, вие все още ще бъдете безсмислени, втренчени в тази таблица. Ще се опитате да намерите най-добрите кандидати, но тези фактори разказват различни истории ... Звучи като сложен проблем.

И така, има ли начин да визуализираме всички тези фактори в 1 диаграма и да ги сравним ВСИЧКИ? Да, можем да използваме парче с балончета!

Какъв е балонният сюжет?

Графикът на балоните е вид диаграма, която показва повече от две измерения на данните (в сравнение с традиционните разпръснати участъци). В допълнение към начертаването на точка на равнина X-Y, тя използва размера, цвета или формата на точката, за да показва повече измерения.

Използваме нивото на безработица като оста X, средната цена на жилищата като оста Y, а населението на градовете като размер на точките. Това прави добро трето измерение. Цветът се определя произволно на всеки град.

Най-добрият град в САЩ за живеене е… (изчакайте го)

Победител: Нашвил!

Други препоръки: Остин, Омаха, Милуоки, Далас, Минеаполис, Денвър и Аврора.

Те имат ниска безработица (и затова има по-голям шанс да си намерят работа) и ниска цена на жилището, тъй като са в долната лява част на парцела. Какво означава това?

Това означава, че можете да направите своя избор въз основа на този сюжет.

Например, ако смятате, че нивото на безработица е по-важно и нямате нищо против по-високите цени на жилищата, тогава Хонолулу, Оукланд, Бостън и Сан Диего са силни кандидати

Ами добавянето на безопасност като друг фактор?

Сигурен. Нека добавим безопасността като четвърти фактор (останалите три фактора са все още цената на жилището, нивото на безработица и населението). Вместо случайно да присвояваме цвят за даден град, ние използваме цветовата скала за престъпност (престъпност на 100 000 души). Червеното означава повече престъпност, а синьото означава по-малко.

Променя ли се резултатът?

Това стана! Ако безопасността е много важна за вас, Милуоки може да не е толкова голям избор сред предишните препоръки (въпреки че е в долната лява част на графиката).

Сега виждате силата на балонния сюжет: способността да се демонстрират множество фактори в един 2-D график. Ако имате само лентови графики за тези фактори, е трудно да определите градовете с идеална комбинация от фактори. Графикът на балончетата в основата ви създаде „визуална обективна функция“, за да оптимизирате многопроменлив проблем при вземане на решения.

Как се променят нивата на безработицата и цените на жилищата във времето?

Можем да създадем интерактивна диаграма за движение, за да добавим време като измерение (2013 до 2017 г.), за да видим как факторите се променят за тези градове с течение на времето.

За да избегна твърде много визуална информация, не използвах данни за престъпления и използвах различните цветове, за да представя няколко избрани града.

Добрата новина е, че равнището на безработица за почти всички градове намаля значително (движейки се отдясно на ляво). Но лошата новина е, че цените на жилищата се покачват доста бързо (особено за Сан Франциско, Сан Хосе, Лос Ъгъл, Ню Йорк и Сиатъл).

Искате ли сами да създадете класациите? Ето кода ми за балонните сюжети и графиката за движение в R. Забавлявайте се да играете с сюжетите :)

###############
# Парцел #
###############
библиотека (data.table)
библиотека (ggplot2)
библиотека (ggrepel)
bubble_data <-fread ("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/bubble_plot_merged_city_data.csv", sep = ",")
bubble_plot <- ggplot (bubble_data,
               aes (x = Безработица_Цена, y = Начало_Цена / 1000)) +
geom_point (aes (размер = Население, запълване = Total_Crime), форма = 21) +
# Създайте „Bubble“, като присвоите размер на променлива #
scale_fill_continuous (ниско = "# 33FFFF", високо = "# FF6699") +
scale_size_area (max_size = 20) +
# Изберете цветова скала на балон и максимален размер на балон #
geom_text_repel (
          aes (label = City), nudge_x = 0, nudge_y = 0.75, размер = 6) +
# Използвайте geom_text_repel, за да отблъсквате етикетите далеч един от друг #
theme_bw () +
# Използвайте бял фон вместо стандартния сив #
ggtitle ("Най-добрите градове в САЩ за живеене") + лаборатории (x = "Безработица%", y = "Цена на дома",
       size = "Население", fill = "Престъпление") + тема (plot.title = element_text (размер = 25, hjust = 0,5),
        axis.title = element_text (размер = 20, лице = "удебелен"),
        axis.text = element_text (размер = 15)) +
# Заглавие на стил и ос #
scale_y_continuous (name = "Цена за дома", почивки = последователност (0, 1500, от = 250),
                      етикети = c ("0", "250K", "500K", "750K", "1000k", "1250k", "1500K"))
# Направете y-ос по-четена, като замените научното число с "K" #
печат (bubble_plot)
################
# Диаграма на движение №
################
библиотека (data.table)
библиотека (googleVis)
motion_data <-fread ("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/motion_chart_merged_city_data.csv", sep = ",")
motion_chart <- gvisMotionChart (motion_data,
idvar = "Град",
timevar = "Година",
xvar = "Коефициент на безработица",
yvar = "Цена за дома",
sizevar = "населението")
парцел (motion_chart)
# R автоматично отваря раздел в браузъра за вас
# Flash Player трябва да бъде активиран в браузъра
Щракнете върху иконата “⌽”, за да активирате Flash
########
# Данни #
########
"" "
Наборите от данни, които използвах, са от Zillow (средно жилище), UCR програмата на ФБР, census.gov (население), Бюрото по труда (безработица).
Направих някои почистване на данни и се присъединих към нужния в тази статия формат и можете да щракнете върху връзките по-долу, за да изтеглите.
"" "
bubble_plot_merged_city_data.csv, motion_chart_merged_city_data.csv

Следвайте ме и ми дайте няколко хлопки, ако сте намерили това полезно!

Можете също да прочетете предишните ми статии за науката за данни, недвижими имоти и вземане на решения: