纽约市的可视化
NYC Visualization
使用Python和Plotly将纽约市开放数据栩栩如生
纽约市的开放数据平台是一个令人难以置信的信息来源。所有由该市收集和生成的公共数据都必须按照法律规定通过该门户网站提供,并且对公众免费使用。
数据集涵盖了交通、住房、机动车事故、中央公园松鼠普查,甚至是公园管理员对侵略性龟类遭遇的报告。
地理、基础设施和社会学等数据集代表了真实世界的过程和事件。即使你与纽约市或城市地区没有任何联系或兴趣,它们也给你一个机会使用看起来更像是你在职业角色中会遇到的数据,而不是MNIST或泰坦尼克号幸存者之类的数据。更好的是,它们几乎一样容易获取。
我们将演示这些数据集使用起来有多么容易,并在过程中构建一些有趣的可视化效果。
为了使代码块尽可能简洁,这里列出了本文中所有代码所需的模块:
import foliumimport geopandas as gpdimport matplotlib.pyplot as pltimport numpy as npimport pandas as pdimport plotly.express as pximport plotly.graph_objects as goimport requestsfrom scipy.stats import gaussian_kdeimport seaborn as snsfrom shapely.geometry import Point, shape, box, Polygon
如果你想要复制任何内容,请确保它们已经安装。
建筑轮廓
数据集
这是我最喜欢的数据集之一。该数据包括纽约市大多数建筑物的轮廓多边形、年龄和高度。
我们将从数据拉取开始,与可视化代码分开,因为我们将在几个不同的可视化中使用该数据集。
# 拉取数据api_endpoint = 'https://data.cityofnewyork.us/resource/qb5r-6dgf.json'limit = 1000 # 每次请求的行数offset = 0 # 起始偏移量data_frames = [] # 用于保存数据块的列表# 循环迭代获取数据# while offset <= 100000: # uncomment this and comment while True…