使用Seaborn制作冲孔卡图表
制作冲孔卡图表
快速识别周期趋势

打卡图,也称为表格气泡图,是一种用于突出数据中周期性趋势的可视化类型。它以刚性矩阵或网格格式显示数据,通常由星期几与一天中的小时组成。圆圈代表行和列的交汇处的数据点,它们的大小传达数据值。颜色可以用于包含附加信息。

“打卡”这个名字暗示了过去工人会在机器上打卡记录他们的出入时间。
要构建一个打卡图,您需要有时间戳数据。在这个快速成功的数据科学项目中,我们将使用一个Kaggle数据集来跟踪自行车在华盛顿特区的租用时间。
数据集
Kaggle华盛顿特区共享单车数据集包含2011年和2012年在华盛顿特区的Capital bikeshare系统中租用自行车的按小时和每日计数。[1]此数据根据CC0 1.0许可证发布。有关数据集内容的详细信息,请访问自述文件。
为方便起见,我已经将这些数据下载到了一个公共的Gist。
安装库
除了Python,您还需要pandas数据分析库和seaborn绘图库。您可以使用以下命令进行安装:
conda install pandas seaborn
或者
pip install pandas seaborn
代码
以下是在JupyterLab中编写的有注释的代码,每个单元格进行描述。
导入库和加载数据
在导入matplotlib和seaborn进行绘图以及导入pandas进行数据分析之后,我们将将租赁数据的CSV文件读入到pandas DataFrame中,仅保留季节、工作日、小时和计数(租赁数量)的列。


