使用Seaborn制作冲孔卡图表

制作冲孔卡图表

一台带有时间卡的打卡钟(图片由Hennie Stander在UnSplash上提供)

打卡图,也称为表格气泡图,是一种用于突出数据中周期性趋势的可视化类型。它以刚性矩阵或网格格式显示数据,通常由星期几与一天中的小时组成。圆圈代表行和列的交汇处的数据点,它们的大小传达数据值。颜色可以用于包含附加信息。

一张表格气泡图(图片由作者提供)

“打卡”这个名字暗示了过去工人会在机器上打卡记录他们的出入时间。

要构建一个打卡图,您需要有时间戳数据。在这个快速成功的数据科学项目中,我们将使用一个Kaggle数据集来跟踪自行车在华盛顿特区的租用时间。

数据集

Kaggle华盛顿特区共享单车数据集包含2011年和2012年在华盛顿特区的Capital bikeshare系统中租用自行车的按小时和每日计数。[1]此数据根据CC0 1.0许可证发布。有关数据集内容的详细信息,请访问自述文件。

为方便起见,我已经将这些数据下载到了一个公共的Gist。

安装库

除了Python,您还需要pandas数据分析库和seaborn绘图库。您可以使用以下命令进行安装:

conda install pandas seaborn

或者

pip install pandas seaborn

代码

以下是在JupyterLab中编写的有注释的代码,每个单元格进行描述。

导入库和加载数据

在导入matplotlib和seaborn进行绘图以及导入pandas进行数据分析之后,我们将将租赁数据的CSV文件读入到pandas DataFrame中,仅保留季节、工作日、小时和计数(租赁数量)的列。