解开COVID锯齿状图表的谜团
解开COVID锯齿状图表的谜团' can be condensed to '解开COVID图表谜团'.
使用pandas对数据进行降采样

在COVID-19大流行的第一年,疾病的死亡人数一直备受争议。其中的问题包括由于缺乏测试而导致早期低估,医院以外的死亡未被记录以及区分COVID-19相关死亡和COVID-19伴随死亡的问题[1][2]。
除此之外,不幸的是,这场大流行迅速被政治化。党派的评论员们痴迷于每一个数据,寻找他们可以扭曲它以符合自己利益的方式。证实偏见肆虐。如果你当时在社交媒体上,可能会看到质疑官方图表和图形真实性的帖子。
在这个快速成功的数据科学项目中,我们将研究一个在我Facebook页面上出现的特定图表。该图表记录了COVID-19在大流行的第一年中在美国的死亡人数,并显示出明显的锯齿状或“锯齿形”特征。
![US COVID-19 mortalities for the first year of the pandemic (by author from “The COVID Tracking Project” at The Atlantic [3])](https://miro.medium.com/v2/resize:fit:640/format:webp/1*t5d71eY8hjlapA6HsYQ4FQ.png)
曲线振荡频率很高,怀疑疾病不会以这种方式发展。虽然一些人认为这证明了COVID死亡人数明显错误且不可信,但我们这些拥有数据科学技能的人很快就解决了这个被过分夸大的谜团。
- 社会教育指数如何影响学校毕业生的结果?——用R和brms进行贝叶斯分析
- 通过密度提示链增强GPT-4摘要
- Amazon SageMaker简化了个人用户的Amazon SageMaker Studio设置
数据集
我们将使用作为“The COVID Tracking Project”在The Atlantic [3]的一部分收集的数据。它包括2020年3月3日至2021年3月7日的COVID-19统计数据。为了减小数据集的大小,我只下载了得克萨斯州的数据,并将其保存为CSV文件。
您可以在这里找到原始数据集,数据的许可证可以在这里找到。
安装库
除了Python,我们还需要pandas库。您可以使用以下任一命令进行安装:
conda install pandas
或者
pip install pandas