“最难的Pandas:透视表、堆叠和展开的清晰解释”

The most difficult aspects of Pandas clear explanations of pivot tables, stacking, and unstacking.

像从未掌握过这些令人头疼的问题一样精通它们

由我和Midjourney创建的图像

简介

尽管大多数Pandas表达式读起来像英语,但有时你会遇到真正令人头疼的问题。是的,它们有直观的名称,如cutpivot,但它们似乎很难理解。

因此,我决定撰写一系列专门介绍我认为最困难的Pandas函数的文章。本文将清楚地解释其中三个函数:pivot_tablestackunstack

让我们开始吧。

设置

Pandas的pivot_table(),与groupby()的比较

应该有一种明显的方法来做到这一点。

以上是Python之禅中的一句引用。Python希望对于一个问题只有一种明显的解决方案。但是,pandas故意避免了这一点。在pandas中,经常有多种方法可以执行同一个操作。

pivot_table()就是一个例子。它是groupby()函数的一个完整且有时更好的替代品。它们的区别在于结果的形状。groupby()返回一个Series对象,而pivot_table()返回一个易于操作的数据帧。

让我们解决一个问题,并使用这两个函数给出解决方案。我将加载来自seaborntips数据集:

tips = sns.load_dataset('tips')tips.head()

我们想要找出每个性别的所有账单总和: