分组#
pandas.api.typing.DataFrameGroupBy
和 pandas.api.typing.SeriesGroupBy
实例分别由 groupby 调用 pandas.DataFrame.groupby()
和 pandas.Series.groupby()
返回。
索引,迭代#
分组迭代器。 |
|
分组迭代器。 |
|
字典 {分组名称 -> 分组标签}。 |
|
字典 {分组名称 -> 分组标签}。 |
|
字典 {分组名称 -> 分组索引}。 |
|
字典 {分组名称 -> 分组索引}。 |
|
|
从具有指定名称的分组构建 DataFrame。 |
|
从具有指定名称的分组构建 DataFrame。 |
|
Grouper 允许用户为对象指定 groupby 指令。 |
函数应用助手#
|
用于列特定聚合的助手,可以控制输出列名。 |
函数应用#
|
按组应用函数 |
|
按组应用函数 |
|
使用一个或多个操作在指定轴上进行聚合。 |
|
使用一个或多个操作在指定轴上进行聚合。 |
|
使用一个或多个操作在指定轴上进行聚合。 |
|
使用一个或多个操作在指定轴上进行聚合。 |
|
调用在每个组上生成相同索引的 Series 的函数。 |
|
调用在每个组上生成相同索引的 DataFrame 的函数。 |
|
将带有参数的 |
|
将带有参数的 |
|
过滤不满足条件的组中的元素。 |
|
过滤不满足条件的组中的元素。 |
DataFrameGroupBy
计算/描述性统计#
|
如果组中所有值都为真,则返回 True,否则返回 False。 |
|
如果组中任何值为真,则返回 True,否则返回 False。 |
|
向后填充值。 |
|
计算列的成对相关性,排除 NA/空值。 |
|
计算成对相关性。 |
计算组的计数,排除缺失值。 |
|
|
计算列的成对协方差,排除 NA/空值。 |
|
对每个组中的每个项目编号,从 0 到该组的长度 - 1。 |
|
每个组的累积最大值。 |
|
每个组的累积最小值。 |
|
每个组的累积乘积。 |
|
对每个分组进行累加。 |
|
生成描述性统计信息。 |
|
元素的一阶离散差分。 |
|
向前填充值。 |
|
(已弃用) 使用指定的方法在分组内填充 NA/NaN 值。 |
|
计算每个分组中每列的第一个条目。 |
返回每个分组的前 n 行。 |
|
|
返回在请求的轴上最大值的第一次出现的索引。 |
|
返回在请求的轴上最小值的第一次出现的索引。 |
|
计算每个组内每列的最后一个条目。 |
|
计算组值的最大值。 |
|
计算组的平均值,排除缺失值。 |
|
计算组的中位数,排除缺失值。 |
|
计算组值的最小值。 |
|
从 0 到组数 - 1 对每个组进行编号。 |
如果 n 是整数,则从每个组中获取第 n 行,否则获取行子集。 |
|
|
返回一个 DataFrame,其中包含每个位置的唯一元素计数。 |
计算组的开盘价、最高价、最低价和收盘价,排除缺失值。 |
|
|
计算每个值相对于组中前一个条目的百分比变化。 |
|
计算组值的乘积。 |
|
返回组值在给定分位数上的值,类似于 numpy.percentile。 |
|
提供每个组内值的排名。 |
|
在使用 TimeGrouper 时提供重采样。 |
|
返回一个滚动分组器,为每个组提供滚动功能。 |
|
从每个组中返回随机样本。 |
|
计算组的平均值的标准误差,排除缺失值。 |
|
将每个组移动 periods 个观察值。 |
计算组的大小。 |
|
|
返回组内的无偏偏度。 |
|
计算组的标准差,排除缺失值。 |
|
计算组值的总和。 |
|
计算组的方差,排除缺失值。 |
返回每个组的最后 n 行。 |
|
|
返回每个组中给定 *位置* 索引中的元素。 |
|
返回包含唯一行计数的 Series 或 DataFrame。 |
SeriesGroupBy
计算 / 描述性统计#
|
如果组中所有值都为真,则返回 True,否则返回 False。 |
|
如果组中任何值为真,则返回 True,否则返回 False。 |
|
向后填充值。 |
|
计算与 other Series 的相关性,排除缺失值。 |
计算组的计数,排除缺失值。 |
|
|
计算与 Series 的协方差,排除缺失值。 |
|
对每个组中的每个项目编号,从 0 到该组的长度 - 1。 |
|
每个组的累积最大值。 |
|
每个组的累积最小值。 |
|
每个组的累积乘积。 |
|
对每个分组进行累加。 |
|
生成描述性统计信息。 |
|
元素的一阶离散差分。 |
|
向前填充值。 |
|
(已弃用) 使用指定的方法在分组内填充 NA/NaN 值。 |
|
计算每个分组中每列的第一个条目。 |
|
返回每个分组的前 n 行。 |
|
计算每个组内每列的最后一个条目。 |
|
返回最大值的行标签。 |
|
返回最小值的索引标签。 |
返回每个分组的值是否单调递增。 |
|
返回每个分组的值是否单调递减。 |
|
|
计算组值的最大值。 |
|
计算组的平均值,排除缺失值。 |
|
计算组的中位数,排除缺失值。 |
|
计算组值的最小值。 |
|
从 0 到组数 - 1 对每个组进行编号。 |
|
返回最大的 n 个元素。 |
|
返回最小的 n 个元素。 |
如果 n 是整数,则从每个组中获取第 n 行,否则获取行子集。 |
|
|
返回分组中唯一元素的数量。 |
返回每个分组的唯一值。 |
|
计算组的开盘价、最高价、最低价和收盘价,排除缺失值。 |
|
|
计算每个值相对于组中前一个条目的百分比变化。 |
|
计算组值的乘积。 |
|
返回组值在给定分位数上的值,类似于 numpy.percentile。 |
|
提供每个组内值的排名。 |
|
在使用 TimeGrouper 时提供重采样。 |
|
返回一个滚动分组器,为每个组提供滚动功能。 |
|
从每个组中返回随机样本。 |
|
计算组的平均值的标准误差,排除缺失值。 |
|
将每个组移动 periods 个观察值。 |
计算组的大小。 |
|
|
返回组内的无偏偏度。 |
|
计算组的标准差,排除缺失值。 |
|
计算组值的总和。 |
|
计算组的方差,排除缺失值。 |
|
返回每个组的最后 n 行。 |
|
返回每个组中给定 *位置* 索引中的元素。 |
|
绘图和可视化#
|
从 DataFrameGroupBy 数据中创建箱线图。 |
|
创建 DataFrame 列的直方图。 |
|
使用 matplotlib 绘制输入序列的直方图。 |
创建 Series 或 DataFrame 的绘图。 |
|
创建 Series 或 DataFrame 的绘图。 |