分组#

pandas.api.typing.DataFrameGroupBy 和 pandas.api.typing.SeriesGroupBy 实例分别由 groupby 调用 pandas.DataFrame.groupby() 和 pandas.Series.groupby() 返回。

索引，迭代#

`DataFrameGroupBy.__iter__`()	分组迭代器。
`SeriesGroupBy.__iter__`()	分组迭代器。
`DataFrameGroupBy.groups`	字典 {分组名称 -> 分组标签}。
`SeriesGroupBy.groups`	字典 {分组名称 -> 分组标签}。
`DataFrameGroupBy.indices`	字典 {分组名称 -> 分组索引}。
`SeriesGroupBy.indices`	字典 {分组名称 -> 分组索引}。
`DataFrameGroupBy.get_group`(name[, obj])	从具有指定名称的分组构建 DataFrame。
`SeriesGroupBy.get_group`(name[, obj])	从具有指定名称的分组构建 DataFrame。

Grouper(*args, **kwargs)

Grouper 允许用户为对象指定 groupby 指令。

函数应用助手#

NamedAgg(column, aggfunc)

用于列特定聚合的助手，可以控制输出列名。

函数应用#

`SeriesGroupBy.apply`(func, args, *kwargs)	按组应用函数 `func` 并将结果组合在一起。
`DataFrameGroupBy.apply`(func, *args[, ...])	按组应用函数 `func` 并将结果组合在一起。
`SeriesGroupBy.agg`([func, engine, engine_kwargs])	使用一个或多个操作在指定轴上进行聚合。
`DataFrameGroupBy.agg`([func, engine, ...])	使用一个或多个操作在指定轴上进行聚合。
`SeriesGroupBy.aggregate`([func, engine, ...])	使用一个或多个操作在指定轴上进行聚合。
`DataFrameGroupBy.aggregate`([func, engine, ...])	使用一个或多个操作在指定轴上进行聚合。
`SeriesGroupBy.transform`(func, *args[, ...])	调用在每个组上生成相同索引的 Series 的函数。
`DataFrameGroupBy.transform`(func, *args[, ...])	调用在每个组上生成相同索引的 DataFrame 的函数。
`SeriesGroupBy.pipe`(func, args, *kwargs)	将带有参数的 `func` 应用于此 GroupBy 对象并返回其结果。
`DataFrameGroupBy.pipe`(func, args, *kwargs)	将带有参数的 `func` 应用于此 GroupBy 对象并返回其结果。
`DataFrameGroupBy.filter`(func[, dropna])	过滤不满足条件的组中的元素。
`SeriesGroupBy.filter`(func[, dropna])	过滤不满足条件的组中的元素。

`DataFrameGroupBy` 计算/描述性统计#

`DataFrameGroupBy.all`([skipna])	如果组中所有值都为真，则返回 True，否则返回 False。
`DataFrameGroupBy.any`([skipna])	如果组中任何值为真，则返回 True，否则返回 False。
`DataFrameGroupBy.bfill`([limit])	向后填充值。
`DataFrameGroupBy.corr`([method, min_periods, ...])	计算列的成对相关性，排除 NA/空值。
`DataFrameGroupBy.corrwith`(other[, axis, ...])	计算成对相关性。
`DataFrameGroupBy.count`()	计算组的计数，排除缺失值。
`DataFrameGroupBy.cov`([min_periods, ddof, ...])	计算列的成对协方差，排除 NA/空值。
`DataFrameGroupBy.cumcount`([ascending])	对每个组中的每个项目编号，从 0 到该组的长度 - 1。
`DataFrameGroupBy.cummax`([axis, numeric_only])	每个组的累积最大值。
`DataFrameGroupBy.cummin`([axis, numeric_only])	每个组的累积最小值。
`DataFrameGroupBy.cumprod`([axis])	每个组的累积乘积。
`DataFrameGroupBy.cumsum`([axis])	对每个分组进行累加。
`DataFrameGroupBy.describe`([percentiles, ...])	生成描述性统计信息。
`DataFrameGroupBy.diff`([periods, axis])	元素的一阶离散差分。
`DataFrameGroupBy.ffill`([limit])	向前填充值。
`DataFrameGroupBy.fillna`([value, method, ...])	(已弃用) 使用指定的方法在分组内填充 NA/NaN 值。
`DataFrameGroupBy.first`([numeric_only, ...])	计算每个分组中每列的第一个条目。
`DataFrameGroupBy.head`([n])	返回每个分组的前 n 行。
`DataFrameGroupBy.idxmax`([axis, skipna, ...])	返回在请求的轴上最大值的第一次出现的索引。
`DataFrameGroupBy.idxmin`([axis, skipna, ...])	返回在请求的轴上最小值的第一次出现的索引。
`DataFrameGroupBy.last`([numeric_only, ...])	计算每个组内每列的最后一个条目。
`DataFrameGroupBy.max`([numeric_only, ...])	计算组值的最大值。
`DataFrameGroupBy.mean`([numeric_only, ...])	计算组的平均值，排除缺失值。
`DataFrameGroupBy.median`([numeric_only])	计算组的中位数，排除缺失值。
`DataFrameGroupBy.min`([numeric_only, ...])	计算组值的最小值。
`DataFrameGroupBy.ngroup`([ascending])	从 0 到组数 - 1 对每个组进行编号。
`DataFrameGroupBy.nth`	如果 n 是整数，则从每个组中获取第 n 行，否则获取行子集。
`DataFrameGroupBy.nunique`([dropna])	返回一个 DataFrame，其中包含每个位置的唯一元素计数。
`DataFrameGroupBy.ohlc`()	计算组的开盘价、最高价、最低价和收盘价，排除缺失值。
`DataFrameGroupBy.pct_change`([periods, ...])	计算每个值相对于组中前一个条目的百分比变化。
`DataFrameGroupBy.prod`([numeric_only, min_count])	计算组值的乘积。
`DataFrameGroupBy.quantile`([q, ...])	返回组值在给定分位数上的值，类似于 numpy.percentile。
`DataFrameGroupBy.rank`([method, ascending, ...])	提供每个组内值的排名。
`DataFrameGroupBy.resample`(rule, *args[, ...])	在使用 TimeGrouper 时提供重采样。
`DataFrameGroupBy.rolling`(args, *kwargs)	返回一个滚动分组器，为每个组提供滚动功能。
`DataFrameGroupBy.sample`([n, frac, replace, ...])	从每个组中返回随机样本。
`DataFrameGroupBy.sem`([ddof, numeric_only])	计算组的平均值的标准误差，排除缺失值。
`DataFrameGroupBy.shift`([periods, freq, ...])	将每个组移动 periods 个观察值。
`DataFrameGroupBy.size`()	计算组的大小。
`DataFrameGroupBy.skew`([axis, skipna, ...])	返回组内的无偏偏度。
`DataFrameGroupBy.std`([ddof, engine, ...])	计算组的标准差，排除缺失值。
`DataFrameGroupBy.sum`([numeric_only, ...])	计算组值的总和。
`DataFrameGroupBy.var`([ddof, engine, ...])	计算组的方差，排除缺失值。
`DataFrameGroupBy.tail`([n])	返回每个组的最后 n 行。
`DataFrameGroupBy.take`(indices[, axis])	返回每个组中给定位置索引中的元素。
`DataFrameGroupBy.value_counts`([subset, ...])	返回包含唯一行计数的 Series 或 DataFrame。

`SeriesGroupBy` 计算 / 描述性统计#

`SeriesGroupBy.all`([skipna])	如果组中所有值都为真，则返回 True，否则返回 False。
`SeriesGroupBy.any`([skipna])	如果组中任何值为真，则返回 True，否则返回 False。
`SeriesGroupBy.bfill`([limit])	向后填充值。
`SeriesGroupBy.corr`(other[, method, min_periods])	计算与 other Series 的相关性，排除缺失值。
`SeriesGroupBy.count`()	计算组的计数，排除缺失值。
`SeriesGroupBy.cov`(other[, min_periods, ddof])	计算与 Series 的协方差，排除缺失值。
`SeriesGroupBy.cumcount`([ascending])	对每个组中的每个项目编号，从 0 到该组的长度 - 1。
`SeriesGroupBy.cummax`([axis, numeric_only])	每个组的累积最大值。
`SeriesGroupBy.cummin`([axis, numeric_only])	每个组的累积最小值。
`SeriesGroupBy.cumprod`([axis])	每个组的累积乘积。
`SeriesGroupBy.cumsum`([axis])	对每个分组进行累加。
`SeriesGroupBy.describe`([percentiles, ...])	生成描述性统计信息。
`SeriesGroupBy.diff`([periods, axis])	元素的一阶离散差分。
`SeriesGroupBy.ffill`([limit])	向前填充值。
`SeriesGroupBy.fillna`([value, method, axis, ...])	(已弃用) 使用指定的方法在分组内填充 NA/NaN 值。
`SeriesGroupBy.first`([numeric_only, ...])	计算每个分组中每列的第一个条目。
`SeriesGroupBy.head`([n])	返回每个分组的前 n 行。
`SeriesGroupBy.last`([numeric_only, ...])	计算每个组内每列的最后一个条目。
`SeriesGroupBy.idxmax`([axis, skipna])	返回最大值的行标签。
`SeriesGroupBy.idxmin`([axis, skipna])	返回最小值的索引标签。
`SeriesGroupBy.is_monotonic_increasing`	返回每个分组的值是否单调递增。
`SeriesGroupBy.is_monotonic_decreasing`	返回每个分组的值是否单调递减。
`SeriesGroupBy.max`([numeric_only, min_count, ...])	计算组值的最大值。
`SeriesGroupBy.mean`([numeric_only, engine, ...])	计算组的平均值，排除缺失值。
`SeriesGroupBy.median`([numeric_only])	计算组的中位数，排除缺失值。
`SeriesGroupBy.min`([numeric_only, min_count, ...])	计算组值的最小值。
`SeriesGroupBy.ngroup`([ascending])	从 0 到组数 - 1 对每个组进行编号。
`SeriesGroupBy.nlargest`([n, keep])	返回最大的 n 个元素。
`SeriesGroupBy.nsmallest`([n, keep])	返回最小的 n 个元素。
`SeriesGroupBy.nth`	如果 n 是整数，则从每个组中获取第 n 行，否则获取行子集。
`SeriesGroupBy.nunique`([dropna])	返回分组中唯一元素的数量。
`SeriesGroupBy.unique`()	返回每个分组的唯一值。
`SeriesGroupBy.ohlc`()	计算组的开盘价、最高价、最低价和收盘价，排除缺失值。
`SeriesGroupBy.pct_change`([periods, ...])	计算每个值相对于组中前一个条目的百分比变化。
`SeriesGroupBy.prod`([numeric_only, min_count])	计算组值的乘积。
`SeriesGroupBy.quantile`([q, interpolation, ...])	返回组值在给定分位数上的值，类似于 numpy.percentile。
`SeriesGroupBy.rank`([method, ascending, ...])	提供每个组内值的排名。
`SeriesGroupBy.resample`(rule, *args[, ...])	在使用 TimeGrouper 时提供重采样。
`SeriesGroupBy.rolling`(args, *kwargs)	返回一个滚动分组器，为每个组提供滚动功能。
`SeriesGroupBy.sample`([n, frac, replace, ...])	从每个组中返回随机样本。
`SeriesGroupBy.sem`([ddof, numeric_only])	计算组的平均值的标准误差，排除缺失值。
`SeriesGroupBy.shift`([periods, freq, axis, ...])	将每个组移动 periods 个观察值。
`SeriesGroupBy.size`()	计算组的大小。
`SeriesGroupBy.skew`([axis, skipna, numeric_only])	返回组内的无偏偏度。
`SeriesGroupBy.std`([ddof, engine, ...])	计算组的标准差，排除缺失值。
`SeriesGroupBy.sum`([numeric_only, min_count, ...])	计算组值的总和。
`SeriesGroupBy.var`([ddof, engine, ...])	计算组的方差，排除缺失值。
`SeriesGroupBy.tail`([n])	返回每个组的最后 n 行。
`SeriesGroupBy.take`(indices[, axis])	返回每个组中给定位置索引中的元素。
`SeriesGroupBy.value_counts`([normalize, ...])

绘图和可视化#

`DataFrameGroupBy.boxplot`([subplots, column, ...])	从 DataFrameGroupBy 数据中创建箱线图。
`DataFrameGroupBy.hist`([column, by, grid, ...])	创建 DataFrame 列的直方图。
`SeriesGroupBy.hist`([by, ax, grid, ...])	使用 matplotlib 绘制输入序列的直方图。
`DataFrameGroupBy.plot`	创建 Series 或 DataFrame 的绘图。
`SeriesGroupBy.plot`	创建 Series 或 DataFrame 的绘图。