分组#

pandas.api.typing.DataFrameGroupBypandas.api.typing.SeriesGroupBy 实例分别由 groupby 调用 pandas.DataFrame.groupby()pandas.Series.groupby() 返回。

索引,迭代#

DataFrameGroupBy.__iter__()

分组迭代器。

SeriesGroupBy.__iter__()

分组迭代器。

DataFrameGroupBy.groups

字典 {分组名称 -> 分组标签}。

SeriesGroupBy.groups

字典 {分组名称 -> 分组标签}。

DataFrameGroupBy.indices

字典 {分组名称 -> 分组索引}。

SeriesGroupBy.indices

字典 {分组名称 -> 分组索引}。

DataFrameGroupBy.get_group(name[, obj])

从具有指定名称的分组构建 DataFrame。

SeriesGroupBy.get_group(name[, obj])

从具有指定名称的分组构建 DataFrame。

Grouper(*args, **kwargs)

Grouper 允许用户为对象指定 groupby 指令。

函数应用助手#

NamedAgg(column, aggfunc)

用于列特定聚合的助手,可以控制输出列名。

函数应用#

SeriesGroupBy.apply(func, *args, **kwargs)

按组应用函数 func 并将结果组合在一起。

DataFrameGroupBy.apply(func, *args[, ...])

按组应用函数 func 并将结果组合在一起。

SeriesGroupBy.agg([func, engine, engine_kwargs])

使用一个或多个操作在指定轴上进行聚合。

DataFrameGroupBy.agg([func, engine, ...])

使用一个或多个操作在指定轴上进行聚合。

SeriesGroupBy.aggregate([func, engine, ...])

使用一个或多个操作在指定轴上进行聚合。

DataFrameGroupBy.aggregate([func, engine, ...])

使用一个或多个操作在指定轴上进行聚合。

SeriesGroupBy.transform(func, *args[, ...])

调用在每个组上生成相同索引的 Series 的函数。

DataFrameGroupBy.transform(func, *args[, ...])

调用在每个组上生成相同索引的 DataFrame 的函数。

SeriesGroupBy.pipe(func, *args, **kwargs)

将带有参数的 func 应用于此 GroupBy 对象并返回其结果。

DataFrameGroupBy.pipe(func, *args, **kwargs)

将带有参数的 func 应用于此 GroupBy 对象并返回其结果。

DataFrameGroupBy.filter(func[, dropna])

过滤不满足条件的组中的元素。

SeriesGroupBy.filter(func[, dropna])

过滤不满足条件的组中的元素。

DataFrameGroupBy 计算/描述性统计#

DataFrameGroupBy.all([skipna])

如果组中所有值都为真,则返回 True,否则返回 False。

DataFrameGroupBy.any([skipna])

如果组中任何值为真,则返回 True,否则返回 False。

DataFrameGroupBy.bfill([limit])

向后填充值。

DataFrameGroupBy.corr([method, min_periods, ...])

计算列的成对相关性,排除 NA/空值。

DataFrameGroupBy.corrwith(other[, axis, ...])

计算成对相关性。

DataFrameGroupBy.count()

计算组的计数,排除缺失值。

DataFrameGroupBy.cov([min_periods, ddof, ...])

计算列的成对协方差,排除 NA/空值。

DataFrameGroupBy.cumcount([ascending])

对每个组中的每个项目编号,从 0 到该组的长度 - 1。

DataFrameGroupBy.cummax([axis, numeric_only])

每个组的累积最大值。

DataFrameGroupBy.cummin([axis, numeric_only])

每个组的累积最小值。

DataFrameGroupBy.cumprod([axis])

每个组的累积乘积。

DataFrameGroupBy.cumsum([axis])

对每个分组进行累加。

DataFrameGroupBy.describe([percentiles, ...])

生成描述性统计信息。

DataFrameGroupBy.diff([periods, axis])

元素的一阶离散差分。

DataFrameGroupBy.ffill([limit])

向前填充值。

DataFrameGroupBy.fillna([value, method, ...])

(已弃用) 使用指定的方法在分组内填充 NA/NaN 值。

DataFrameGroupBy.first([numeric_only, ...])

计算每个分组中每列的第一个条目。

DataFrameGroupBy.head([n])

返回每个分组的前 n 行。

DataFrameGroupBy.idxmax([axis, skipna, ...])

返回在请求的轴上最大值的第一次出现的索引。

DataFrameGroupBy.idxmin([axis, skipna, ...])

返回在请求的轴上最小值的第一次出现的索引。

DataFrameGroupBy.last([numeric_only, ...])

计算每个组内每列的最后一个条目。

DataFrameGroupBy.max([numeric_only, ...])

计算组值的最大值。

DataFrameGroupBy.mean([numeric_only, ...])

计算组的平均值,排除缺失值。

DataFrameGroupBy.median([numeric_only])

计算组的中位数,排除缺失值。

DataFrameGroupBy.min([numeric_only, ...])

计算组值的最小值。

DataFrameGroupBy.ngroup([ascending])

从 0 到组数 - 1 对每个组进行编号。

DataFrameGroupBy.nth

如果 n 是整数,则从每个组中获取第 n 行,否则获取行子集。

DataFrameGroupBy.nunique([dropna])

返回一个 DataFrame,其中包含每个位置的唯一元素计数。

DataFrameGroupBy.ohlc()

计算组的开盘价、最高价、最低价和收盘价,排除缺失值。

DataFrameGroupBy.pct_change([periods, ...])

计算每个值相对于组中前一个条目的百分比变化。

DataFrameGroupBy.prod([numeric_only, min_count])

计算组值的乘积。

DataFrameGroupBy.quantile([q, ...])

返回组值在给定分位数上的值,类似于 numpy.percentile。

DataFrameGroupBy.rank([method, ascending, ...])

提供每个组内值的排名。

DataFrameGroupBy.resample(rule, *args[, ...])

在使用 TimeGrouper 时提供重采样。

DataFrameGroupBy.rolling(*args, **kwargs)

返回一个滚动分组器,为每个组提供滚动功能。

DataFrameGroupBy.sample([n, frac, replace, ...])

从每个组中返回随机样本。

DataFrameGroupBy.sem([ddof, numeric_only])

计算组的平均值的标准误差,排除缺失值。

DataFrameGroupBy.shift([periods, freq, ...])

将每个组移动 periods 个观察值。

DataFrameGroupBy.size()

计算组的大小。

DataFrameGroupBy.skew([axis, skipna, ...])

返回组内的无偏偏度。

DataFrameGroupBy.std([ddof, engine, ...])

计算组的标准差,排除缺失值。

DataFrameGroupBy.sum([numeric_only, ...])

计算组值的总和。

DataFrameGroupBy.var([ddof, engine, ...])

计算组的方差,排除缺失值。

DataFrameGroupBy.tail([n])

返回每个组的最后 n 行。

DataFrameGroupBy.take(indices[, axis])

返回每个组中给定 *位置* 索引中的元素。

DataFrameGroupBy.value_counts([subset, ...])

返回包含唯一行计数的 Series 或 DataFrame。

SeriesGroupBy 计算 / 描述性统计#

SeriesGroupBy.all([skipna])

如果组中所有值都为真,则返回 True,否则返回 False。

SeriesGroupBy.any([skipna])

如果组中任何值为真,则返回 True,否则返回 False。

SeriesGroupBy.bfill([limit])

向后填充值。

SeriesGroupBy.corr(other[, method, min_periods])

计算与 other Series 的相关性,排除缺失值。

SeriesGroupBy.count()

计算组的计数,排除缺失值。

SeriesGroupBy.cov(other[, min_periods, ddof])

计算与 Series 的协方差,排除缺失值。

SeriesGroupBy.cumcount([ascending])

对每个组中的每个项目编号,从 0 到该组的长度 - 1。

SeriesGroupBy.cummax([axis, numeric_only])

每个组的累积最大值。

SeriesGroupBy.cummin([axis, numeric_only])

每个组的累积最小值。

SeriesGroupBy.cumprod([axis])

每个组的累积乘积。

SeriesGroupBy.cumsum([axis])

对每个分组进行累加。

SeriesGroupBy.describe([percentiles, ...])

生成描述性统计信息。

SeriesGroupBy.diff([periods, axis])

元素的一阶离散差分。

SeriesGroupBy.ffill([limit])

向前填充值。

SeriesGroupBy.fillna([value, method, axis, ...])

(已弃用) 使用指定的方法在分组内填充 NA/NaN 值。

SeriesGroupBy.first([numeric_only, ...])

计算每个分组中每列的第一个条目。

SeriesGroupBy.head([n])

返回每个分组的前 n 行。

SeriesGroupBy.last([numeric_only, ...])

计算每个组内每列的最后一个条目。

SeriesGroupBy.idxmax([axis, skipna])

返回最大值的行标签。

SeriesGroupBy.idxmin([axis, skipna])

返回最小值的索引标签。

SeriesGroupBy.is_monotonic_increasing

返回每个分组的值是否单调递增。

SeriesGroupBy.is_monotonic_decreasing

返回每个分组的值是否单调递减。

SeriesGroupBy.max([numeric_only, min_count, ...])

计算组值的最大值。

SeriesGroupBy.mean([numeric_only, engine, ...])

计算组的平均值,排除缺失值。

SeriesGroupBy.median([numeric_only])

计算组的中位数,排除缺失值。

SeriesGroupBy.min([numeric_only, min_count, ...])

计算组值的最小值。

SeriesGroupBy.ngroup([ascending])

从 0 到组数 - 1 对每个组进行编号。

SeriesGroupBy.nlargest([n, keep])

返回最大的 n 个元素。

SeriesGroupBy.nsmallest([n, keep])

返回最小的 n 个元素。

SeriesGroupBy.nth

如果 n 是整数,则从每个组中获取第 n 行,否则获取行子集。

SeriesGroupBy.nunique([dropna])

返回分组中唯一元素的数量。

SeriesGroupBy.unique()

返回每个分组的唯一值。

SeriesGroupBy.ohlc()

计算组的开盘价、最高价、最低价和收盘价,排除缺失值。

SeriesGroupBy.pct_change([periods, ...])

计算每个值相对于组中前一个条目的百分比变化。

SeriesGroupBy.prod([numeric_only, min_count])

计算组值的乘积。

SeriesGroupBy.quantile([q, interpolation, ...])

返回组值在给定分位数上的值,类似于 numpy.percentile。

SeriesGroupBy.rank([method, ascending, ...])

提供每个组内值的排名。

SeriesGroupBy.resample(rule, *args[, ...])

在使用 TimeGrouper 时提供重采样。

SeriesGroupBy.rolling(*args, **kwargs)

返回一个滚动分组器,为每个组提供滚动功能。

SeriesGroupBy.sample([n, frac, replace, ...])

从每个组中返回随机样本。

SeriesGroupBy.sem([ddof, numeric_only])

计算组的平均值的标准误差,排除缺失值。

SeriesGroupBy.shift([periods, freq, axis, ...])

将每个组移动 periods 个观察值。

SeriesGroupBy.size()

计算组的大小。

SeriesGroupBy.skew([axis, skipna, numeric_only])

返回组内的无偏偏度。

SeriesGroupBy.std([ddof, engine, ...])

计算组的标准差,排除缺失值。

SeriesGroupBy.sum([numeric_only, min_count, ...])

计算组值的总和。

SeriesGroupBy.var([ddof, engine, ...])

计算组的方差,排除缺失值。

SeriesGroupBy.tail([n])

返回每个组的最后 n 行。

SeriesGroupBy.take(indices[, axis])

返回每个组中给定 *位置* 索引中的元素。

SeriesGroupBy.value_counts([normalize, ...])

绘图和可视化#

DataFrameGroupBy.boxplot([subplots, column, ...])

从 DataFrameGroupBy 数据中创建箱线图。

DataFrameGroupBy.hist([column, by, grid, ...])

创建 DataFrame 列的直方图。

SeriesGroupBy.hist([by, ax, grid, ...])

使用 matplotlib 绘制输入序列的直方图。

DataFrameGroupBy.plot

创建 Series 或 DataFrame 的绘图。

SeriesGroupBy.plot

创建 Series 或 DataFrame 的绘图。