pandas.DataFrame.pivot#
- DataFrame.pivot(*, columns, index=<no_default>, values=<no_default>)[源码]#
返回按给定的索引/列值组织的重塑 DataFrame。
根据列值重塑数据(生成“透视表”)。使用指定的 index / columns 的唯一值来形成结果 DataFrame 的轴。此函数不支持数据聚合,多个值将导致列中出现 MultiIndex。有关重塑的更多信息,请参阅 用户指南。
- 参数:
- columnsHashable 或前者的序列
用于创建新 DataFrame 列的列。
- indexHashable 或以上项的序列,可选
用于创建新 DataFrame 索引的列。如果未给出,则使用现有索引。
- valuesHashable 或以上项的序列,可选
用于填充新 DataFrame 值的列。如果未指定,将使用所有剩余的列,结果将具有分层索引的列。
- 返回:
- DataFrame
返回重塑后的 DataFrame。
- 引发:
- ValueError
当 index、columns 组合有多个值时。当您需要聚合时,请使用 DataFrame.pivot_table。
另请参阅
DataFrame.pivot_tablepivot 的推广版本,可以处理一对索引/列的重复值。
DataFrame.unstack基于索引值而不是列进行透视。
wide_to_long将宽面板数据转换为长格式。灵活性不如 melt,但比 melt 更易于使用。
注意
有关更精细的控制,请参阅分层索引文档以及相关的 stack/unstack 方法。
有关更多示例,请参阅 用户指南。
示例
>>> df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two', ... 'two'], ... 'bar': ['A', 'B', 'C', 'A', 'B', 'C'], ... 'baz': [1, 2, 3, 4, 5, 6], ... 'zoo': ['x', 'y', 'z', 'q', 'w', 't']}) >>> df foo bar baz zoo 0 one A 1 x 1 one B 2 y 2 one C 3 z 3 two A 4 q 4 two B 5 w 5 two C 6 t
>>> df.pivot(index='foo', columns='bar', values='baz') bar A B C foo one 1 2 3 two 4 5 6
>>> df.pivot(index='foo', columns='bar')['baz'] bar A B C foo one 1 2 3 two 4 5 6
>>> df.pivot(index='foo', columns='bar', values=['baz', 'zoo']) baz zoo bar A B C A B C foo one 1 2 3 x y z two 4 5 6 q w t
您也可以分配一个列名列表或一个索引名列表。
>>> df = pd.DataFrame({ ... "lev1": [1, 1, 1, 2, 2, 2], ... "lev2": [1, 1, 2, 1, 1, 2], ... "lev3": [1, 2, 1, 2, 1, 2], ... "lev4": [1, 2, 3, 4, 5, 6], ... "values": [0, 1, 2, 3, 4, 5]}) >>> df lev1 lev2 lev3 lev4 values 0 1 1 1 1 0 1 1 1 2 2 1 2 1 2 1 3 2 3 2 1 2 4 3 4 2 1 1 5 4 5 2 2 2 6 5
>>> df.pivot(index="lev1", columns=["lev2", "lev3"], values="values") lev2 1 2 lev3 1 2 1 2 lev1 1 0.0 1.0 2.0 NaN 2 4.0 3.0 NaN 5.0
>>> df.pivot(index=["lev1", "lev2"], columns=["lev3"], values="values") lev3 1 2 lev1 lev2 1 1 0.0 1.0 2 2.0 NaN 2 1 4.0 3.0 2 NaN 5.0
如果存在任何重复项,将引发 ValueError。
>>> df = pd.DataFrame({"foo": ['one', 'one', 'two', 'two'], ... "bar": ['A', 'A', 'B', 'C'], ... "baz": [1, 2, 3, 4]}) >>> df foo bar baz 0 one A 1 1 one A 2 2 two B 3 3 two C 4
请注意,我们 index 和 columns 参数的前两行是相同的。
>>> df.pivot(index='foo', columns='bar', values='baz') Traceback (most recent call last): ... ValueError: Index contains duplicate entries, cannot reshape