数据帧#
构造函数#
|
二维、大小可变、可能异构的表格数据。 |
属性和底层数据#
轴
数据帧的索引(行标签)。 |
|
数据帧的列标签。 |
返回数据帧中的数据类型。 |
|
|
打印数据帧的简洁摘要。 |
|
根据列数据类型返回数据帧列的子集。 |
返回数据帧的 NumPy 表示。 |
|
返回表示数据帧轴的列表。 |
|
返回表示轴/数组维数的整数。 |
|
返回表示此对象中元素数量的整数。 |
|
返回表示数据帧维度的元组。 |
|
|
返回每列的内存使用量(以字节为单位)。 |
指示 Series/DataFrame 是否为空。 |
|
|
返回具有更新标志的新对象。 |
转换#
|
将 pandas 对象转换为指定的数据类型 |
|
使用支持 |
|
尝试为对象列推断出更好的数据类型。 |
|
复制此对象的索引和数据。 |
(已弃用) 返回单个元素 Series 或 DataFrame 的布尔值。 |
索引,迭代#
|
返回前 n 行。 |
访问行/列标签对的单个值。 |
|
通过整数位置访问行/列对的单个值。 |
|
通过标签或布尔数组访问一组行和列。 |
|
(已弃用) 纯粹基于整数位置的索引,用于按位置进行选择。 |
|
|
在指定位置将列插入 DataFrame 中。 |
遍历信息轴。 |
|
遍历 (列名,Series) 对。 |
|
获取“信息轴”(有关更多信息,请参见索引)。 |
|
将 DataFrame 行作为 (索引,Series) 对进行迭代。 |
|
|
将 DataFrame 行作为命名元组进行迭代。 |
|
返回项目并从框架中删除。 |
|
返回最后 n 行。 |
|
从 Series/DataFrame 返回横截面。 |
|
获取给定键的对象中的项目(例如:DataFrame 列)。 |
|
判断 DataFrame 中的每个元素是否包含在 values 中。 |
|
替换条件为 False 的值。 |
|
替换条件为 True 的值。 |
|
使用布尔表达式查询 DataFrame 的列。 |
有关 .at
、.iat
、.loc
和 .iloc
的更多信息,请参见 索引文档。
二元运算符函数#
|
获取 DataFrame 和 other 的加法,按列进行。 |
|
获取 DataFrame 和 other 的加法,逐元素进行(二元运算符 add)。 |
|
获取 DataFrame 和 other 的减法,逐元素进行(二元运算符 sub)。 |
|
获取 DataFrame 和 other 的乘法,逐元素进行(二元运算符 mul)。 |
|
获取 DataFrame 和 other 的浮点除法,逐元素进行(二元运算符 truediv)。 |
|
获取 DataFrame 和 other 的浮点除法,逐元素进行(二元运算符 truediv)。 |
|
获取 DataFrame 和 other 的整数除法,逐元素进行(二元运算符 floordiv)。 |
|
获取数据帧和另一个对象的模,逐元素(二元运算符 mod)。 |
|
获取数据帧和另一个对象的指数幂,逐元素(二元运算符 pow)。 |
|
计算数据帧和另一个对象之间的矩阵乘法。 |
|
获取数据帧和另一个对象的加法,逐元素(二元运算符 radd)。 |
|
获取数据帧和另一个对象的减法,逐元素(二元运算符 rsub)。 |
|
获取数据帧和另一个对象的乘法,逐元素(二元运算符 rmul)。 |
|
获取数据帧和另一个对象的浮点除法,逐元素(二元运算符 rtruediv)。 |
|
获取数据帧和另一个对象的浮点除法,逐元素(二元运算符 rtruediv)。 |
|
获取数据帧和另一个数据帧的整数除法,逐元素(二元运算符 rfloordiv)。 |
|
获取数据帧和另一个数据帧的模运算,逐元素(二元运算符 rmod)。 |
|
获取数据帧和另一个数据帧的指数幂运算,逐元素(二元运算符 rpow)。 |
|
获取数据帧和另一个数据帧的小于运算,逐元素(二元运算符 lt)。 |
|
获取数据帧和另一个数据帧的大于运算,逐元素(二元运算符 gt)。 |
|
获取数据帧和另一个数据帧的小于等于运算,逐元素(二元运算符 le)。 |
|
获取数据帧和另一个数据帧的大于等于运算,逐元素(二元运算符 ge)。 |
|
获取数据帧和另一个数据帧的不等于运算,逐元素(二元运算符 ne)。 |
|
获取数据帧和另一个数据帧的等于运算,逐元素(二元运算符 eq)。 |
|
对另一个 DataFrame 执行按列合并。 |
|
使用 other 中相同位置的值更新空元素。 |
函数应用、GroupBy 和窗口#
|
沿着 DataFrame 的轴应用函数。 |
|
逐元素地将函数应用于 DataFrame。 |
|
(已弃用) 逐元素地将函数应用于 DataFrame。 |
|
应用期望 Series 或 DataFrames 的可链式函数。 |
|
使用一个或多个操作在指定的轴上进行聚合。 |
|
使用一个或多个操作在指定的轴上进行聚合。 |
|
在 self 上调用 |
|
使用映射器或列的 Series 对 DataFrame 进行分组。 |
|
提供滚动窗口计算。 |
|
提供扩展窗口计算。 |
|
提供指数加权 (EW) 计算。 |
计算/描述性统计#
返回一个 Series/DataFrame,其中包含每个元素的绝对数值。 |
|
|
返回所有元素是否为 True,可能跨越轴。 |
|
返回任何元素是否为 True,可能跨越轴。 |
|
在输入阈值处修剪值。 |
|
计算列的成对相关性,排除 NA/空值。 |
|
计算成对相关性。 |
|
计算每列或每行的非 NA 单元格数。 |
|
计算列的成对协方差,排除 NA/空值。 |
|
返回 DataFrame 或 Series 轴上的累积最大值。 |
|
返回 DataFrame 或 Series 轴上的累积最小值。 |
|
返回 DataFrame 或 Series 轴上的累积乘积。 |
|
返回 DataFrame 或 Series 轴上的累积和。 |
|
生成描述性统计数据。 |
|
元素的第一个离散差。 |
|
评估描述 DataFrame 列操作的字符串。 |
|
返回请求轴上的无偏峰度。 |
|
返回请求轴上的无偏峰度。 |
|
返回请求轴上值的最大值。 |
|
返回请求轴上值的平均值。 |
|
返回请求轴上值的中间值。 |
|
返回请求轴上值的最小值。 |
|
获取沿选定轴的每个元素的众数。 |
|
当前元素与前一个元素之间的分数变化。 |
|
返回沿指定轴的值的乘积。 |
|
返回沿指定轴的值的乘积。 |
|
返回沿指定轴的给定分位数的值。 |
|
沿指定轴计算数值数据的排名(从 1 到 n)。 |
|
将 DataFrame 四舍五入到可变的小数位数。 |
|
返回沿指定轴的平均值的无偏标准误差。 |
|
返回沿指定轴的无偏偏度。 |
|
返回沿指定轴的值的总和。 |
|
返回沿指定轴的样本标准差。 |
|
返回沿指定轴的无偏方差。 |
|
计算指定轴上不同元素的数量。 |
|
返回一个 Series,包含 DataFrame 中每个不同行的频率。 |
重新索引/选择/标签操作#
|
在标签前添加字符串 prefix。 |
|
在标签后添加字符串 suffix。 |
|
根据指定的连接方法,将两个对象在其轴上对齐。 |
|
选择特定时间(例如,上午 9:30)的值。 |
|
选择特定时间段(例如,上午 9:00-9:30)的值。 |
|
从行或列中删除指定的标签。 |
|
返回删除重复行的 DataFrame。 |
|
返回一个布尔 Series,表示重复行。 |
|
测试两个对象是否包含相同的元素。 |
|
根据指定的索引标签对 DataFrame 的行或列进行子集选择。 |
|
(已弃用) 根据日期偏移选择时间序列数据的初始时间段。 |
|
返回前 n 行。 |
|
返回请求轴上最大值的第一次出现的索引。 |
|
返回请求轴上最小值的第一次出现的索引。 |
|
(已弃用) 根据日期偏移选择时间序列数据的最后时间段。 |
|
将 DataFrame 调整为新的索引,并使用可选的填充逻辑。 |
|
返回一个与其他对象具有匹配索引的对象。 |
|
重命名列或索引标签。 |
|
设置索引或列的轴名称。 |
|
重置索引或其某个级别。 |
|
从对象的轴上返回随机样本项。 |
|
将所需索引分配给给定轴。 |
|
使用现有列设置 DataFrame 索引。 |
|
返回最后 n 行。 |
|
返回给定位置索引沿轴的元素。 |
|
截断某个索引值之前和之后的 Series 或 DataFrame。 |
缺失数据处理#
|
(已弃用) 使用下一个有效观察值填充 NA/NaN 值以填补空白。 |
|
使用下一个有效观察值填充 NA/NaN 值以填补空白。 |
|
删除缺失值。 |
|
通过将最后一个有效观察值传播到下一个有效观察值来填充 NA/NaN 值。 |
|
使用指定的方法填充 NA/NaN 值。 |
|
使用插值方法填充 NaN 值。 |
检测缺失值。 |
|
DataFrame.isnull 是 DataFrame.isna 的别名。 |
|
检测现有(非缺失)值。 |
|
DataFrame.notnull 是 DataFrame.notna 的别名。 |
|
|
(已弃用)通过将最后一个有效观测值传播到下一个有效观测值来填充 NA/NaN 值。 |
|
将 to_replace 中给出的值替换为 value。 |
重塑、排序、转置#
|
返回删除了请求的索引/列级别(s)的 Series/DataFrame。 |
|
返回根据给定的索引/列值组织的重塑后的 DataFrame。 |
|
创建一个类似电子表格的透视表作为 DataFrame。 |
|
使用输入顺序重新排列索引级别。 |
|
按任一轴上的值排序。 |
|
按标签(沿轴)对对象进行排序。 |
|
返回按 columns 降序排列的前 n 行。 |
|
返回按升序排列的 columns 中前 n 行。 |
|
在 |
|
将指定级别(s) 从列堆叠到索引。 |
|
将(必须是分层)索引标签的某个级别进行透视。 |
|
(已弃用) 交换轴并相应地交换值轴。 |
|
将 DataFrame 从宽格式转换为长格式,可以选择保留标识符。 |
|
将列表式中的每个元素转换为一行,复制索引值。 |
|
将一维轴对象压缩为标量。 |
从 pandas 对象返回一个 xarray 对象。 |
|
DataFrame 的转置。 |
|
|
转置索引和列。 |
组合/比较/连接/合并#
|
为 DataFrame 分配新列。 |
|
与另一个 DataFrame 进行比较并显示差异。 |
|
连接另一个 DataFrame 的列。 |
|
使用数据库风格的连接合并 DataFrame 或命名 Series 对象。 |
|
使用来自另一个 DataFrame 的非 NA 值进行就地修改。 |
标志#
标志指的是 pandas 对象的属性。数据集的属性(如记录日期、访问的 URL 等)应存储在 DataFrame.attrs
中。
|
应用于 pandas 对象的标志。 |
元数据#
DataFrame.attrs
是一个字典,用于存储此 DataFrame 的全局元数据。
警告
DataFrame.attrs
被认为是实验性的,可能会在没有警告的情况下发生变化。
此数据集的全局属性字典。 |
绘图#
DataFrame.plot
既是可调用方法,也是特定绘图方法的命名空间属性,形式为 DataFrame.plot.<kind>
。
|
DataFrame 绘图访问器和方法 |
|
绘制堆叠面积图。 |
|
垂直条形图。 |
|
绘制水平条形图。 |
|
绘制 DataFrame 列的箱线图。 |
|
使用高斯核生成核密度估计图。 |
|
生成六边形分箱图。 |
|
绘制 DataFrame 列的一个直方图。 |
|
使用高斯核生成核密度估计图。 |
|
将 Series 或 DataFrame 绘制为线。 |
|
生成饼图。 |
|
创建具有不同标记点大小和颜色的散点图。 |
|
从 DataFrame 列创建箱线图。 |
|
创建 DataFrame 列的直方图。 |
稀疏访问器#
稀疏数据类型特定的方法和属性在 DataFrame.sparse
访问器下提供。
非稀疏点与总(密集)数据点的比率。 |
|
从 scipy 稀疏矩阵创建一个新的 DataFrame。 |
将框架的内容作为稀疏 SciPy COO 矩阵返回。 |
|
将具有稀疏值的 DataFrame 转换为密集。 |
序列化/IO/转换#
|
从类似数组或字典的字典构造 DataFrame。 |
|
将结构化或记录 ndarray 转换为 DataFrame。 |
|
将 DataFrame 写入 ORC 格式。 |
|
将 DataFrame 写入二进制 parquet 格式。 |
|
将对象序列化(pickle)到文件。 |
|
将对象写入逗号分隔值 (csv) 文件。 |
|
使用 HDFStore 将包含的数据写入 HDF5 文件。 |
|
将存储在 DataFrame 中的记录写入 SQL 数据库。 |
|
将 DataFrame 转换为字典。 |
|
将对象写入 Excel 表格。 |
|
将对象转换为 JSON 字符串。 |
|
将 DataFrame 渲染为 HTML 表格。 |
|
将 DataFrame 写入二进制 Feather 格式。 |
|
将对象渲染为 LaTeX 表格、长表格或嵌套表格。 |
|
将 DataFrame 对象导出为 Stata dta 格式。 |
|
(已弃用) 将 DataFrame 写入 Google BigQuery 表格。 |
|
将 DataFrame 转换为 NumPy 记录数组。 |
|
将 DataFrame 渲染为控制台友好的表格输出。 |
|
将对象复制到系统剪贴板。 |
|
以 Markdown 友好的格式打印 DataFrame。 |
返回一个 Styler 对象。 |
|
|
返回实现交换协议的 DataFrame 交换对象。 |