DataFrame#
构造函数#
|
二维的、大小可变的、可能异构的表格数据。 |
属性和底层数据#
轴
DataFrame 的索引(行标签)。 |
|
DataFrame 的列标签。 |
返回 DataFrame 中的数据类型。 |
|
|
打印 DataFrame 的简洁摘要。 |
|
根据列的数据类型返回 DataFrame 列的子集。 |
返回 DataFrame 的 Numpy 表示。 |
|
返回一个表示 DataFrame 轴的列表。 |
|
返回一个表示轴/数组维数的整数。 |
|
返回一个表示此对象中元素数量的整数。 |
|
返回一个表示 DataFrame 维度的元组。 |
|
|
返回每列的内存使用量(以字节为单位)。 |
指示 Series/DataFrame 是否为空。 |
|
|
返回一个带有更新标志的新对象。 |
转换#
|
将 pandas 对象强制转换为指定的数据类型 |
|
将列从 numpy 数据类型转换为支持 |
|
尝试为 object 列推断更合适的数据类型。 |
|
复制此对象的索引和数据。 |
|
将 DataFrame 转换为 NumPy 数组。 |
索引、迭代#
|
返回前 n 行。 |
通过行/列标签对访问单个值。 |
|
通过整数位置通过行/列对访问单个值。 |
|
通过标签或布尔数组访问一组行和列。 |
|
纯粹基于整数位置的索引,用于按位置选择。 |
|
|
在指定位置将列插入 DataFrame。 |
迭代信息轴。 |
|
迭代(列名,Series)对。 |
|
获取“信息轴”(更多信息请参阅索引)。 |
|
将 DataFrame 行迭代为(索引,Series)对。 |
|
|
将 DataFrame 行迭代为命名元组。 |
|
返回项并将其从 DataFrame 中删除。 |
|
返回最后 n 行。 |
|
从 Series/DataFrame 返回横截面。 |
|
获取对象中给定键(例如 DataFrame 列)的项。 |
|
DataFrame 中的每个元素是否包含在 values 中。 |
|
替换条件为 False 的值。 |
|
替换条件为 True 的值。 |
|
使用布尔表达式查询 DataFrame 的列。 |
|
在位置 loc 的列中设置给定值。 |
有关 .at、.iat、.loc 和 .iloc 的更多信息,请参阅 索引文档。
二元运算符函数#
|
获取 DataFrame 与其他对象逐列相加。 |
|
获取 DataFrame 与其他对象逐元素相加(二元运算符 add)。 |
|
获取 DataFrame 与其他对象逐元素相减(二元运算符 sub)。 |
|
获取 DataFrame 与其他对象逐元素相乘(二元运算符 mul)。 |
|
获取 DataFrame 与其他对象逐元素浮点除法(二元运算符 truediv)。 |
|
获取 DataFrame 与其他对象逐元素浮点除法(二元运算符 truediv)。 |
|
获取 DataFrame 与其他对象逐元素整数除法(二元运算符 floordiv)。 |
|
获取 DataFrame 与其他对象逐元素取模(二元运算符 mod)。 |
|
获取 DataFrame 与其他对象逐元素幂运算(二元运算符 pow)。 |
|
计算 DataFrame 和其他对象之间的矩阵乘法。 |
|
获取 DataFrame 与其他对象逐元素相加(二元运算符 radd)。 |
|
获取 DataFrame 与其他对象逐元素相减(二元运算符 rsub)。 |
|
获取 DataFrame 与其他对象逐元素相乘(二元运算符 rmul)。 |
|
获取 DataFrame 与其他对象逐元素浮点除法(二元运算符 rtruediv)。 |
|
获取 DataFrame 与其他对象逐元素浮点除法(二元运算符 rtruediv)。 |
|
获取 DataFrame 与其他对象逐元素整数除法(二元运算符 rfloordiv)。 |
|
获取 DataFrame 与其他对象逐元素取模(二元运算符 rmod)。 |
|
获取 DataFrame 与其他对象逐元素幂运算(二元运算符 rpow)。 |
|
获取 DataFrame 与其他对象逐元素大于比较(二元运算符 lt)。 |
|
获取 DataFrame 与其他对象逐元素大于比较(二元运算符 gt)。 |
|
获取 DataFrame 与其他对象逐元素大于等于比较(二元运算符 le)。 |
|
获取 DataFrame 与其他对象逐元素大于等于比较(二元运算符 ge)。 |
|
获取 DataFrame 与其他对象逐元素不等于比较(二元运算符 ne)。 |
|
获取 DataFrame 与其他对象逐元素等于比较(二元运算符 eq)。 |
|
与另一个 DataFrame 进行列组合。 |
|
用 other 中相同位置的值更新空值元素。 |
函数应用、GroupBy 和窗口#
|
沿 DataFrame 的轴应用函数。 |
|
逐元素地将函数应用于 DataFrame。 |
|
应用期望 Series 或 DataFrame 的链式函数。 |
|
沿指定轴对一个或多个操作进行聚合。 |
|
沿指定轴对一个或多个操作进行聚合。 |
|
调用 |
|
使用映射器或按列的 Series 对 DataFrame 进行分组。 |
|
提供滚动窗口计算。 |
|
提供扩展窗口计算。 |
|
提供指数加权 (EW) 计算。 |
计算/描述性统计#
返回一个 Series/DataFrame,其中包含每个元素的绝对数值。 |
|
|
返回所有元素是否为 True,可能沿轴。 |
|
返回任何元素是否为 True,可能沿轴。 |
|
在输入阈值处修剪值。 |
|
计算列的成对相关性,排除 NA/null 值。 |
|
计算成对相关性。 |
|
计算每列或每行的非 NA 单元格数。 |
|
计算列的成对协方差,排除 NA/null 值。 |
|
沿 DataFrame 或 Series 轴返回累积最大值。 |
|
沿 DataFrame 或 Series 轴返回累积最小值。 |
|
沿 DataFrame 或 Series 轴返回累积乘积。 |
|
沿 DataFrame 或 Series 轴返回累积和。 |
|
生成描述性统计信息。 |
|
元素的离散差值。 |
|
计算描述 DataFrame 列操作的字符串。 |
|
返回所请求轴上的无偏峰度。 |
|
返回所请求轴上的无偏峰度。 |
|
返回所请求轴上值的最大值。 |
|
返回所请求轴上值的平均值。 |
|
返回所请求轴上值的中间值。 |
|
返回所请求轴上值的最小值。 |
|
获取所选轴上每个元素(或最常见值)。 |
|
当前元素与先前元素之间的分数变化。 |
|
返回所请求轴上值的乘积。 |
|
返回所请求轴上值的乘积。 |
|
返回所请求轴上的分位数(百分位数)值。 |
|
沿轴计算数值数据排名(1 到 n)。 |
|
将 DataFrame 中的数值列四舍五入到可变的小数位数。 |
|
返回请求轴上未偏倚的均值标准误差。 |
|
返回请求轴上未偏倚的偏度。 |
|
返回请求轴上的值之和。 |
|
返回请求轴上的样本标准差。 |
|
返回请求轴上的未偏倚方差。 |
|
计算指定轴上不同元素的数量。 |
|
返回一个 Series,其中包含 DataFrame 中每个不同行的频率。 |
重索引/选择/标签操作#
|
为标签添加前缀字符串prefix。 |
|
为标签添加后缀字符串suffix。 |
|
使用指定的连接方法将两个对象按其轴对齐。 |
|
选择一天中特定时间的值(例如,上午 9:30)。 |
|
选择一天中特定时间段内的值(例如,上午 9:00-9:30)。 |
|
从行或列中删除指定的标签。 |
|
返回已删除重复行的 DataFrame。 |
|
返回表示重复行的布尔 Series。 |
|
测试两个对象是否包含相同元素。 |
|
根据指定的索引标签子集化 DataFrame 或 Series。 |
|
返回请求轴上最大值第一次出现的索引。 |
|
返回请求轴上最小值第一次出现的索引。 |
|
使用可选的填充逻辑将 DataFrame 匹配到新索引。 |
|
返回一个具有与另一个对象匹配的索引的对象。 |
|
重命名列或索引标签。 |
|
设置索引或列的轴名称。 |
|
重置索引或其某个级别。 |
|
从对象的轴返回随机样本项。 |
|
将所需的索引分配给给定的轴。 |
|
使用现有列设置 DataFrame 索引。 |
|
沿轴返回给定位置索引中的元素。 |
|
截断 Series 或 DataFrame 在某个索引值之前和之后的部分。 |
缺失数据处理#
|
使用下一个有效观测值填充 NA/NaN 值以填补空白。 |
|
删除缺失值。 |
|
通过传播最后一个有效观测值来填充 NA/NaN 值。 |
|
用value填充 NA/NaN 值。 |
|
使用插值方法填充 NaN 值。 |
检测缺失值。 |
|
DataFrame.isnull 是 DataFrame.isna 的别名。 |
|
检测存在的(非缺失)值。 |
|
DataFrame.notnull 是 DataFrame.notna 的别名。 |
|
|
用value替换to_replace中给定的值。 |
重塑、排序、转置#
|
返回删除指定索引/列级别的 Series/DataFrame。 |
|
返回按给定的索引/列值组织的重塑 DataFrame。 |
|
创建电子表格样式的透视表作为 DataFrame。 |
|
使用输入 |
|
按某个轴的值进行排序。 |
|
按标签(沿某个轴)对对象进行排序。 |
|
返回按columns降序排列的前n行。 |
|
返回按columns升序排列的前n行。 |
|
交换 |
|
将指定的级别从列堆叠到索引。 |
|
将(必然是分层的)索引标签的一个级别进行数据透视。 |
|
将 DataFrame 从宽格式转换为长格式,并可选择保留标识符。 |
|
将列表状元素的每个元素转换为一行,复制索引值。 |
|
将一维轴对象压缩成标量。 |
从 pandas 对象返回一个 xarray 对象。 |
|
DataFrame 的转置。 |
|
|
转置索引和列。 |
组合/比较/连接/合并#
|
为 DataFrame 分配新列。 |
|
比较另一个 DataFrame 并显示差异。 |
|
连接另一个 DataFrame 的列。 |
|
使用数据库风格的连接合并 DataFrame 或命名 Series 对象。 |
|
使用来自另一个 DataFrame 的非 NA 值就地修改。 |
标志#
标志指的是 pandas 对象的属性。数据集的属性(如记录日期、访问 URL 等)应存储在DataFrame.attrs中。
|
适用于 pandas 对象的标志。 |
元数据#
DataFrame.attrs 是一个用于存储此 DataFrame 全局元数据的字典。
警告
DataFrame.attrs 被认为是实验性的,可能会在未通知的情况下更改。
此数据集的全局属性字典。 |
绘图#
DataFrame.plot 既是可调用方法,也是特定绘图方法的命名空间属性,形式为DataFrame.plot.<kind>。
|
DataFrame 绘图访问器和方法 |
|
绘制堆叠面积图。 |
|
垂直条形图。 |
|
绘制水平条形图。 |
|
绘制 DataFrame 列的箱线图。 |
|
使用高斯核生成核密度估计图。 |
|
生成六边形分箱图。 |
|
绘制 DataFrame 列的直方图。 |
|
使用高斯核生成核密度估计图。 |
|
将 Series 或 DataFrame 绘制为折线图。 |
|
生成饼图。 |
|
创建具有可变标记点大小和颜色的散点图。 |
|
绘制 DataFrame 列的箱线图。 |
|
绘制 DataFrame 列的直方图。 |
稀疏访问器#
稀疏 dtype 特定的方法和属性在 DataFrame.sparse 访问器下提供。
非稀疏点与总(密集)数据点之比。 |
|
从 scipy 稀疏矩阵创建新的 DataFrame。 |
将 DataFrame 的内容作为稀疏 SciPy COO 矩阵返回。 |
|
将具有稀疏值的 DataFrame 转换为密集格式。 |
序列化/IO/转换#
|
从表格 Arrow 对象构造 DataFrame。 |
|
从数组或字典的字典构造 DataFrame。 |
|
将结构化或记录式 ndarray 转换为 DataFrame。 |
|
将 DataFrame 写入 Optimized Row Columnar (ORC) 格式。 |
|
将 DataFrame 写入二进制 parquet 格式。 |
|
将对象 pickle(序列化)到文件。 |
|
将对象写入逗号分隔值 (csv) 文件。 |
|
使用 HDFStore 将包含的数据写入 HDF5 文件。 |
|
将存储在 DataFrame 中的记录写入 SQL 数据库。 |
|
将 DataFrame 转换为字典。 |
|
将对象写入 Excel 工作表。 |
|
将对象转换为 JSON 字符串。 |
|
将 DataFrame 渲染为 HTML 表。 |
|
将 DataFrame 写入二进制 Feather 格式。 |
|
将对象渲染为 LaTeX tabular、longtable 或嵌套表。 |
|
将 DataFrame 对象导出到 Stata dta 格式。 |
|
将 DataFrame 转换为 NumPy 记录数组。 |
|
将 DataFrame 渲染为控制台友好的表格输出。 |
|
将对象复制到系统剪贴板。 |
|
以 Markdown 友好的格式打印 DataFrame。 |
返回一个 Styler 对象。 |
|
|
(已弃用) 返回实现互操作协议的 DataFrame 互操作对象。 |