序列#
构造函数#
|
具有轴标签(包括时间序列)的一维 ndarray。 |
属性#
轴
序列的索引(轴标签)。 |
|
支持此序列或索引的数据的 ExtensionArray。 |
|
根据 dtype 返回序列作为 ndarray 或类似 ndarray 的对象。 |
|
返回底层数据的 dtype 对象。 |
|
返回底层数据的形状元组。 |
|
返回底层数据的字节数。 |
|
底层数据的维度数,定义为 1。 |
|
返回底层数据的元素数量。 |
|
返回转置,定义为自身。 |
|
|
返回序列的内存使用量。 |
如果存在任何 NaN,则返回 True。 |
|
指示序列/数据帧是否为空。 |
|
返回底层数据的 dtype 对象。 |
|
返回序列的名称。 |
|
获取与该 pandas 对象关联的属性。 |
|
|
返回具有更新标志的新对象。 |
转换#
|
将 pandas 对象转换为指定的 dtype |
|
使用支持 |
|
尝试为对象列推断更好的数据类型。 |
|
复制此对象的索引和数据。 |
(已弃用) 返回单个元素 Series 或 DataFrame 的布尔值。 |
|
|
表示此 Series 或 Index 中值的 NumPy ndarray。 |
|
将 Series 从 DatetimeIndex 转换为 PeriodIndex。 |
|
转换为 Timestamp 的 DatetimeIndex,位于周期的开始。 |
返回值的列表。 |
|
|
将值作为 NumPy 数组返回。 |
索引,迭代#
|
从对象中获取给定键的项目(例如:DataFrame 列)。 |
访问行/列标签对的单个值。 |
|
通过整数位置访问行/列对的单个值。 |
|
通过标签或布尔数组访问一组行和列。 |
|
(已弃用) 纯粹基于整数位置的索引,用于按位置进行选择。 |
|
返回值的迭代器。 |
|
懒惰地迭代 (索引, 值) 元组。 |
|
返回索引的别名。 |
|
|
返回项目并从系列中删除。 |
将底层数据的第一个元素作为 Python 标量返回。 |
|
|
从 Series/DataFrame 返回横截面。 |
有关 .at
、.iat
、.loc
和 .iloc
的更多信息,请参阅 索引文档。
二元运算符函数#
|
返回系列和 other 的加法,逐元素(二元运算符 add)。 |
|
返回系列和 other 的减法,逐元素(二元运算符 sub)。 |
|
返回系列和 other 的乘法,逐元素(二元运算符 mul)。 |
|
返回系列和 other 的浮点除法,逐元素(二元运算符 truediv)。 |
|
返回系列和 other 的浮点除法,逐元素(二元运算符 truediv)。 |
|
返回 Series 和 other 的逐元素整数除法(二元运算符 floordiv)。 |
|
返回 Series 和 other 的逐元素取模(二元运算符 mod)。 |
|
返回 Series 和 other 的逐元素指数幂(二元运算符 pow)。 |
|
返回 Series 和 other 的逐元素加法(二元运算符 radd)。 |
|
返回 Series 和 other 的逐元素减法(二元运算符 rsub)。 |
|
返回 Series 和 other 的逐元素乘法(二元运算符 rmul)。 |
|
返回 Series 和 other 的逐元素浮点数除法(二元运算符 rtruediv)。 |
|
返回 Series 和 other 的逐元素浮点数除法(二元运算符 rtruediv)。 |
|
返回 Series 和 other 的逐元素整数除法(二元运算符 rfloordiv)。 |
|
返回 Series 和 other 的逐元素取模(二元运算符 rmod)。 |
|
返回级数和其他元素的指数幂(二元运算符 rpow)。 |
|
根据 func 将 Series 与 Series 或标量组合。 |
|
使用 'other' 中相同位置的值更新空元素。 |
|
将 Series 中的每个值舍入到给定的位数。 |
|
返回级数和其他元素的“小于”(二元运算符 lt)。 |
|
返回级数和其他元素的“大于”(二元运算符 gt)。 |
|
返回级数和其他元素的“小于或等于”(二元运算符 le)。 |
|
返回级数和其他元素的“大于或等于”(二元运算符 ge)。 |
|
返回级数和其他元素的“不等于”(二元运算符 ne)。 |
|
返回级数和其他元素的“等于”(二元运算符 eq)。 |
|
返回请求轴上值的乘积。 |
|
计算 Series 与 other 的列之间的点积。 |
函数应用、GroupBy 和窗口#
|
对 Series 的值调用函数。 |
|
使用一个或多个操作对指定轴进行聚合。 |
|
使用一个或多个操作对指定轴进行聚合。 |
|
对 self 调用 |
|
根据输入映射或函数映射 Series 的值。 |
|
使用映射器或列的 Series 对 Series 进行分组。 |
|
提供滚动窗口计算。 |
|
提供扩展窗口计算。 |
|
提供指数加权 (EW) 计算。 |
|
应用期望 Series 或 DataFrames 的可链接函数。 |
计算 / 描述性统计#
返回一个 Series/DataFrame,其中包含每个元素的绝对数值。 |
|
|
返回所有元素是否为 True,可能跨越轴。 |
|
返回任何元素是否为 True,可能跨越轴。 |
|
计算滞后 N 自相关。 |
|
返回等效于 left <= series <= right 的布尔型 Series。 |
|
在输入阈值处修剪值。 |
|
计算与 other Series 的相关性,排除缺失值。 |
返回 Series 中非 NA/空观察值的个数。 |
|
|
计算与 Series 的协方差,排除缺失值。 |
|
返回 DataFrame 或 Series 轴上的累积最大值。 |
|
返回 DataFrame 或 Series 轴上的累积最小值。 |
|
返回 DataFrame 或 Series 轴上的累积乘积。 |
|
返回 DataFrame 或 Series 轴上的累积和。 |
|
生成描述性统计信息。 |
|
元素的一阶离散差分。 |
|
将对象编码为枚举类型或分类变量。 |
|
返回所请求轴上的无偏峰度。 |
|
返回所请求轴上值的最大值。 |
|
返回所请求轴上值的平均值。 |
|
返回所请求轴上值的中间值。 |
|
返回所请求轴上值的最小值。 |
|
返回 Series 的众数。 |
|
返回最大的 n 个元素。 |
|
返回最小的 n 个元素。 |
|
当前元素与先前元素之间的分数变化。 |
|
返回请求轴上值的乘积。 |
|
返回给定分位数的值。 |
|
沿轴计算数值数据的秩(从 1 到 n)。 |
|
返回请求轴上的平均值的无偏标准误差。 |
|
返回请求轴上的无偏偏度。 |
|
返回请求轴上的样本标准差。 |
|
返回请求轴上值的总和。 |
|
返回请求轴上的无偏方差。 |
|
返回所请求轴上的无偏峰度。 |
返回 Series 对象的唯一值。 |
|
|
返回对象中唯一元素的数量。 |
如果对象中的值是唯一的,则返回布尔值。 |
|
如果对象中的值是单调递增的,则返回布尔值。 |
|
如果对象中的值是单调递减的,则返回布尔值。 |
|
|
返回一个包含唯一值计数的 Series。 |
重新索引/选择/标签操作#
|
根据指定的连接方法,将两个对象在其轴上对齐。 |
|
替换条件为 True 的值。 |
|
返回删除了指定索引标签的 Series。 |
|
返回删除了请求的索引/列级别(s)的 Series/DataFrame。 |
|
返回删除了重复值的 Series。 |
|
指示重复的 Series 值。 |
|
测试两个对象是否包含相同的元素。 |
|
(已弃用) 根据日期偏移选择时间序列数据的初始时间段。 |
|
返回前 n 行。 |
|
返回最大值的行标签。 |
|
返回最小值的行标签。 |
|
判断 Series 中的元素是否包含在 values 中。 |
|
(已弃用) 根据日期偏移选择时间序列数据的最后几个周期。 |
|
将 Series 调整为新的索引,并可选地进行填充操作。 |
|
返回一个与其他对象具有匹配索引的对象。 |
|
更改 Series 索引标签或名称。 |
|
设置索引或列的轴名称。 |
|
生成一个新的 DataFrame 或 Series,其索引已重置。 |
|
从对象轴返回随机样本。 |
|
将所需索引分配给给定轴。 |
|
返回给定位置索引沿轴的元素。 |
|
返回最后 n 行。 |
|
在某个索引值之前和之后截断 Series 或 DataFrame。 |
|
替换条件为 False 的值。 |
|
替换条件为 True 的值。 |
|
在标签前添加字符串 prefix。 |
|
在标签后添加字符串 suffix。 |
|
根据指定的索引标签子集 DataFrame 行或列。 |
缺失数据处理#
|
(已弃用) 使用下一个有效观测值填充缺失值。 |
|
使用下一个有效观测值填充缺失值。 |
|
返回一个删除缺失值的新 Series。 |
|
通过将最后一个有效观测值传播到下一个有效观测值来填充 NA/NaN 值。 |
|
使用指定的方法填充 NA/NaN 值。 |
|
使用插值方法填充 NaN 值。 |
检测缺失值。 |
|
Series.isnull 是 Series.isna 的别名。 |
|
检测现有(非缺失)值。 |
|
Series.notnull 是 Series.notna 的别名。 |
|
|
(已弃用)通过将最后一个有效观测值传播到下一个有效观测值来填充 NA/NaN 值。 |
|
将 to_replace 中给定的值替换为 value。 |
重塑,排序#
|
返回将对 Series 值进行排序的整数索引。 |
|
返回 Series 中最小值的整数位置。 |
|
返回 Series 中最大值的整数位置。 |
|
使用输入顺序重新排列索引级别。 |
|
按值排序。 |
|
按索引标签对 Series 进行排序。 |
|
在 |
|
将具有 MultiIndex 的 Series 展开(也称为透视),以生成 DataFrame。 |
|
将列表式中的每个元素转换为一行。 |
|
查找应插入元素以保持顺序的索引。 |
|
(已弃用) 将扁平化的基础数据作为 ndarray 或 ExtensionArray 返回。 |
|
重复 Series 的元素。 |
|
将一维轴对象压缩为标量。 |
|
(已弃用) 创建 Series 的新视图。 |
组合 / 比较 / 连接 / 合并#
|
与另一个 Series 比较并显示差异。 |
|
使用传递的 Series 中的值修改 Series。 |
访问器#
pandas 在各种访问器下提供特定于数据类型的方法。这些是 Series
中的独立命名空间,仅适用于特定数据类型。
|
|
|
|
|
|
|
|
|
|
|
数据类型 |
访问器 |
---|---|
Datetime、Timedelta、Period |
|
字符串 |
|
分类 |
|
稀疏 |
类似日期时间属性#
Series.dt
可用于访问系列的值作为类似日期时间的类型,并返回多个属性。这些属性可以通过 Series.dt.<property>
访问。
日期时间属性#
返回 python |
|
返回 |
|
返回带有时区的 |
|
日期时间中的年份。 |
|
月份,1 月为 1,12 月为 12。 |
|
日期时间中的日期。 |
|
日期时间中的小时。 |
|
日期时间中的分钟。 |
|
日期时间中的秒。 |
|
日期时间中的微秒。 |
|
日期时间中的纳秒。 |
|
一周中的日期,星期一为 0,星期日为 6。 |
|
一周中的日期,星期一为 0,星期日为 6。 |
|
一周中的日期,星期一为 0,星期日为 6。 |
|
一年中的序数日期。 |
|
一年中的序数日期。 |
|
该月的天数。 |
|
日期所在的季度。 |
|
指示日期是否为该月的第一天。 |
|
指示日期是否为该月的最后一天。 |
|
指示日期是否为季度的第一天。 |
|
指示日期是否为季度的最后一天。 |
|
指示日期是否为一年的第一天。 |
|
指示日期是否为一年的最后一天。 |
|
布尔值指示符,指示日期是否属于闰年。 |
|
该月的天数。 |
|
该月的天数。 |
|
返回时区。 |
|
返回此 PeriodArray 的频率对象。 |
|
|
将时间转换为午夜。 |
日期时间方法#
根据 ISO 8601 标准计算年份、周和日。 |
|
|
以特定频率转换为 PeriodArray/PeriodIndex。 |
(已弃用) 将数据作为 |
|
|
将无时区 Datetime 数组/索引本地化为有时区 Datetime 数组/索引。 |
|
将有时区 Datetime 数组/索引从一个时区转换为另一个时区。 |
|
将时间转换为午夜。 |
|
使用指定的 date_format 转换为索引。 |
|
对数据执行舍入操作,以达到指定的 freq。 |
|
对数据执行向下取整操作,以达到指定的 freq。 |
|
对数据执行向上取整操作,以达到指定的 freq。 |
|
返回指定语言环境的月份名称。 |
|
返回指定语言环境的星期名称。 |
|
周期属性#
获取周期的开始时间戳。 |
|
获取周期的结束时间戳。 |
时间增量属性#
每个元素的天数。 |
|
每个元素的秒数(>= 0 且小于 1 天)。 |
|
每个元素的微秒数(>= 0 且小于 1 秒)。 |
|
每个元素的纳秒数(>= 0 且小于 1 微秒)。 |
|
返回一个包含 Timedeltas 组件的 Dataframe。 |
|
Timedelta 方法#
返回一个包含原生 |
|
|
返回每个元素以秒为单位表示的总持续时间。 |
|
字符串处理#
Series.str
可用于访问系列的值作为字符串并对其应用多种方法。这些方法可以通过 Series.str.<function/property>
访问。
将 Series/Index 中的字符串转换为首字母大写。 |
|
将 Series/Index 中的字符串转换为小写。 |
|
|
使用给定的分隔符连接 Series/Index 中的字符串。 |
|
在 Series/Index 中的字符串的左侧和右侧填充空格。 |
|
测试模式或正则表达式是否包含在 Series 或 Index 的字符串中。 |
|
计算 Series/Index 中每个字符串中模式出现的次数。 |
|
使用指定的编码解码 Series/Index 中的字符字符串。 |
|
使用指定的编码对 Series/Index 中的字符字符串进行编码。 |
|
测试每个字符串元素的结尾是否与模式匹配。 |
|
将正则表达式 pat 中的捕获组提取为 DataFrame 中的列。 |
|
将正则表达式 pat 中的捕获组提取为 DataFrame 中的列。 |
|
返回 Series/Index 中每个字符串的最低索引。 |
|
在 Series/Index 中查找模式或正则表达式的所有出现。 |
|
确定每个字符串是否完全匹配正则表达式。 |
从每个组件中提取指定位置或指定键的元素。 |
|
|
返回 Series/Index 中每个字符串的最低索引。 |
|
使用传递的分隔符连接 Series/Index 中作为元素包含的列表。 |
计算 Series/Index 中每个元素的长度。 |
|
|
在 Series/Index 中的字符串右侧填充。 |
将 Series/Index 中的字符串转换为小写。 |
|
|
删除前导字符。 |
|
确定每个字符串是否以正则表达式的匹配项开头。 |
|
返回 Series/Index 中字符串的 Unicode 规范形式。 |
|
将 Series/Index 中的字符串填充到宽度。 |
|
在 sep 的第一次出现处拆分字符串。 |
|
从对象系列中删除前缀。 |
|
从对象系列中删除后缀。 |
|
重复 Series 或 Index 中的每个字符串。 |
|
替换 Series/Index 中模式/正则表达式中的每个出现。 |
|
返回 Series/Index 中每个字符串的最高索引。 |
|
返回 Series/Index 中每个字符串的最高索引。 |
|
在 Series/Index 中的字符串左侧填充。 |
|
在 sep 的最后一次出现处分割字符串。 |
|
删除尾随字符。 |
|
从 Series 或 Index 中的每个元素中切片子字符串。 |
|
用另一个值替换字符串的位置切片。 |
|
围绕给定的分隔符/分隔符分割字符串。 |
|
围绕给定的分隔符/分隔符分割字符串。 |
|
测试每个字符串元素的开头是否与模式匹配。 |
|
删除前导和尾随字符。 |
将 Series/Index 中的字符串转换为大小写转换。 |
|
将 Series/Index 中的字符串转换为标题大小写。 |
|
|
通过给定的映射表映射字符串中的所有字符。 |
将 Series/Index 中的字符串转换为大写。 |
|
|
在指定行宽处换行 Series/Index 中的字符串。 |
|
通过在 Series/Index 中的字符串前面添加 '0' 字符来填充字符串。 |
检查每个字符串中的所有字符是否都是字母数字。 |
|
检查每个字符串中的所有字符是否都是字母。 |
|
检查每个字符串中的所有字符是否都是数字。 |
|
检查每个字符串中的所有字符是否都是空格。 |
|
检查每个字符串中的所有字符是否都是小写。 |
|
检查每个字符串中的所有字符是否都是大写。 |
|
检查每个字符串中的所有字符是否都是标题大小写。 |
|
检查每个字符串中的所有字符是否都是数字。 |
|
检查每个字符串中的所有字符是否都是十进制。 |
|
|
返回 Series 的虚拟/指示变量 DataFrame。 |
分类访问器#
分类数据类型特定的方法和属性可以在 Series.cat
访问器下使用。
此分类的类别。 |
|
类别是否具有有序关系。 |
|
返回代码 Series 以及索引。 |
|
重命名类别。 |
|
按 new_categories 中指定的顺序重新排序类别。 |
|
添加新类别。 |
|
删除指定的类别。 |
|
删除未使用的类别。 |
|
将类别设置为指定的新类别。 |
|
将分类设置为有序。 |
|
将分类设置为无序。 |
稀疏访问器#
稀疏数据类型特定的方法和属性在 Series.sparse
访问器下提供。
非 |
|
非 |
|
在 data 中,fill_value 元素不会被存储。 |
|
包含非 |
|
从 scipy.sparse.coo_matrix 创建一个具有稀疏值的 Series。 |
|
从具有 MultiIndex 的 Series 创建一个 scipy.sparse.coo_matrix。 |
列表访问器#
Arrow 列表数据类型特定的方法和属性在 Series.list
访问器下提供。
展平列表值。 |
|
返回 Series 中每个列表的长度。 |
|
在 Series 中索引或切片列表。 |
结构体访问器#
Arrow 结构体 dtype 特定的方法和属性在 Series.struct
访问器下提供。
返回结构体每个子字段的 dtype 对象。 |
|
将结构体的子字段提取为 Series。 |
将结构体的所有子字段提取为 DataFrame。 |
标志#
标志是指 pandas 对象的属性。数据集的属性(如记录日期、访问的 URL 等)应存储在 Series.attrs
中。
|
适用于 pandas 对象的标志。 |
元数据#
Series.attrs
是一个字典,用于存储此 Series 的全局元数据。
警告
Series.attrs
被认为是实验性的,可能会在没有警告的情况下更改。
此数据集的全局属性字典。 |
绘图#
Series.plot
既是可调用方法,也是特定绘图方法的命名空间属性,形式为 Series.plot.<kind>
。
|
Series 绘图访问器和方法 |
|
绘制堆叠区域图。 |
|
垂直条形图。 |
|
创建水平条形图。 |
|
创建 DataFrame 列的箱线图。 |
|
使用高斯核生成核密度估计图。 |
|
绘制 DataFrame 列的一个直方图。 |
|
使用高斯核生成核密度估计图。 |
|
将 Series 或 DataFrame 绘制为线。 |
|
生成饼图。 |
|
使用 matplotlib 绘制输入序列的直方图。 |
序列化 / IO / 转换#
|
将对象序列化(pickle)到文件。 |
|
将对象写入逗号分隔值 (csv) 文件。 |
|
将 Series 转换为 {标签 -> 值} 字典或类似字典的对象。 |
|
将对象写入 Excel 表格。 |
|
将 Series 转换为 DataFrame。 |
从 pandas 对象返回一个 xarray 对象。 |
|
|
使用 HDFStore 将包含的数据写入 HDF5 文件。 |
|
将存储在 DataFrame 中的记录写入 SQL 数据库。 |
|
将对象转换为 JSON 字符串。 |
|
呈现 Series 的字符串表示形式。 |
|
将对象复制到系统剪贴板。 |
|
将对象呈现为 LaTeX 表格、长表格或嵌套表格。 |
|
以 Markdown 友好的格式打印 Series。 |