通用函数#

数据操作#

melt(frame[, id_vars, value_vars, var_name, ...])

将 DataFrame 从宽格式转换为长格式,可以选择保留标识符。

pivot(data, *, columns[, index, values])

返回根据给定的索引/列值组织的重塑 DataFrame。

pivot_table(data[, values, index, columns, ...])

创建一个类似电子表格的透视表作为 DataFrame。

crosstab(index, columns[, values, rownames, ...])

计算两个(或更多)因素的简单交叉表。

cut(x, bins[, right, labels, retbins, ...])

将值分成离散的区间。

qcut(x, q[, labels, retbins, precision, ...])

基于分位数的离散化函数。

merge(left, right[, how, on, left_on, ...])

使用数据库风格的连接合并 DataFrame 或命名 Series 对象。

merge_ordered(left, right[, on, left_on, ...])

对有序数据执行合并,并可选地进行填充/插值。

merge_asof(left, right[, on, left_on, ...])

根据键距离执行合并。

concat(objs, *[, axis, join, ignore_index, ...])

沿着特定轴连接 pandas 对象。

get_dummies(data[, prefix, prefix_sep, ...])

将分类变量转换为虚拟/指示变量。

from_dummies(data[, sep, default_category])

从虚拟变量的 DataFrame 创建一个分类的 DataFrame

factorize(values[, sort, use_na_sentinel, ...])

将对象编码为枚举类型或分类变量。

unique(values)

基于哈希表返回唯一值。

lreshape(data, groups[, dropna])

将宽格式数据重塑为长格式。

wide_to_long(df, stubnames, i, j[, sep, suffix])

将 DataFrame 从宽格式转换为长格式。

顶层缺失数据#

isna(obj)

检测类数组对象的缺失值。

isnull(obj)

检测类数组对象的缺失值。

notna(obj)

检测类数组对象的非缺失值。

notnull(obj)

检测类数组对象的非缺失值。

顶层处理数值数据#

to_numeric(arg[, errors, downcast, ...])

将参数转换为数值类型。

顶层处理类似日期时间的数据#

to_datetime(arg[, errors, dayfirst, ...])

将参数转换为日期时间。

to_timedelta(arg[, unit, errors])

将参数转换为时间增量。

date_range([start, end, periods, freq, tz, ...])

返回一个固定频率的 DatetimeIndex。

bdate_range([start, end, periods, freq, tz, ...])

返回一个固定频率的 DatetimeIndex,默认值为工作日。

period_range([start, end, periods, freq, name])

返回一个固定频率的 PeriodIndex。

timedelta_range([start, end, periods, freq, ...])

返回一个固定频率的 TimedeltaIndex,默认以天为单位。

infer_freq(index)

根据输入索引推断最可能的频率。

顶层处理 Interval 数据#

interval_range([start, end, periods, freq, ...])

返回一个固定频率的 IntervalIndex。

顶层评估#

eval(expr[, parser, engine, local_dict, ...])

使用各种后端评估字符串形式的 Python 表达式。

日期时间格式#

tseries.api.guess_datetime_format(dt_str[, ...])

猜测给定日期时间字符串的日期时间格式。

哈希#

util.hash_array(vals[, encoding, hash_key, ...])

给定一个一维数组,返回一个确定性整数数组。

util.hash_pandas_object(obj[, index, ...])

返回 Index/Series/DataFrame 的数据哈希。

从其他 DataFrame 库导入#

api.interchange.from_dataframe(df[, allow_copy])

从任何支持交换协议的 DataFrame 构建一个 pd.DataFrame