2.1.2 版本的新特性 (2023 年 10 月 26 日)#
以下是 pandas 2.1.2 版本中的变化。请参阅发布说明以查看包含其他 pandas 版本在内的完整更新日志。
弃用#
在
DataFrame.pct_change()
,Series.pct_change()
,DataFrameGroupBy.pct_change()
, 和SeriesGroupBy.pct_change()
中恢复了对fill_method=None
的弃用;值'backfill'
,'bfill'
,'pad'
, 和'ffill'
仍然被弃用 (GH 53491)。
修复的回归错误#
修复了
DataFrame.join()
中的回归错误,该错误会导致结果中包含缺失值且 dtype 为 arrow 支持的字符串 (GH 55348)。修复了
rolling()
中的回归错误,该错误会导致非纳秒级索引或on
列产生不正确的结果 (GH 55026, GH 55106, GH 55299)。修复了
DataFrame.resample()
中的回归错误,该错误会在origin
超出其范围时向后外推到origin
(GH 55064)。修复了
DataFrame.sort_index()
中的回归错误,该错误在索引是切片MultiIndex
时排序不正确 (GH 55379)。修复了
DataFrameGroupBy.agg()
和SeriesGroupBy.agg()
中的回归错误,该错误在使用选项compute.use_numba
并设置为 True 时,numba 引擎不支持的 groupby 方法会引发TypeError
(GH 55520)。修复了宽 DataFrames 的性能回归错误,通常涉及单独访问所有列的方法 (GH 55256, GH 55245)。
修复了
merge_asof()
中by
参数使用 datetime 和 timedelta dtypes 时引发TypeError
的回归错误 (GH 55453)。修复了
read_parquet()
中的回归错误,该错误在读取包含超过 2 GB 字符串数据且使用"string"
dtype 的字符串列的文件时发生 (GH 55606)。修复了
DataFrame.to_sql()
中的回归错误,该错误在使用 sqlite 并设置detect_types
时未能正确地往返 datetime 列 (GH 55554)。修复了某些 DataFrame 或 Series 子类构造过程中的回归错误 (GH 54922)。
错误修复#
修复了
DataFrameGroupBy
聚合操作中的错误,该错误在使用infer_string
时未能保留 object dtype (GH 55620)。修复了
SeriesGroupBy.value_counts()
中的错误,该错误为字符串列返回了不正确的 dtype (GH 55627)。修复了
Categorical.equals()
中的错误,该错误在另一个对象具有 arrow 支持的字符串 dtype 时发生 (GH 55364)。修复了
DataFrame.__setitem__()
中的错误,该错误在使用infer_string=True
时未能推断零维数组的字符串 dtype (GH 55366)。修复了
DataFrame.idxmin()
和DataFrame.idxmax()
在处理 arrow dtypes 时引发错误的 bug (GH 55368)。修复了
DataFrame.interpolate()
引发不正确错误消息的 bug (GH 55347)。修复了
Index.insert()
在将None
插入具有dtype="string[pyarrow_numpy]"
的Index
时引发错误的 bug (GH 55365)。修复了
Series.all()
和Series.any()
在处理dtype="string[pyarrow_numpy]"
时未能正确处理缺失值的 bug (GH 55367)。修复了
Series.floordiv()
处理ArrowDtype
时的 bug (GH 55561)。修复了
Series.mode()
在处理 arrow 支持的字符串 dtype 时未对值进行排序的 bug (GH 55621)。修复了
Series.rank()
处理string[pyarrow_numpy]
dtype 时的 bug (GH 55362)。修复了
Series.str.extractall()
在处理ArrowDtype
dtype 时被转换为 object 的 bug (GH 53846)。修复了创建新的条件列时,显示关于设置不兼容 dtype 项目的 PDEP-6 警告的 bug (GH 55025)。
修复了
Series
构造函数中的错误,该错误在第一个值为NA
且设置了infer_string
时未能推断字符串 dtype (:issue:` 55655`)。
其他#
修复了可选依赖项组
output_formatting
安装不工作的问题。将下划线_
替换为连字符-
修复了损坏的依赖项解析。现在正确的用法是pip install pandas[output-formatting]
。
贡献者#
共有 20 位贡献者为本次发布贡献了补丁。名字旁有“+”标记的人是首次贡献补丁。
Amanda Bizzinotto
Artur Barseghyan + (首次贡献)
Hadi Abdi Khojasteh + (首次贡献)
Joris Van den Bossche
Luke Manley
Lumberbot (aka Jack)
Marc Garcia
Marco Edward Gorelli
MarcoGorelli
Mateusz Sokół
Matthew Roeschke
Natalia Mokeeva
Pandas Development Team
Patrick Hoefler
Richard Shadrach
Thomas Li
Yao Xiao
dependabot[bot]
rohanjain101 + (首次贡献)
torext + (首次贡献)