2.1.2 (2023年10月26日) 的新特性#

以下是 pandas 2.1.2 中的更改。有关包含其他 pandas 版本的完整更改日志,请参阅发布说明

弃用#

  • 撤销了对 DataFrame.pct_change(), Series.pct_change(), DataFrameGroupBy.pct_change()SeriesGroupBy.pct_change()fill_method=None 的弃用;值 'backfill', 'bfill', 'pad''ffill' 仍然被弃用 (GH 53491)

已修复的回归#

  • 修复了 DataFrame.join() 中的回归问题,其中结果包含缺失值且数据类型为 arrow 支持的字符串 (GH 55348)

  • 修复了 rolling() 中的回归问题,其中非纳秒索引或 on 列会产生不正确的结果 (GH 55026, GH 55106, GH 55299)

  • 修复了 DataFrame.resample() 中的回归问题,该问题在 origin 超出其界限时会外推回 origin (GH 55064)

  • 修复了 DataFrame.sort_index() 中的回归问题,该问题在索引为切片 MultiIndex 时排序不正确 (GH 55379)

  • 修复了 DataFrameGroupBy.agg()SeriesGroupBy.agg() 中的回归问题,如果选项 compute.use_numba 设置为 True,Numba 引擎不支持的 groupby 方法会引发 TypeError (GH 55520)

  • 修复了宽 DataFrames 的性能回归问题,通常涉及单独访问所有列的方法 (GH 55256, GH 55245)

  • 修复了 merge_asof() 中的回归问题,该问题在 by 带有 datetime 和 timedelta 数据类型时引发 TypeError (GH 55453)

  • 修复了 read_parquet() 中的回归问题,该问题在读取包含超过 2 GB 字符串数据且使用 "string" 数据类型的字符串列文件时发生 (GH 55606)

  • 修复了 DataFrame.to_sql() 中的回归问题,该问题在使用 detect_types 时无法正确往返 SQLite 的 datetime 列 (GH 55554)

  • 修复了某些 DataFrame 或 Series 子类构造中的回归问题 (GH 54922)

Bug 修复#

其他#

  • 修复了可选依赖组 output_formatting 安装不工作的问题。将下划线 _ 替换为短划线 - 可修复损坏的依赖解析。现在正确的用法是 pip install pandas[output-formatting]

贡献者#

共有 20 位贡献者为本次发布贡献了补丁。姓名旁带有“+”的人员是首次贡献补丁。

  • Amanda Bizzinotto

  • Artur Barseghyan +

  • Hadi Abdi Khojasteh +

  • Joris Van den Bossche

  • Luke Manley

  • Lumberbot (aka Jack)

  • Marc Garcia

  • Marco Edward Gorelli

  • MarcoGorelli

  • Mateusz Sokół

  • Matthew Roeschke

  • Natalia Mokeeva

  • Pandas Development Team

  • Patrick Hoefler

  • Richard Shadrach

  • Thomas Li

  • Yao Xiao

  • dependabot[bot]

  • rohanjain101 +

  • torext +