2.1.2 版本的新特性 (2023 年 10 月 26 日)#

以下是 pandas 2.1.2 版本中的变化。请参阅发布说明以查看包含其他 pandas 版本在内的完整更新日志。

弃用#

修复的回归错误#

  • 修复了 DataFrame.join() 中的回归错误,该错误会导致结果中包含缺失值且 dtype 为 arrow 支持的字符串 (GH 55348)。

  • 修复了 rolling() 中的回归错误,该错误会导致非纳秒级索引或 on 列产生不正确的结果 (GH 55026, GH 55106, GH 55299)。

  • 修复了 DataFrame.resample() 中的回归错误,该错误会在 origin 超出其范围时向后外推到 origin (GH 55064)。

  • 修复了 DataFrame.sort_index() 中的回归错误,该错误在索引是切片 MultiIndex 时排序不正确 (GH 55379)。

  • 修复了 DataFrameGroupBy.agg()SeriesGroupBy.agg() 中的回归错误,该错误在使用选项 compute.use_numba 并设置为 True 时,numba 引擎不支持的 groupby 方法会引发 TypeError (GH 55520)。

  • 修复了宽 DataFrames 的性能回归错误,通常涉及单独访问所有列的方法 (GH 55256, GH 55245)。

  • 修复了 merge_asof()by 参数使用 datetime 和 timedelta dtypes 时引发 TypeError 的回归错误 (GH 55453)。

  • 修复了 read_parquet() 中的回归错误,该错误在读取包含超过 2 GB 字符串数据且使用 "string" dtype 的字符串列的文件时发生 (GH 55606)。

  • 修复了 DataFrame.to_sql() 中的回归错误,该错误在使用 sqlite 并设置 detect_types 时未能正确地往返 datetime 列 (GH 55554)。

  • 修复了某些 DataFrame 或 Series 子类构造过程中的回归错误 (GH 54922)。

错误修复#

其他#

  • 修复了可选依赖项组 output_formatting 安装不工作的问题。将下划线 _ 替换为连字符 - 修复了损坏的依赖项解析。现在正确的用法是 pip install pandas[output-formatting]

贡献者#

共有 20 位贡献者为本次发布贡献了补丁。名字旁有“+”标记的人是首次贡献补丁。

  • Amanda Bizzinotto

  • Artur Barseghyan + (首次贡献)

  • Hadi Abdi Khojasteh + (首次贡献)

  • Joris Van den Bossche

  • Luke Manley

  • Lumberbot (aka Jack)

  • Marc Garcia

  • Marco Edward Gorelli

  • MarcoGorelli

  • Mateusz Sokół

  • Matthew Roeschke

  • Natalia Mokeeva

  • Pandas Development Team

  • Patrick Hoefler

  • Richard Shadrach

  • Thomas Li

  • Yao Xiao

  • dependabot[bot]

  • rohanjain101 + (首次贡献)

  • torext + (首次贡献)