1.0.2 版本新特性(2020 年 3 月 12 日)#

以下是 pandas 1.0.2 的变更。有关包含其他 pandas 版本的完整变更日志,请参阅发行说明

已修复的回归问题#

Groupby

输入/输出 (I/O)

重新索引/对齐

其他

使用可空布尔数组进行索引#

此前,使用包含 NA 的可空布尔数组进行索引会引发 ValueError,但现在允许这样做,且 NA 被视为 False。(GH 31503)

In [1]: s = pd.Series([1, 2, 3, 4])

In [2]: mask = pd.array([True, True, False, None], dtype="boolean")

In [3]: s
Out[3]: 
0    1
1    2
2    3
3    4
Length: 4, dtype: int64

In [4]: mask
Out[4]: 
<BooleanArray>
[True, True, False, <NA>]
Length: 4, dtype: boolean

pandas 1.0.0-1.0.1

>>> s[mask]
Traceback (most recent call last):
...
ValueError: cannot mask with array containing NA / NaN values

pandas 1.0.2

In [5]: s[mask]
Out[5]: 
0    1
1    2
Length: 2, dtype: int64

Bug 修复#

日期时间相关类型

类别型 (Categorical)

输入/输出 (I/O)

  • DataFrame.to_json() 中使用 pd.NA 现在会正确地输出 null 值,而不是空对象 (GH 31615)

  • 修复了 pandas.json_normalize() 在 meta 路径中的值不可迭代时的 Bug (GH 31507)

  • 修复了 pandas.NA 的 pickling 问题。此前会返回一个新对象,这破坏了依赖于 NA 为单例的计算 (GH 31847)

  • 修复了使用可空无符号整数 dtype 进行 parquet 往返转换时的 Bug (GH 31896)。

实验性 dtype

字符串

滚动计算 (Rolling)

  • 修复了在递减时间索引上使用可变窗口(由时间范围定义)进行滚动计算操作的 Bug (GH 32385)。

贡献者#

共有 25 位贡献者为本次版本发布贡献了补丁。名字旁边带有“+”的人是首次贡献补丁。

  • Anna Daglis +

  • Daniel Saxton

  • Irv Lustig

  • Jan Škoda

  • Joris Van den Bossche

  • Justin Zheng

  • Kaiqi Dong

  • Kendall Masse

  • Marco Gorelli

  • Matthew Roeschke

  • MeeseeksMachine

  • MomIsBestFriend

  • Pandas 开发团队

  • Pedro Reys +

  • Prakhar Pandey

  • Robert de Vries +

  • Rushabh Vasani

  • Simon Hawkins

  • Stijn Van Hoey

  • Terji Petersen

  • Tom Augspurger

  • William Ayd

  • alimcmaster1

  • gfyoung

  • jbrockmendel