1.0.2 版本更新内容 (2020年3月12日)#

以下是 pandas 1.0.2 中的更改。有关包括其他 pandas 版本的完整更改日志,请参阅发布说明

已修复的回归#

Groupby

I/O

重新索引/对齐

其他

使用可空布尔数组进行索引#

之前,使用包含 NA 的可空布尔数组进行索引会引发 ValueError,但现在允许这样做,且 NA 将被视为 False。 (GH 31503)

In [1]: s = pd.Series([1, 2, 3, 4])

In [2]: mask = pd.array([True, True, False, None], dtype="boolean")

In [3]: s
Out[3]: 
0    1
1    2
2    3
3    4
Length: 4, dtype: int64

In [4]: mask
Out[4]: 
<BooleanArray>
[True, True, False, <NA>]
Length: 4, dtype: boolean

pandas 1.0.0-1.0.1

>>> s[mask]
Traceback (most recent call last):
...
ValueError: cannot mask with array containing NA / NaN values

pandas 1.0.2

In [5]: s[mask]
Out[5]: 
0    1
1    2
Length: 2, dtype: int64

错误修复#

日期时间类型

分类

I/O

  • 现在,将 pd.NADataFrame.to_json() 一起使用时,会正确输出 null 值而不是空对象 (GH 31615)

  • 修复了 pandas.json_normalize() 的一个错误,之前在元路径中的值不可迭代时发生 (GH 31507)

  • 修复了 pandas.NA 的序列化 (pickling) 问题。之前会返回一个新对象,这破坏了依赖 NA 作为单例的计算 (GH 31847)

  • 修复了 Parquet 往返过程中可空无符号整数数据类型的一个错误 (GH 31896)。

实验性数据类型

字符串

  • 现在,将 pd.NASeries.str.repeat() 一起使用时,会正确输出 null 值,而不是对矢量输入引发错误 (GH 31632)

滚动

  • 修复了在时间索引递减的情况下,使用可变窗口(由时间持续时间定义)进行滚动操作的问题 (GH 32385)。

贡献者#

共有25人为此版本贡献了补丁。名字旁有“+”号的人是首次贡献补丁。

  • Anna Daglis +

  • Daniel Saxton

  • Irv Lustig

  • Jan Škoda

  • Joris Van den Bossche

  • Justin Zheng

  • Kaiqi Dong

  • Kendall Masse

  • Marco Gorelli

  • Matthew Roeschke

  • MeeseeksMachine

  • MomIsBestFriend

  • Pandas Development Team

  • Pedro Reys +

  • Prakhar Pandey

  • Robert de Vries +

  • Rushabh Vasani

  • Simon Hawkins

  • Stijn Van Hoey

  • Terji Petersen

  • Tom Augspurger

  • William Ayd

  • alimcmaster1

  • gfyoung

  • jbrockmendel