2.0.1 版本新特性 (2023 年 4 月 24 日)#
这些是 pandas 2.0.1 版本中的变更。请参阅 发行说明,查看包括其他 pandas 版本在内的完整变更日志。
修复的回归问题#
修复了从字典构造子类化 Series 时的回归问题 (GH 52445)
修复了
SeriesGroupBy.agg()
在使用分类数据、多个分组、as_index=False
和聚合列表进行分组时失败的回归问题 (GH 52760)修复了
DataFrame.pivot()
更改输入对象Index
名称的回归问题 (GH 52629)修复了
DataFrame.resample()
在 DataFrame 没有列时引发异常的回归问题 (GH 52484)修复了
DataFrame.sort_values()
在DataFrame
已排序且ignore_index=True
时未重置索引的回归问题 (GH 52553)修复了
MultiIndex.isin()
对Generator
引发TypeError
的回归问题 (GH 52568)修复了
Series.describe()
对包含一个元素的扩展 dtypeSeries
显示RuntimeWarning
的回归问题 (GH 52515)修复了当
DataFrame
的DataFrame.columns
是RangeIndex
且新键可哈希但不是标量时向DataFrame
添加新列时的回归问题 (GH 52652)
错误修复#
修复了
Series.dt.days
可能导致int32
天数溢出的错误 (GH 52391)修复了
arrays.DatetimeArray
构造函数在传入非纳秒级 numpy datetime 数组时返回错误单位的错误 (GH 52555)修复了
ArrowExtensionArray
在包含 numpyNaT
数据构造时 duration dtype 溢出的错误 (GH 52843)修复了
Series.dt.round()
在传入与Series
相同或更高分辨率的freq
时会引发ZeroDivisionError
的错误 (GH 52761)修复了
Series.median()
在使用ArrowDtype
时返回近似中位数的错误 (GH 52679)修复了
api.interchange.from_dataframe()
在处理分类 dtypes 时不必要地引发异常的错误 (GH 49889)修复了
api.interchange.from_dataframe()
在处理大型字符串 dtypes 时不必要地引发异常的错误 (GH 52795)修复了
pandas.testing.assert_series_equal()
中check_dtype=False
对不同分辨率的 datetime 或 timedelta 类型仍会引发异常的错误 (GH 52449)修复了
read_csv()
在设置dtype_backend="pyarrow"
和parse_dates
时将 PyArrow datetimes 转换为 NumPy 导致性能瓶颈的错误 (GH 52546)修复了
to_datetime()
和to_timedelta()
在尝试转换带有ArrowDtype
的数值数据时出现的错误 (GH 52425)修复了
to_numeric()
在使用errors='coerce'
和dtype_backend='pyarrow'
处理带有ArrowDtype
数据时出现的错误 (GH 52588)修复了
ArrowDtype.__from_arrow__()
未遵守显式指定 dtype 的错误 (GH 52533)修复了
DataFrame.describe()
未在include
和exclude
中遵循ArrowDtype
的错误 (GH 52570)修复了
DataFrame.max()
及相关函数在处理不同分辨率的Timestamp
时总是转换为纳秒的错误 (GH 52524)修复了
Series.describe()
对数值数据未返回带有pyarrow.float64
类型的ArrowDtype
的错误 (GH 52427)修复了
Series.dt.tz_localize()
错误本地化带有ArrowDtype
的时间戳的错误 (GH 52677)修复了
np.datetime64
和np.timedelta64
NaT
标量带单位进行算术运算时总是返回纳秒分辨率的错误 (GH 52295)修复了
ArrowDtype
和 numpy 掩码类型(例如"boolean"
)之间进行逻辑和比较运算时出现的错误 (GH 52625)修复了
merge()
在一侧使用ArrowDtype
而另一侧使用 NumPy dtype 进行合并时出现的错误 (GH 52406)修复了
Series.to_numpy()
在使用null[pyarrow]
dtype 时出现的段错误 (GH 52443)
其他#
从空字典创建的
DataFrame
的columns
dtype 为object
。现在已更改为RangeIndex
(GH 52404)从空字典创建的
Series
的index
dtype 为object
。现在已更改为RangeIndex
(GH 52404)为带有
pyarrow.string
的ArrowDtype
实现了Series.str.split()
和Series.str.rsplit()
方法 (GH 52401)为带有
pyarrow.string
的ArrowDtype
实现了大多数str
访问器方法 (GH 52401)在
api.types.is_scalar()
中测试为False
的非整数可哈希键,现在在RangeIndex.get_loc()
中会引发KeyError
,就像在Index.get_loc()
中一样。之前会引发InvalidIndexError
(GH 52652)。
贡献者#
共有 20 人为本次发布贡献了补丁。姓名旁带有“+”的人是首次贡献补丁。
Alex Malins +
Chris Carini +
Dea María Léon
Joris Van den Bossche
Luke Manley
Marc Garcia
Marco Edward Gorelli
MarcoGorelli
Matthew Roeschke
MeeseeksMachine
Natalia Mokeeva
Nirav +
Pandas Development Team
Patrick Hoefler
Richard Shadrach
Stefanie Molin
Terji Petersen
Thomas +
Thomas Li
yonashub