2.0.2 版本更新内容(2023 年 5 月 29 日)#
以下是 pandas 2.0.2 中的更改。有关包括其他 pandas 版本的完整更新日志,请参阅发布说明。
已修复的回归问题#
修复了
GroupBy.apply()
中的性能回归问题(GH 53195)修复了
read_sql()
丢弃具有重复列名的列的回归问题(GH 53117)修复了
DataFrame.loc()
扩展对象时丢失MultiIndex
名称的回归问题(GH 53053)修复了
DataFrame.to_string()
当 DataFrame 不适合行宽时,在第一行数据而不是标题末尾打印反斜杠的回归问题(GH 53054)修复了
MultiIndex.join()
返回错误顺序级别的回归问题(GH 53093)
错误修复#
修复了
arrays.ArrowExtensionArray
中的错误,该错误在使用pyarrow.map_
时错误地将dict
而非list
赋值给.type
,并在使用pyarrow.struct
时引发NotImplementedError
(GH 53328)修复了
api.interchange.from_dataframe()
在空分类数据上引发IndexError
的错误(GH 53077)修复了
api.interchange.from_dataframe()
在切片上调用时返回大小不正确的DataFrame
的错误(GH 52824)修复了
api.interchange.from_dataframe()
不必要地在位掩码上引发错误的错误(GH 49888)修复了
read_csv()
在engine="pyarrow"
且设置了parse_dates
时引发OverflowError
的错误(GH 53295)修复了
to_datetime()
在日期包含“AM”/“PM”标记时错误地推断格式包含"%H"
而非"%I"
的错误(GH 53147)修复了
to_timedelta()
在处理pandas.NA
时引发ValueError
的错误(GH 52909)修复了
DataFrame.__getitem__()
在处理MultiIndex
部分键时未保留 dtypes 的错误(GH 51895)修复了
DataFrame.convert_dtypes()
在dtype_backend="pyarrow"
且convert_*
关键字设置为 False 时忽略这些关键字的错误(GH 52872)修复了
DataFrame.convert_dtypes()
在处理带有时区信息的 dtype 和dtype_backend="pyarrow"
时丢失时区信息的错误(GH 53382)修复了
DataFrame.sort_values()
在处理 PyArrowdictionary
dtype 时引发错误的错误(GH 53232)修复了
Series.describe()
将 PyArrow 支持的时间戳和时间差视为分类数据的错误(GH 53001)修复了
Series.rename()
在启用写时复制(Copy-on-Write)时,当传递标量给它时未进行延迟复制的错误(GH 52450)修复了
pd.array()
在处理NumPy
数组和pa.large_string
或pa.large_binary
时引发错误的错误(GH 52590)
其他#
当调用
Series.dt.to_pydatetime()
并使用pyarrow.date32
或pyarrow.date64
类型的ArrowDtype
时,现在会抛出更友好的错误信息(GH 52812)
贡献者#
共有 18 位贡献者为本次发布提交了补丁。名字旁边带有“+”的人是首次贡献补丁。
Gianluca Ficarelli +
Guillaume Lemaitre
Joris Van den Bossche
Julian Badillo +
Luke Manley
Lumberbot (亦称 Jack) +
Marc Garcia
Marco Edward Gorelli
MarcoGorelli
Matt Richards
Matthew Roeschke
MeeseeksMachine
Pandas 开发团队
Patrick Hoefler
Simon Høxbro Hansen +
Thomas Li
Yao Xiao +
dependabot[bot]