2.0.2 版本新特性 (2023年5月29日)#
以下是 pandas 2.0.2 中的变化。请参阅 发行说明 获取完整的更新日志,包括 pandas 的其他版本。
修复的回归错误#
修复了
GroupBy.apply()
中的性能回归问题 (GH 53195)修复了
read_sql()
丢弃具有重复列名的列的回归问题 (GH 53117)修复了
DataFrame.loc()
在扩大对象时丢失MultiIndex
名称的回归问题 (GH 53053)修复了
DataFrame.to_string()
在 DataFrame 不适合行宽时,在第一行数据(而非头部)末尾打印反斜杠的回归问题 (GH 53054)修复了
MultiIndex.join()
返回级别顺序错误的回归问题 (GH 53093)
Bug 修复#
修复了
arrays.ArrowExtensionArray
在使用pyarrow.map_
时为.type
错误地分配dict
而不是list
,并在使用pyarrow.struct
时引发NotImplementedError
的错误 (GH 53328)修复了
api.interchange.from_dataframe()
在空分类数据上引发IndexError
的错误 (GH 53077)修复了
api.interchange.from_dataframe()
在切片上调用时返回大小不正确的DataFrame
的错误 (GH 52824)修复了
api.interchange.from_dataframe()
在处理位掩码时错误地引发异常的错误 (GH 49888)修复了
read_csv()
在engine="pyarrow"
且设置了parse_dates
时引发OverflowError
的错误 (GH 53295)修复了
to_datetime()
在日期包含“AM” / “PM” 标记时错误地推断格式为"%H"
而非"%I"
的错误 (GH 53147)修复了
to_timedelta()
在处理pandas.NA
时引发ValueError
的错误 (GH 52909)修复了
DataFrame.__getitem__()
对于MultiIndex
部分键未保留 dtypes 的错误 (GH 51895)修复了
DataFrame.convert_dtypes()
在dtype_backend="pyarrow"
且convert_*
关键词设置为 False 时忽略它们的错误 (GH 52872)修复了
DataFrame.convert_dtypes()
在处理时区感知 dtype 和dtype_backend="pyarrow"
时丢失时区的错误 (GH 53382)修复了
DataFrame.sort_values()
在处理 PyArrowdictionary
dtype 时引发异常的错误 (GH 53232)修复了
Series.describe()
将 pyarrow 支持的时间戳和时间差错误地视为分类数据的错误 (GH 53001)修复了
Series.rename()
在启用写时复制且传入标量时未进行惰性复制的错误 (GH 52450)修复了
pd.array()
在处理NumPy
数组以及pa.large_string
或pa.large_binary
时引发异常的错误 (GH 52590)
其他#
调用带有
pyarrow.date32
或pyarrow.date64
类型的ArrowDtype
的Series.dt.to_pydatetime()
时,提供了更友好的错误消息 (GH 52812)
贡献者#
共有 18 位贡献者为此版本贡献了补丁。名字旁带有“+”的人是首次贡献补丁。
Gianluca Ficarelli +
Guillaume Lemaitre
Joris Van den Bossche
Julian Badillo +
Luke Manley
Lumberbot (又名 Jack) +
Marc Garcia
Marco Edward Gorelli
MarcoGorelli
Matt Richards
Matthew Roeschke
MeeseeksMachine
Pandas 开发团队
Patrick Hoefler
Simon Høxbro Hansen +
Thomas Li
Yao Xiao +
dependabot[bot]