1.3.3 版新特性(2021 年 9 月 12 日)#
以下是 pandas 1.3.3 版的更改。有关包括其他 pandas 版本在内的完整更改日志,请参阅发布说明。
修复的回归#
修复了
DataFrame构造函数在为已定义的Index和长度为 1 的Timestamp列表进行广播时失败的回归问题(GH 42810)修复了
DataFrameGroupBy.agg()和SeriesGroupBy.agg()在某些情况下错误地引发异常的回归问题(GH 42390)修复了
DataFrameGroupBy.apply()和SeriesGroupBy.apply()在即使设置了dropna=False也会丢弃nan值的回归问题(GH 43205)修复了
DataFrameGroupBy.quantile()和SeriesGroupBy.quantile()在处理pandas.NA时失败的回归问题(GH 42849)修复了
merge()在right和outer合并中,带有ExtensionDtype或bool数据类型的on列被转换为object的回归问题(GH 40073)修复了
RangeIndex.where()和RangeIndex.putmask()在结果不表示RangeIndex时引发AssertionError的回归问题(GH 43240)修复了
read_parquet()在使用 fastparquet 0.7.0 时fastparquet引擎无法正常工作的回归问题(GH 43075)修复了
DataFrame.loc.__setitem__()在将数组设置为单元格值时引发ValueError的回归问题(GH 43422)修复了
is_list_like()在__iter__设置为None的对象被识别为可迭代的回归问题(GH 43373)修复了
DataFrame.__getitem__()在索引非单调时,对DatetimeIndex切片引发错误的回归问题(GH 43223)修复了
Resampler.aggregate()在列选择后使用时,如果func是聚合函数列表则会引发异常的回归问题(GH 42905)修复了
DataFrame.corr()在 Kendall 相关性计算中,对具有重复值的列产生不正确结果的回归问题(GH 43401)修复了
DataFrame.groupby()在对对象类型列进行聚合时丢弃这些列的结果的回归问题(GH 42395, GH 43108)修复了
Series.fillna()在填充floatSeries时,如果填充值是列表类型且其 dtype 无法无损转换(例如float32填充float64),则引发TypeError的回归问题(GH 43424)修复了
read_csv()在文件句柄是tempfile.SpooledTemporaryFile对象时引发AttributeError的回归问题(GH 43439)修复了
core.window.ewm.ExponentialMovingWindow.mean()的性能回归问题(GH 42333)
性能改进#
错误修复#
修复了
DataFrameGroupBy.agg()和DataFrameGroupBy.transform()在engine="numba"模式下index数据未正确传递给func的错误(GH 43133)
贡献者#
共有 18 位贡献者为本次发布提交了补丁。名字旁带有“+”的人是首次贡献者。
Ali McMaster
Irv Lustig
Matthew Roeschke
Matthew Zeitlin
MeeseeksMachine
Pandas 开发团队
Patrick Hoefler
Prerana Chakraborty +
Richard Shadrach
Shoham Debnath
Simon Hawkins
Thomas Li
Torsten Wörtwein
Zach Rait +
aiudirog +
attack68
jbrockmendel
suoniq +