1.3.3 版新特性(2021 年 9 月 12 日)#
以下是 pandas 1.3.3 版的更改。有关包括其他 pandas 版本在内的完整更改日志,请参阅发布说明。
修复的回归#
修复了
DataFrame
构造函数在为已定义的Index
和长度为 1 的Timestamp
列表进行广播时失败的回归问题(GH 42810)修复了
DataFrameGroupBy.agg()
和SeriesGroupBy.agg()
在某些情况下错误地引发异常的回归问题(GH 42390)修复了
DataFrameGroupBy.apply()
和SeriesGroupBy.apply()
在即使设置了dropna=False
也会丢弃nan
值的回归问题(GH 43205)修复了
DataFrameGroupBy.quantile()
和SeriesGroupBy.quantile()
在处理pandas.NA
时失败的回归问题(GH 42849)修复了
merge()
在right
和outer
合并中,带有ExtensionDtype
或bool
数据类型的on
列被转换为object
的回归问题(GH 40073)修复了
RangeIndex.where()
和RangeIndex.putmask()
在结果不表示RangeIndex
时引发AssertionError
的回归问题(GH 43240)修复了
read_parquet()
在使用 fastparquet 0.7.0 时fastparquet
引擎无法正常工作的回归问题(GH 43075)修复了
DataFrame.loc.__setitem__()
在将数组设置为单元格值时引发ValueError
的回归问题(GH 43422)修复了
is_list_like()
在__iter__
设置为None
的对象被识别为可迭代的回归问题(GH 43373)修复了
DataFrame.__getitem__()
在索引非单调时,对DatetimeIndex
切片引发错误的回归问题(GH 43223)修复了
Resampler.aggregate()
在列选择后使用时,如果func
是聚合函数列表则会引发异常的回归问题(GH 42905)修复了
DataFrame.corr()
在 Kendall 相关性计算中,对具有重复值的列产生不正确结果的回归问题(GH 43401)修复了
DataFrame.groupby()
在对对象类型列进行聚合时丢弃这些列的结果的回归问题(GH 42395, GH 43108)修复了
Series.fillna()
在填充float
Series
时,如果填充值是列表类型且其 dtype 无法无损转换(例如float32
填充float64
),则引发TypeError
的回归问题(GH 43424)修复了
read_csv()
在文件句柄是tempfile.SpooledTemporaryFile
对象时引发AttributeError
的回归问题(GH 43439)修复了
core.window.ewm.ExponentialMovingWindow.mean()
的性能回归问题(GH 42333)
性能改进#
错误修复#
修复了
DataFrameGroupBy.agg()
和DataFrameGroupBy.transform()
在engine="numba"
模式下index
数据未正确传递给func
的错误(GH 43133)
贡献者#
共有 18 位贡献者为本次发布提交了补丁。名字旁带有“+”的人是首次贡献者。
Ali McMaster
Irv Lustig
Matthew Roeschke
Matthew Zeitlin
MeeseeksMachine
Pandas 开发团队
Patrick Hoefler
Prerana Chakraborty +
Richard Shadrach
Shoham Debnath
Simon Hawkins
Thomas Li
Torsten Wörtwein
Zach Rait +
aiudirog +
attack68
jbrockmendel
suoniq +