1.0.1 版本新特性 (2020年2月5日)#
以下是 pandas 1.0.1 版本中的变化。有关包括其他 pandas 版本在内的完整变更日志,请参阅发布说明。
修复的回归问题#
修复了使用切片设置
DataFrame
值时 (例如df[-4:] = 1
),通过标签而非位置进行索引的回归问题 (GH 31469)修复了使用包含
datetime.date
的切片索引以DatetimeIndex
为索引的Series
或DataFrame
时的回归问题 (GH 31501)修复了
DataFrame.__setitem__
在使用MultiIndex
和非单调索引器时引发AttributeError
的回归问题 (GH 31449)修复了
Series
乘法运算中的回归问题,该问题发生于将元素数量 >10000 的数值Series
与 timedelta 标量相乘时 (GH 31457)修复了
.groupby().agg()
在 object-dtype 列上执行某些聚合函数 (如min
) 时引发AssertionError
的回归问题 (GH 31522)修复了
.groupby()
聚合中,使用分类 dtype 并调用 Cython 化聚合函数 (例如first
) 时的回归问题 (GH 31450)修复了
DataFrameGroupBy.apply()
和SeriesGroupBy.apply()
在传入的函数返回非 pandas 非标量对象 (例如列表或 numpy 数组) 时的回归问题 (GH 31441)修复了
DataFrame.groupby()
中的回归问题,该问题导致对 period dtype 的列求最大或最小值时引发TypeError
。 (GH 31471)修复了
DataFrame.groupby()
在空 DataFrame 按 MultiIndex 的某个层级分组时的回归问题 (GH 31670)。修复了
DataFrame.apply()
在 object dtype 和非聚合函数中的回归问题 (GH 31505)修复了
to_datetime()
在解析非纳秒精度日期时间时的回归问题 (GH 31491)修复了
Categorical
使用numpy.str_
类别构建时的回归问题 (GH 31499)修复了
DataFrame.loc()
和DataFrame.iloc()
在选择包含单个datetime64
或timedelta64
列的行时的回归问题 (GH 31649)修复了设置
pd.options.display.max_colwidth
不接受负整数的回归问题。此外,此行为已被弃用,推荐使用None
代替 (GH 31532)修复了 objTOJSON.c 中修复返回类型警告的回归问题 (GH 31463)
修复了使用标签列表索引以
MultiIndex
为索引的DataFrame
或Series
时的性能回归问题 (GH 31648)修复了
RawIOBase
文件对象使用read_csv()
时不识别encoding
选项的回归问题 (GH 31575)
弃用#
对
pd.options.display.max_colwidth
使用负整数的支持已被弃用,推荐使用None
代替 (GH 31532)
Bug 修复#
日期/时间类型
修复了当
cache=True
且存在超出范围的值时,to_datetime()
报错的 bug (GH 31491)
数值
修复了
DataFrame.__invert__
(~
运算符) 在混合 dtype 情况下的 dtypes 丢失问题 (GH 31183),以及 extension-array 支持的Series
和DataFrame
的相关问题 (GH 23087)
绘图
绘制时区感知的时序数据不再产生 UserWarning (GH 31205)
区间
修复了
Series.shift()
在interval
dtype 下,当对整数或日期/时间类型的区间数组进行移位时引发TypeError
的 bug (GH 34195)
贡献者#
共有 15 人为此版本贡献了补丁。名字旁带有“+”的人是首次贡献补丁。
Daniel Saxton
Guillaume Lemaitre
Jeff Reback
Joris Van den Bossche
Kaiqi Dong
Marco Gorelli
MeeseeksMachine
Pandas Development Team
Sebastián Vanrell +
Tom Augspurger
William Ayd
alimcmaster1
jbrockmendel
paihu +
proost