版本 0.19.2 (2016年12月24日)#

这是 0.19.x 系列中的一个次要错误修复版本,包含一些小的回归修复、错误修复和性能改进。我们建议所有用户升级到此版本。

主要亮点包括

改进#

0.19.0 版本中新增的 pd.merge_asof() 函数获得了一些改进

  • pd.merge_asof() 增加了 left_index/right_indexleft_by/right_by 参数 (GH 14253)

  • pd.merge_asof()by 参数现在可以接受多个列,并具有专用数据类型以获得更好的性能 (GH 13936)

性能改进#

  • PeriodIndex 的性能退步 (GH 14822)

  • 使用 getitem 进行索引时的性能退步 (GH 14930)

  • 改进了 .replace() 的性能 (GH 12745)

  • 改进了使用 datetime 索引和字典数据创建 Series 的性能 (GH 14894)

错误修复#

  • 兼容 Python 3.6,用于某些偏移量的 pickle 化 (GH 14685)

  • 兼容 Python 3.6,用于某些索引异常类型 (GH 14684, GH 14689)

  • 兼容 Python 3.6,用于测试套件中的弃用警告 (GH 14681)

  • 兼容 Python 3.6,用于 Timestamp pickle 对象 (GH 14689)

  • 兼容 dateutil==2.6.0;测试套件中报告了段错误 (GH 14621)

  • 允许在 Timestamp.replace 中将 nanoseconds 作为关键字参数 (GH 14621)

  • pd.read_csv 中的一个错误,当 na_values 作为字典传入时会发生别名化 (GH 14203)

  • pd.read_csv 中的一个错误,字典形式的 na_values 的列索引未被正确识别 (GH 14203)

  • pd.read_csv 中的一个错误,如果文件中的头行数等于总行数,则读取文件失败 (GH 14515)

  • pd.read_csv Python 引擎中的一个错误,当多字符分隔符与引号一起使用时未被正确识别,导致出现无用的错误消息 (GH 14582)

  • 修复了 pd.read_saspandas.io.sas.sas7bdat.SAS7BDATReader 中在增量读取 SAS 文件时导致问题的错误 (GH 14734, GH 13654)。

  • pd.read_csv Python 引擎中的一个错误,当 Python 的 CSV 库未遵守 skipfooter 参数时,会引发无用的错误消息 (GH 13879)

  • .fillna() 中的一个错误,导致时区感知的 datetime64 值被错误地四舍五入 (GH 14872)

  • 在对非字典序的多重索引使用多级分组时,.groupby(..., sort=True) 中的一个错误 (GH 14776)

  • pd.cut 在处理负值和单个 bin 时的错误 (GH 14652)

  • pd.to_numeric 中的一个错误,当参数为 downcast='unsigned' 时,0 未被转换为无符号数 (GH 14401)

  • 在使用共享轴 (sharex=Trueax.twinx()) 绘制规则和不规则时间序列时的错误 (GH 13341, GH 14322)。

  • 在解析无效日期时间时未传播异常的错误,在 Python 3.6 中发现 (GH 14561)

  • 在本地时区重新采样 DatetimeIndex 时,如果涵盖夏令时变更,会引发 AmbiguousTimeError 的错误 (GH 14682)

  • 索引中的一个错误,将 RecursionError 转换为 KeyErrorIndexingError (GH 14554)

  • 在使用 data_columns=True 写入 MultiIndexHDFStore 中的错误 (GH 14435)

  • 在写入 Series 并传入包含 index 值的 min_itemsize 参数时,HDFStore.append() 中的错误 (GH 11412)

  • 在将数据写入 HDFStoretable 格式时,如果为 index 设置了 min_itemsize 值但未请求追加,则出现的错误 (GH 10381)

  • 在空 Series 上调用 Series.groupby.nunique() 时引发 IndexError 的错误 (GH 12553)

  • 当索引包含重复值时,DataFrame.nlargestDataFrame.nsmallest 中的错误 (GH 13412)

  • 在 Linux Python2 环境中,剪贴板函数处理 Unicode 和分隔符时的错误 (GH 13747)

  • 在 Windows 10 和 Python 3 环境中,剪贴板函数中的错误 (GH 14362, GH 12807)

  • .to_clipboard() 和 Excel 兼容性中的错误 (GH 12529)

  • DataFrame.combine_first() 处理整数列时的错误 (GH 14687)。

  • pd.read_csv() 中的一个错误,当数据为空时,dtype 参数未被遵守 (GH 14712)

  • pd.read_csv() 中的一个错误,当使用 C 引擎解析大输入时,nrows 参数未被遵守 (GH 7626)

  • pd.merge_asof() 中的一个错误,当指定容差时无法处理时区感知的 DatetimeIndex (GH 14844)

  • to_stataStataWriter 中写入双精度浮点数时,对超出范围的值进行了显式检查 (GH 14618)

  • .plot(kind='kde') 中的一个错误,未丢弃缺失值以生成 KDE 图,而是生成了空图。 (GH 14821)

  • unstack() 中的一个错误,如果以列列表作为参数调用,无论所有列的数据类型如何,它们都会被强制转换为 object 类型 (GH 11847)

贡献者#

共有 33 人为本次发布贡献了补丁。名字旁边带有“+”的人是首次贡献补丁。

  • Ajay Saxena +

  • Ben Kandel

  • Chris

  • Chris Ham +

  • Christopher C. Aycock

  • Daniel Himmelstein +

  • Dave Willmer +

  • Dr-Irv

  • Jeff Carey +

  • Jeff Reback

  • Joe Jevnik

  • Joris Van den Bossche

  • Julian Santander +

  • Kerby Shedden

  • Keshav Ramaswamy

  • Kevin Sheppard

  • Luca Scarabello +

  • Matt Roeschke +

  • Matti Picus +

  • Maximilian Roos

  • Mykola Golubyev +

  • Nate Yoder +

  • Nicholas Ver Halen +

  • Pawel Kordek

  • Pietro Battiston

  • Rodolfo Fernandez +

  • Tara Adiseshan +

  • Tom Augspurger

  • Yaroslav Halchenko

  • gfyoung

  • hesham.shabana@hotmail.com +

  • sinhrks

  • wandersoncferreira +