版本 0.20.2(2017年6月4日)#

这是 0.20.x 系列的一个小型错误修复版本,包含一些小的回归修复、错误修复和性能改进。我们建议所有用户升级到此版本。

增强功能#

  • 解除对 pytables 中支持的额外压缩类型的访问限制:‘blosc:blosclz’、‘blosc:lz4’、‘blosc:lz4hc’、‘blosc:snappy’、‘blosc:zlib’、‘blosc:zstd’ (GH 14478)

  • Series 提供了一个 to_latex 方法 (GH 16180)

  • 新增了一个 groupby 方法 GroupBy.ngroup(),与现有方法 GroupBy.cumcount() 并行,用于返回组顺序 (GH 11642);详见此处

性能改进#

  • 修复了使用类列表进行索引时的性能回归问题 (GH 16285)

  • 修复了 MultiIndexes 的性能回归问题 (GH 16319, GH 16346)

  • 改进了 .clip() 使用标量参数时的性能 (GH 15400)

  • 改进了使用分类分组器进行 groupby 操作时的性能 (GH 16413)

  • 改进了 MultiIndex.remove_unused_levels() 的性能 (GH 16556)

错误修复#

  • 消除了在某些 Windows 环境中检测终端大小时关于“tput: terminal attributes: No such device or address”的警告。此修复仅适用于 Python 3 (GH 16496)

  • 修复了在 io 函数中使用 pathlib.Pathpy.path.local 对象时的错误 (GH 16291)

  • 修复了在两个相等的 MultiIndex 上使用 Index.symmetric_difference() 导致 TypeError 的错误 (GH 13490)

  • 修复了 DataFrame.update()overwrite=False 和包含 NaN values 时存在的错误 (GH 15593)

  • 现在,向 read_csv() 传递无效引擎时会引发详细的 ValueError,而不是 UnboundLocalError。(GH 16511)

  • 修复了对元组数组使用 unique() 时存在的错误 (GH 16519)

  • 修复了当设置了 labelscut() 导致的标签顺序不正确的错误 (GH 16459)

  • 修复了 IPython 6.0 的 tab 补全在 Categoricals 上显示弃用警告的兼容性问题 (GH 16409)

转换#

  • 修复了 to_numeric() 中空数据输入导致解释器段错误的错误 (GH 16302)

  • 在将 DataFrame 广播到 Series 进行比较操作时,抑制 numpy 警告 (GH 16378, GH 16306)

索引#

  • 修复了 DataFrame.reset_index(level=) 在单层索引时存在的错误 (GH 16263)

  • 修复了在单调但不严格单调的索引上进行部分字符串索引时,切片边界被错误反转的错误 (GH 16515)

  • 修复了 MultiIndex.remove_unused_levels() 不返回与原始 MultiIndex 相等的 MultiIndex 的错误。(GH 16556)

I/O#

  • 修复了在空格分隔的文本文件中传入 commentread_csv() 存在的错误 (GH 16472)

  • 修复了 read_csv()usecols 中包含不存在的列但长度正确时未引发异常的错误 (GH 14671)

  • 修复了不必要地强制导入剪贴板例程,可能导致启动时出现导入错误的错误 (GH 16288)

  • 修复了 HTML 渲染空 DataFrame 时引发 IndexError 的错误 (GH 15953)

  • 修复了 read_csv() 在 Python 2.x 中对于 C 引擎,tarfile 对象输入会引发错误的错误 (GH 16530)

  • 修复了 DataFrame.to_html() 忽略 index_names 参数的错误 (GH 16493)

  • 修复了 pd.read_hdf() 为索引名返回 numpy 字符串的错误 (GH 13492)

  • 修复了 HDFStore.select_as_multiple() 不尊重 start/stop 参数的错误 (GH 16209)

绘图#

  • 修复了 DataFrame.plot 在单列和类列表 color 时存在的错误 (GH 3486)

  • 修复了 plotDatetimeIndexNaT 导致 Timestamp.min 的错误 (GH 12405)

  • 修复了 DataFrame.boxplot 中非分组箱线图不尊重 figsize 关键字的错误 (GH 11959)

分组/重采样/滚动#

  • 修复了在空的 DataFrame 上创建基于时间的滚动窗口时存在的错误 (GH 15819)

  • 修复了 rolling.cov() 带有偏移窗口时存在的错误 (GH 16058)

  • 修复了 .resample().groupby() 在整数上进行聚合时存在的错误 (GH 16361)

稀疏数据#

  • 修复了从 scipy.sparse.dok_matrix 构造 SparseDataFrame 时存在的错误 (GH 16179)

重塑#

  • 修复了 DataFrame.stackMultiIndex 列中存在未排序级别时存在的错误 (GH 16323)

  • 修复了 pd.wide_to_long() 中当 i 不是唯一标识符时未引发错误的错误 (GH 16382)

  • 修复了 Series.isin(..) 在处理元组列表时存在的错误 (GH 16394)

  • 修复了构造包含全 NaT 列的混合 dtype DataFrame 时存在的错误。(GH 16395)

  • 修复了 DataFrame.agg()Series.agg() 对不可调用属性进行聚合时存在的错误 (GH 16405)

数值型#

  • 修复了 .interpolate() 中,当传入 limit=None(默认值)时,limit_direction 未被尊重的错误 (GH 16282)

分类数据#

  • 修复了当两个分类数据都无序时,比较操作会考虑类别顺序的问题 (GH 16014)

其他#

  • 修复了 DataFrame.drop() 在处理带有非唯一索引的空列表时存在的错误 (GH 16270)

贡献者#

共有 34 人为本次发布贡献了补丁。名字旁边带有“+”的人是首次贡献补丁。

  • Aaron Barber +

  • Andrew 亮 +

  • Becky Sweger +

  • Christian Prinoth +

  • Christian Stade-Schuldt +

  • DSM

  • Erik Fredriksen +

  • Hugues Valois +

  • Jeff Reback

  • Jeff Tratner

  • JimStearns206 +

  • John W. O’Brien

  • Joris Van den Bossche

  • JosephWagner +

  • Keith Webber +

  • Mehmet Ali “Mali” Akmanalp +

  • Pankaj Pandey

  • Patrick Luo +

  • Patrick O’Melveny +

  • Pietro Battiston

  • RobinFiveWords +

  • Ryan Hendrickson +

  • SimonBaron +

  • Tom Augspurger

  • WBare +

  • bpraggastis +

  • chernrick +

  • chris-b1

  • economy +

  • gfyoung

  • jaredsnyder +

  • keitakurita +

  • linebp

  • lloydkirk +