版本 0.6.0 (2011年11月25日)#

新特性#

  • 新增 melt 函数至 pandas.core.reshape

  • 新增 level 参数,用于在 Series 和 DataFrame 描述性统计中按级别进行分组 (GH 313)

  • 新增 headtail 方法至 Series,类似于 DataFrame (GH 296)

  • 新增 Series.isin 函数,用于检查每个值是否包含在传递的序列中 (GH 289)

  • 新增 float_format 选项至 Series.to_string

  • 新增 skip_footer (GH 291) 和 converters (GH 343) 选项至 read_csvread_table

  • 新增 drop_duplicatesduplicated 函数,分别用于删除重复的 DataFrame 行和检查重复行 (GH 319)

  • 在 DataFrame 上实现了 运算符 ‘&’, ‘|’, ‘^’, ‘-’ (GH 347)

  • 新增 Series.mad,即平均绝对偏差

  • 新增 QuarterEnd 日期偏移 (GH 321)

  • 新增 dot 方法至 DataFrame (GH 65)

  • 新增 orient 选项至 Panel.from_dict (GH 359, GH 301)

  • 新增 orient 选项至 DataFrame.from_dict

  • 新增 支持将元组列表或列表列表传递给 DataFrame.from_records (GH 357)

  • 新增 groupby 的多级支持 (GH 103)

  • 允许 DataFrame.sort_indexby 参数中使用多列 (GH 92, GH 362)

  • 新增 快速的 get_valueput_value 方法至 DataFrame (GH 360)

  • 新增 cov 实例方法至 Series 和 DataFrame (GH 194, GH 362)

  • 新增 kind='bar' 选项至 DataFrame.plot (GH 348)

  • 新增 idxminidxmax 方法至 Series 和 DataFrame (GH 286)

  • 新增 read_clipboard 函数,用于从剪贴板解析 DataFrame (GH 300)

  • 新增 nunique 函数至 Series,用于计算唯一元素的数量 (GH 297)

  • 使 DataFrame 构造函数在未传递列时使用 Series 名称 (GH 373)

  • 支持 read_table/read_csv 中的正则表达式 (GH 364)

  • 新增 DataFrame.to_html 方法,用于将 DataFrame 写入 HTML (GH 387)

  • 新增 对 DataFrame 中 MaskedArray 数据的支持,掩码值转换为 NaN (GH 396)

  • 新增 DataFrame.boxplot 函数 (GH 368)

  • 现在可以将 额外的 args、kwds 传递给 DataFrame.apply (GH 376)

  • 实现 带有向量 on 参数的 DataFrame.join (GH 312)

  • 新增 legend 布尔标志至 DataFrame.plot (GH 324)

  • 现在可以将 多个级别传递给 stackunstack (GH 370)

  • 现在可以将 多个值列传递给 pivot_table (GH 381)

  • 在 GroupBy 中使用 Series 名称作为结果索引 (GH 363)

  • 新增 raw 选项至 DataFrame.apply,以在只需要 ndarray 时提高性能 (GH 309)

  • 新增了经过适当测试的加权最小二乘法,应用于标准和面板 OLS (GH 303)

性能改进#

  • VBENCH 对 cache_readonly 进行了 Cython 化,从而在整个代码库中实现了显著的微性能提升 (GH 361)

  • VBENCH 特殊的 Cython 矩阵迭代器,用于应用任意归约操作,性能比 np.apply_along_axis 提升 3-5 倍 (GH 309)

  • VBENCH 提升了 MultiIndex.from_tuples 的性能

  • VBENCH 特殊的 Cython 矩阵迭代器,用于应用任意归约操作

  • VBENCH + DOCUMENT 新增 raw 选项至 DataFrame.apply,以在需要时获得更好的性能

  • VBENCH 加快了 Series 和 DataFrame 中按级别的 Cython 化计数速度 (GH 341)

  • VBENCH? GroupBy 性能显著提升,尤其是在使用多个键且存在许多“空”组合时

  • VBENCH 新的 Cython 向量化函数 map_infer 显著加快了 Series.applySeries.map 的速度,当传入逐元素的 Python 函数时,受 (GH 355) 启发

  • VBENCH 显著提升了 Series.order 的性能,这也使得在 Series 上调用 np.unique 更快 (GH 327)

  • VBENCH 大幅提升了在带有 MultiIndex 的轴上 GroupBy 的性能 (GH 299)

贡献者#

共有 8 人为本次发布贡献了补丁。名字旁边带有“+”的人员是首次贡献补丁。

  • Adam Klein +

  • Chang She +

  • Dieter Vandenbussche

  • Jeff Hammerbacher +

  • Nathan Pinger +

  • Thomas Kluyver

  • Wes McKinney

  • Wouter Overmeire +