版本 0.6.0 (2011年11月25日)#

新功能#

  • 新增 melt 函数到 pandas.core.reshape

  • 新增 level 参数,用于在 Series 和 DataFrame 描述性统计中按 level 分组 (GH 313)

  • 新增 headtail 方法到 Series,与 DataFrame 类似 (GH 296)

  • 新增 Series.isin 函数,检查每个值是否包含在传入的序列中 (GH 289)

  • 新增 float_format 选项到 Series.to_string

  • 新增 skip_footer (GH 291) 和 converters (GH 343) 选项到 read_csvread_table

  • 新增 drop_duplicatesduplicated 函数,分别用于删除重复的 DataFrame 行和检查重复行 (GH 319)

  • 实现了 DataFrame 上的运算符 ‘&’, ‘|’, ‘^’, ‘-’ (GH 347)

  • 新增 Series.mad,平均绝对偏差

  • 新增 QuarterEnd DateOffset (GH 321)

  • 新增 dot 到 DataFrame (GH 65)

  • 新增 orient 选项到 Panel.from_dict (GH 359, GH 301)

  • 新增 orient 选项到 DataFrame.from_dict

  • 新增 支持向 DataFrame.from_records 传入元组列表或列表列表 (GH 357)

  • 新增 groupby 多级分组 (GH 103)

  • 允许 DataFrame.sort_indexby 参数接受多列 (GH 92, GH 362)

  • 新增 快速 get_valueput_value 方法到 DataFrame (GH 360)

  • 新增 cov 实例方法到 Series 和 DataFrame (GH 194, GH 362)

  • 新增 kind='bar' 选项到 DataFrame.plot (GH 348)

  • 新增 idxminidxmax 到 Series 和 DataFrame (GH 286)

  • 新增 read_clipboard 函数,用于从剪贴板解析 DataFrame (GH 300)

  • 新增 nunique 函数到 Series,用于计数唯一元素 (GH 297)

  • 使 DataFrame 构造函数在未传入列时使用 Series 名称 (GH 373)

  • 支持 read_table/read_csv 中的正则表达式 (GH 364)

  • 新增 DataFrame.to_html 用于将 DataFrame 写入 HTML (GH 387)

  • 新增 支持 DataFrame 中的 MaskedArray 数据,屏蔽的值转换为 NaN (GH 396)

  • 新增 DataFrame.boxplot 函数 (GH 368)

  • 支持 向 DataFrame.apply 传递额外的 args 和 kwds (GH 376)

  • 实现了 DataFrame.join 带有向量 on 参数的功能 (GH 312)

  • 新增 DataFrame.plot 的布尔标志 legend (GH 324)

  • 支持stackunstack 传递多个 level (GH 370)

  • 支持pivot_table 传递多个 values 列 (GH 381)

  • GroupBy 中使用 Series 名称作为结果索引 (GH 363)

  • 新增 raw 选项到 DataFrame.apply,如果在只需要 ndarray 时可提升性能 (GH 309)

  • 新增经过适当测试的标准和面板 OLS 加权最小二乘法 (GH 303)

性能改进#

  • VBENCH 对 cache_readonly 进行了 Cython 化,显著提升了整个代码库的微观性能 (GH 361)

  • VBENCH 特殊的 Cython 矩阵迭代器,用于应用任意缩减操作,性能比 np.apply_along_axis 好 3-5 倍 (GH 309)

  • VBENCH 改进了 MultiIndex.from_tuples 的性能

  • VBENCH 特殊的 Cython 矩阵迭代器,用于应用任意缩减操作

  • VBENCH + 文档 向 DataFrame.apply 添加 raw 选项以获得更好的性能,当

  • VBENCH 更快的 Cython 化 Series 和 DataFrame 按 level 计数 (GH 341)

  • VBENCH? 显著提升了 GroupBy 在多键且有许多“空”组合时的性能

  • VBENCH 新的 Cython 向量化函数 map_infer 显著加速了 Series.applySeries.map 在传递逐元素 Python 函数时的性能,受到 (GH 355) 的启发

  • VBENCH 显著提高了 Series.order 的性能,这也使得在 Series 上调用 np.unique 更快 (GH 327)

  • VBENCH 极大地提高了 GroupBy 在带有 MultiIndex 轴上的性能 (GH 299)

贡献者#

共有 8 人为本次发布贡献了补丁。名字旁带有“+”号的人是首次贡献补丁。

  • Adam Klein +

  • Chang She +

  • Dieter Vandenbussche

  • Jeff Hammerbacher +

  • Nathan Pinger +

  • Thomas Kluyver

  • Wes McKinney

  • Wouter Overmeire +