版本 0.5.0 (2011 年 10 月 24 日)#

新特性#

  • 添加了 DataFrame.align 方法,支持标准连接选项

  • 添加了 parse_dates 选项,用于 read_csvread_table 方法,以选择性地尝试解析索引列中的日期

  • 添加了 nrowschunksizeiterator 参数用于 read_csvread_table 方法。后两个参数返回一个新的 TextParser 类,能够按块延迟迭代平面文件 (GH 242)

  • 添加了DataFrame.join 中按多列进行连接的功能 (GH 214)

  • 添加了私有函数 _get_duplicatesIndex 中,以便更轻松地识别重复值 (ENH5c)

  • 添加了 DataFrame 的列属性访问功能。

  • 添加了 DataFrame 列的 Python tab 补全钩子。 (GH 233, GH 230)

  • 为包含对象的 Series 实现了 Series.describe 方法 (GH 241)

  • DataFrame.join 添加了内连接选项,用于按键进行连接 (GH 248)

  • 实现了 通过向 __getitem__ 传递列表来选择 DataFrame 列的功能 (GH 253)

  • 实现了 使用 & 和 | 分别对 Index 对象进行交集和并集操作 (GH 261)

  • 添加了 pivot_table 便利函数到 pandas 命名空间 (GH 234)

  • 实现了 Panel.rename_axis 函数 (GH 243)

  • DataFrame 在控制台输出中会显示索引级别名称 (GH 334)

  • 实现了 Panel.take

  • 添加了 set_eng_float_format 用于 DataFrame 浮点字符串的备用格式化 (ENH61)

  • 添加了 set_index 便利函数,用于从 DataFrame 现有列创建索引

  • 实现了 groupby 的分层索引级别名称 (GH 223)

  • DataFrame.to_csv 添加了对不同分隔符的支持 (GH 244)

性能提升#

  • VBENCH 文件解析函数 read_csvread_table 的主要性能改进

  • VBENCH 添加了 Cython 函数,用于极快地将元组转换为 ndarray。加快了许多与 MultiIndex 相关的操作

  • VBENCH 将合并/连接代码重构为一个整洁的类,并在浮点/对象情况下禁用了不必要的计算,从而将性能提高了约 10% (GH 211)

  • VBENCH 将混合类型 DataFrame 对象的 DataFrame.xs 速度提高了约 5 倍,修复了 0.3.0 版本中的性能回归问题 (GH 215)

  • VBENCH 利用新的 DataFrame.align 方法,将不同索引的 DataFrame 对象之间的二元操作速度提高了 10-25%。

  • VBENCH 显著加快了将嵌套字典转换为 DataFrame 的速度 (GH 212)

  • VBENCH 显著加快了大型混合类型 DataFrame 对象的 __repr__count 方法的速度

贡献者#

共有 9 人为本次发布贡献了补丁。名字旁带有“+”的人是首次贡献补丁。

  • Aman Thakral +

  • Luca Beltrame +

  • Nick Pentreath +

  • Skipper Seabold

  • Thomas Kluyver +

  • Wes McKinney

  • Yaroslav Halchenko +

  • lodagro +

  • unknown +