版本 0.5.0 (2011年10月24日)#

新功能#

  • 新增 DataFrame.align 方法,支持标准连接选项

  • 新增 parse_dates 选项到 read_csvread_table 方法,可选择性地尝试解析索引列中的日期

  • 新增 nrowschunksizeiterator 参数到 read_csvread_table。后两个参数返回一个新的 TextParser 类,能够惰性迭代平面文件块 (GH 242)

  • 新增DataFrame.join 中根据多列进行连接的功能 (GH 214)

  • Index 新增私有函数 _get_duplicates,以便更轻松地识别重复值 (ENH5c)

  • 新增 DataFrame 的列属性访问功能。

  • 新增 DataFrame 列的 Python 制表符补全钩子。( GH 233, GH 230)

  • 实现了 包含对象的 Series 的 Series.describe 方法 (GH 241)

  • 新增 DataFrame.join 的内连接选项,当按键连接时 (GH 248)

  • 实现了 通过将列表传递给 __getitem__ 来选择 DataFrame 列的功能 (GH 253)

  • 实现了 使用 & 和 | 分别对 Index 对象进行交集/并集操作 (GH 261)

  • 新增 pivot_table 便捷函数到 pandas 命名空间 (GH 234)

  • 实现了 Panel.rename_axis 函数 (GH 243)

  • DataFrame 将在控制台输出中显示索引级别名称 (GH 334)

  • 实现了 Panel.take

  • 新增 set_eng_float_format 用于备选 DataFrame 浮点字符串格式化 (ENH61)

  • 新增 便捷函数 set_index,用于从现有列创建 DataFrame 索引

  • 实现了 groupby 分层索引级别名称 (GH 223)

  • 新增 DataFrame.to_csv 对不同分隔符的支持 (GH 244)

性能改进#

  • VBENCH 文件解析函数 read_csvread_table 的主要性能改进

  • VBENCH 新增 Cython 函数,用于快速将元组转换为 ndarray。加快了许多与 MultiIndex 相关的操作

  • VBENCH 将合并/连接代码重构为一个整洁的类,并禁用了浮点/对象情况下的不必要计算,从而获得了约 10% 的性能提升 (GH 211)

  • VBENCH 将混合类型 DataFrame 对象的 DataFrame.xs 速度提高了约 5 倍,这是从 0.3.0 版本开始的性能回归 (GH 215)

  • VBENCH 借助新的 DataFrame.align 方法,将不同索引的 DataFrame 对象之间的二元操作速度提高了 10-25%。

  • VBENCH 大幅加快了嵌套字典转换为 DataFrame 的速度 (GH 212)

  • VBENCH 大幅加快了大型混合类型 DataFrame 对象的 __repr__count 方法的速度

贡献者#

共有 9 人为本次发布贡献了补丁。名字旁边带有“+”的人员是首次贡献补丁。

  • Aman Thakral +

  • Luca Beltrame +

  • Nick Pentreath +

  • Skipper Seabold

  • Thomas Kluyver +

  • Wes McKinney

  • Yaroslav Halchenko +

  • lodagro +

  • 未知贡献者 +