版本 0.4.1 至 0.4.3(2011 年 9 月 25 日 - 10 月 9 日)#

新功能#

  • 增加了对 Python 3 的支持,使用 2to3 (GH 200)

  • 添加 name 属性到 Series,现在作为 Series.__repr__ 的一部分打印

  • Series.isnull()Series.notnull() (GH 209, GH 203)

  • 添加 Series.align 方法,用于对齐两个 Series,并可选择连接方法 (ENH56)

  • 添加 方法 get_level_valuesMultiIndex (GH 188)

  • 在混合类型 DataFrame 对象中,通过 .ix 索引属性设置值 (GH 135)

  • 添加了新的 DataFrame 方法 get_dtype_counts 和属性 dtypes (ENHdc)

  • 添加了 ignore_index 选项到 DataFrame.append 以堆叠 DataFrames (ENH1b)

  • read_csv 尝试使用 csv.Sniffer 嗅探 分隔符 (GH 146)

  • read_csv 可以将多列 读取MultiIndex 中;DataFrame 的 to_csv 方法写入相应的 MultiIndex (GH 151)

  • DataFrame.rename 有一个新的 copy 参数,用于 就地重命名 DataFrame (ENHed)

  • 启用按名称 解堆叠 (GH 142)

  • 启用 sortlevel 按级别工作 (GH 141)

性能增强#

  • 改变了不同索引的 SparseSeries 对象上的二进制操作,以使用基于整数(密集)的对齐逻辑,在块数量较多时速度更快 (GH 205)

  • 编写了更快的 Cython 数据对齐/合并例程,显著提升了速度

  • 改进了 isnullnotnull 的性能,解决了 v0.3.0 引入的性能倒退 (GH 187)

  • 重构了与 DataFrame.join 相关的代码,以便不再需要为每个 DataFrame 参数创建中间对齐的数据副本。显著提升了性能 (GH 176)

  • 大幅改进了通用 Index.intersectionIndex.union 的性能

  • 实现了 BlockManager.take,显著提升了在混合类型 DataFrame 对象上 take 的性能 (GH 104)

  • 改进了 Series.sort_index 的性能

  • Groupby 性能显著增强:移除了 DataFrame 内部不必要的完整性检查,这些检查会减慢获取组的切片操作

  • 优化了 _ensure_index 函数,在对 Index 对象进行类型检查时节省了性能

  • 使用 Cython 编写了快速的时间序列合并/连接方法。后续将集成到 DataFrame.join 和相关函数中

贡献者#

共有 2 人为本次发布贡献了补丁。名字旁有“+”的人是首次贡献补丁。

  • Thomas Kluyver +

  • Wes McKinney