版本 0.4.1 至 0.4.3(2011 年 9 月 25 日 - 10 月 9 日)#

新特性#

  • 添加了使用 2to3 的 Python 3 支持 (GH 200)

  • 添加了 name 属性到 Series,现在作为 Series.__repr__ 的一部分打印

  • Series.isnull()Series.notnull() (GH 209, GH 203)

  • 添加了 Series.align 方法,用于按选择的连接方法对齐两个 Series (ENH56)

  • 添加了 get_level_values 方法到 MultiIndex (GH 188)

  • 通过 .ix 索引属性设置混合类型 DataFrame 对象中的值 (GH 135)

  • 添加了新的 DataFrame 方法 get_dtype_counts 和属性 dtypes (ENHdc)

  • 添加了 ignore_index 选项到 DataFrame.append,用于堆叠 DataFrames (ENH1b)

  • read_csv 尝试使用 csv.Sniffer检测分隔符 (GH 146)

  • read_csv 可以读取多列到 MultiIndex 中;DataFrame 的 to_csv 方法会写入相应的 MultiIndex (GH 151)

  • DataFrame.rename 有一个新的 copy 参数,用于原地重命名 DataFrame (ENHed)

  • 支持按名称 unstack (GH 142)

  • 支持 sortlevel 按级别工作 (GH 141)

性能改进#

  • 改变了对索引不同的 SparseSeries 对象进行二元运算的方式,以使用基于整数(密集)的对齐逻辑,该逻辑在块数量较多时更快 (GH 205)

  • 编写了更快的 Cython 数据对齐/合并例程,显著提高了速度

  • 改进了 isnullnotnull 的性能,这是 v0.3.0 中的一个回归 (GH 187)

  • 重构了与 DataFrame.join 相关的代码,以便无需创建每个 DataFrame 参数中数据的中间对齐副本。显著提高了性能 (GH 176)

  • 显著改进了通用 Index.intersectionIndex.union 的性能

  • 实现了 BlockManager.take,显著加快了对混合类型 DataFrame 对象执行 take 的性能 (GH 104)

  • 改进了 Series.sort_index 的性能

  • 显著的 groupby 性能改进:移除了 DataFrame 内部不必要的完整性检查,这些检查会减慢切片操作以检索分组

  • 优化了 _ensure_index 函数,在类型检查 Index 对象时节省了性能开销

  • 使用 Cython 编写了快速的时间序列合并/连接方法。之后会集成到 DataFrame.join 及相关函数中

贡献者#

共有 2 人为此版本贡献了补丁。名字旁有“+”的人是首次贡献补丁。

  • Thomas Kluyver +

  • Wes McKinney