版本 0.4.1 至 0.4.3(2011 年 9 月 25 日 - 10 月 9 日)#
新功能#
增加了对 Python 3 的支持,使用 2to3 (GH 200)
添加
name
属性到Series
,现在作为Series.__repr__
的一部分打印Series.isnull()
和Series.notnull()
(GH 209, GH 203)在混合类型
DataFrame
对象中,通过.ix
索引属性设置值 (GH 135)添加了 ignore_index 选项到
DataFrame.append
以堆叠 DataFrames (ENH1b)read_csv
可以将多列 读取 到MultiIndex
中;DataFrame 的to_csv
方法写入相应的MultiIndex
(GH 151)
性能增强#
改变了不同索引的 SparseSeries 对象上的二进制操作,以使用基于整数(密集)的对齐逻辑,在块数量较多时速度更快 (GH 205)
编写了更快的 Cython 数据对齐/合并例程,显著提升了速度
改进了
isnull
和notnull
的性能,解决了 v0.3.0 引入的性能倒退 (GH 187)重构了与
DataFrame.join
相关的代码,以便不再需要为每个DataFrame
参数创建中间对齐的数据副本。显著提升了性能 (GH 176)大幅改进了通用
Index.intersection
和Index.union
的性能实现了
BlockManager.take
,显著提升了在混合类型DataFrame
对象上take
的性能 (GH 104)改进了
Series.sort_index
的性能Groupby 性能显著增强:移除了 DataFrame 内部不必要的完整性检查,这些检查会减慢获取组的切片操作
优化了
_ensure_index
函数,在对 Index 对象进行类型检查时节省了性能使用 Cython 编写了快速的时间序列合并/连接方法。后续将集成到 DataFrame.join 和相关函数中
贡献者#
共有 2 人为本次发布贡献了补丁。名字旁有“+”的人是首次贡献补丁。
Thomas Kluyver +
Wes McKinney