版本 0.5.0 (2011 年 10 月 24 日)#
新特性#
添加了
DataFrame.align
方法,支持标准连接选项添加了
parse_dates
选项,用于read_csv
和read_table
方法,以选择性地尝试解析索引列中的日期添加了
nrows
、chunksize
和iterator
参数用于read_csv
和read_table
方法。后两个参数返回一个新的TextParser
类,能够按块延迟迭代平面文件 (GH 242)添加了私有函数
_get_duplicates
到Index
中,以便更轻松地识别重复值 (ENH5c)添加了 DataFrame 的列属性访问功能。
为包含对象的 Series 实现了
Series.describe
方法 (GH 241)DataFrame 在控制台输出中会显示索引级别名称 (GH 334)
实现了
Panel.take
添加了
set_index
便利函数,用于从 DataFrame 现有列创建索引
性能提升#
VBENCH 文件解析函数
read_csv
和read_table
的主要性能改进VBENCH 添加了 Cython 函数,用于极快地将元组转换为 ndarray。加快了许多与 MultiIndex 相关的操作
VBENCH 将合并/连接代码重构为一个整洁的类,并在浮点/对象情况下禁用了不必要的计算,从而将性能提高了约 10% (GH 211)
VBENCH 将混合类型 DataFrame 对象的
DataFrame.xs
速度提高了约 5 倍,修复了 0.3.0 版本中的性能回归问题 (GH 215)VBENCH 利用新的
DataFrame.align
方法,将不同索引的 DataFrame 对象之间的二元操作速度提高了 10-25%。VBENCH 显著加快了将嵌套字典转换为 DataFrame 的速度 (GH 212)
VBENCH 显著加快了大型混合类型 DataFrame 对象的
__repr__
和count
方法的速度
贡献者#
共有 9 人为本次发布贡献了补丁。名字旁带有“+”的人是首次贡献补丁。
Aman Thakral +
Luca Beltrame +
Nick Pentreath +
Skipper Seabold
Thomas Kluyver +
Wes McKinney
Yaroslav Halchenko +
lodagro +
unknown +