版本 0.5.0 (2011年10月24日)#
新功能#
新增
DataFrame.align
方法,支持标准连接选项新增
parse_dates
选项到read_csv
和read_table
方法,可选择性地尝试解析索引列中的日期新增
nrows
、chunksize
和iterator
参数到read_csv
和read_table
。后两个参数返回一个新的TextParser
类,能够惰性迭代平面文件块 (GH 242)为
Index
新增私有函数_get_duplicates
,以便更轻松地识别重复值 (ENH5c)新增 DataFrame 的列属性访问功能。
DataFrame 将在控制台输出中显示索引级别名称 (GH 334)
实现了
Panel.take
新增 便捷函数
set_index
,用于从现有列创建 DataFrame 索引
性能改进#
VBENCH 文件解析函数
read_csv
和read_table
的主要性能改进VBENCH 新增 Cython 函数,用于快速将元组转换为 ndarray。加快了许多与 MultiIndex 相关的操作
VBENCH 将合并/连接代码重构为一个整洁的类,并禁用了浮点/对象情况下的不必要计算,从而获得了约 10% 的性能提升 (GH 211)
VBENCH 将混合类型 DataFrame 对象的
DataFrame.xs
速度提高了约 5 倍,这是从 0.3.0 版本开始的性能回归 (GH 215)VBENCH 借助新的
DataFrame.align
方法,将不同索引的 DataFrame 对象之间的二元操作速度提高了 10-25%。VBENCH 大幅加快了嵌套字典转换为 DataFrame 的速度 (GH 212)
VBENCH 大幅加快了大型混合类型 DataFrame 对象的
__repr__
和count
方法的速度
贡献者#
共有 9 人为本次发布贡献了补丁。名字旁边带有“+”的人员是首次贡献补丁。
Aman Thakral +
Luca Beltrame +
Nick Pentreath +
Skipper Seabold
Thomas Kluyver +
Wes McKinney
Yaroslav Halchenko +
lodagro +
未知贡献者 +