pandas 1.0

今天,pandas 迎来了 1.0.0 版本的发布。在很多方面,这只是一个普通的版本,包含了许多新功能、性能改进和错误修复,这些都在我们的 发行说明 中有记录。但它也有一些更深层的意义——一个超越代码提交的项目里程碑。我们想花些时间回顾一下我们走过的路,以及未来的方向。

反思

自 pandas 诞生以来,科学 Python 的世界发生了很大的变化。在 2011 年,生态系统是碎片化的:一个用于统计和数据科学的标准丰富数据结构尚未出现。这与 NumPy 的故事类似,NumPy 整合了之前碎片化的数组工作。

在接下来的几年里,pandas 成为了一种事实上的标准。它被数据科学家和分析师使用,并且作为其他库构建的基础数据结构。StackOverflow 指出 pandas 是 Python 成为增长最快的主要编程语言的原因之一。

Growth of pandas

如今,生态系统正处于探索的另一个阶段。几个新的 DataFrame 实现正在涌现,以满足 pandas 未能满足的需求。我们正在与这些项目合作,为丰富数据结构建立共享标准和语义。

社区和项目健康

本版本周期是第一个涉及 pandas 任何形式的资助。pandas 作为 CZI 的 科学必备开源软件 计划的一部分获得了资助。pandas 项目主要依靠志愿者贡献。这些志愿者贡献由一些维护者进行管理和补充,这些维护者从他们的雇主那里获得了时间——我们的 机构合作伙伴。我们资助项目中最大的工作项目是库维护,其中特别包括与社区成员合作解决我们大量未解决的问题和拉取请求。

虽然“1.0.0”版本可能看起来很随意或平淡无奇(考虑到 pandas 作为代码库已经存在近 12 年),但我们将其视为一个象征性的里程碑,庆祝我们的核心开发团队的成长和贡献者基础的深度。很少有开源项目真正“完成”,pandas 也不例外。我们认识到 pandas 目前所处的核心作用,并且我们打算继续发展该项目并适应世界数据整理者的需求。

展望未来

我们的 路线图 包含了我们对该项目未来几年的发展方向的最新列表。不用说,还有很多工作要做。

查看 发布说明 并访问 安装页面 获取有关更新到 pandas 1.0 的说明。