pandas 1.0

今天,pandas 迎来了其 1.0.0 版本。在许多方面,这只是一个包含大量新功能、性能改进和错误修复的常规版本,这些内容已记录在我们的版本说明中。但这也不仅仅如此——它是项目超越提交本身的一个里程碑。我们想花一些时间回顾过去,展望未来。

反思

自 pandas 启动以来,科学 Python 的世界发生了很大变化。2011 年,生态系统是分散的:用于统计和数据科学的标准化丰富数据结构尚未出现。这与 NumPy 的故事相似,NumPy 整合了之前分散的数组工作。

在随后的几年里,pandas 脱颖而出,成为一个事实上的标准。它被数据科学家和分析师使用,并作为其他库在其基础上构建的数据结构。StackOverflow 引用 pandas 作为 Python 成为增长最快的主要编程语言的原因之一。

Growth of pandas

今天,生态系统处于探索的另一个阶段。正在涌现几种新的 DataFrame 实现,以满足 pandas 未能满足的需求。我们正在与这些项目合作,为丰富数据结构建立共享标准和语义。

社区和项目健康

这个发布周期是 pandas 首次获得任何形式的赠款资助。作为 CZI 科学基本开源软件 (Essential Open Source Software for Science) 计划的一部分,pandas 获得了资助。pandas 项目绝大部分依赖于志愿贡献者。这些志愿贡献由一些维护者负责引导和补充,这些维护者由其雇主(我们的机构合作伙伴)提供工作时间。我们赠款资助中最大的一项工作是库维护,这特别包括与社区成员合作解决我们大量的开放问题和拉取请求积压。

虽然“1.0.0”版本可能看起来有些随意或平淡(考虑到 pandas 代码库已有近 12 年的历史),但我们将其视为一个象征性的里程碑,庆祝我们核心开发团队的壮大和贡献者基础的深入。很少有开源项目是真正“完成”的,pandas 也不例外。我们认识到 pandas 现在所占据的关键地位,并打算继续发展该项目,适应全球数据整理者的需求。

展望未来

我们的路线图包含我们认为项目未来几年发展方向的最新列表。不用说,仍有很多工作要做。

查看版本说明并访问安装页面,了解如何更新到 pandas 1.0 的说明。