21CTO导读:微软将Python整合到了Excel中,除了与知名厂商合作,也有Python创始人在团队中的贡献。
Microsoft 与编程语言存储库提供商 Anaconda 合作,允许 Python 代码在 Excel 中运行,无需任何额外设置。此举目标在帮助数据从业者使用Excel应用程序内部的数据进行数据分析与机器学习。
微软在博客中表示:“在Excel 中使用 Python,可以直接在单元格中输入Python ,Python 计算将在微软云中运行,结果将返回到工作薄,包括绘图与可视化。”
微软的这一举拖将具有全新的划时代意义。因为全球大多数企业数据大多存储在 Excel 工作表中。以前很多数据从业者会经常『抱怨』,如果没有附加组件或额外设置,很难在 Excel 中使用 Python。
在 Excel 中使用 Python 无缝聚合和可视化你的数据
第三方组件
为了能在 Microsoft Excel 中更轻松地使用 Python 编码,事实上人们已经进行了多次实践与尝试。
2014 年, Zoomer Analytics开发了 Xlwings,这是一个使用 BSD 许可证的 Python 库 ,可连接到 Excel,并允许 Excel 电子表格和 Python 应用程序直接交互。
2017年,Anaconda 的开发商Continuum Analytics发布了Anaconda Fusion ,这是一个用于将企业级版的Anaconda与Microsoft Excel 2016及更高版本连接的系统。通过此种方式集成,数据科学家可以使用 Jupyter 笔记本中提供的 Python 代码和数据向 Excel 用户开放他们的工作。
此外,还有一些其它付费附加组件(例如PyXLL) 也可以帮助将 Python 集成到 Excel 中。
直到微软的自己产品出现。
新 Excel 中的 Python 独特之处
Excel 中的 Python 是专为数据分析师设计的。
微软通过原生 Python 与 Excel 的集成,用户将能够使用新的“PY”函数将 Python 代码直接输入 Excel 单元格,包括生成公式、数据透视表与 Excel 图表。
“使用 Excel 的内置连接器和 Power Query,用户可以轻松地使用Python 将外部数据引入 Excel 工作流程”,微软这样补充道。
微软还表示,企业将能够利用 scikit-learn 和 statsmodels等 Python 库 来应用流行的机器学习、预测分析和预测技术,包括回归分析和时间序列建模等。
当前,全球每天都有数百万用户利用 Excel 中的常用工具,如公式、图形和数据透视表来分析和解读数据。而从今日起,Python 将被直接且原生地整合到 Excel 的表格中。要开始体验,你只需使用全新的 PY 函数就能够直接在 Excel 的单元格中编写 Python 代码。
只需单击几下即可创建 DataFrame
Excel 用户可以通过 Python 获得强大的分析工具,可进行可视化、数据清洗、机器学习、预测分析等。用户可以完整地构建解决方案,使 Excel 和 Python 完美融合,而全部操作均可在 Excel 中完成。
通过使用 Excel 的内建连接器和 Power Query,用户可以轻松地将外部数据整合到 Excel 中的 Python 流程中。Excel 中的 Python 完全兼容用户熟悉且喜爱的工具,如公式、数据透视表和 Excel 图表。有人说Python将代替VBA,也似乎有此可能。
以下,是一些可以借助新 Excel 中的 Python 进行的分析示例:
1、高阶视觉展示
利用知名的 Python 图表库,如 Matplotlib 和 Seaborn,制作各种图表,从常规的条形图和折线图到专业的热力图、小提琴图与群集图。
使用 Seaborn 绘制图
2、机器学习、预测性分析及趋势预测
借助 Python 如 scikit-learn 和 statsmodels 等库的功能,执行流行的机器学习、预测性分析和预测方法,如回归分析、时间序列模型等。
使用 Python 和 Excel LAMBDA 预测天气的机器学习模型
3、数据整理
高效地使用先进的数据清洗技巧,如寻找遗失的数据、统一数据格式、移除重复数据,以及使用如正则表达式这样的技术进行基于模式的转换。
使用正则表达式提取日期
通过 Anaconda 展现 Python 的分析精髓
Anaconda 是由全球上千万数据实践者所使用的顶尖企业级 Python 仓库。
Python in Excel 利用在 Azure 上运行的 Anaconda 发行版,这里包含了最流行的 Python 库(如 pandas、Matplotlib、scikit-learn 等),且都经过 Anaconda 的安全校验、测试及支持。
由 Anaconda 提供的 Python 在 Excel 中展现了 Python 的广泛分析能力。
Anaconda CEO 及联合创始人 Peter Wang 表示:“非常高兴地宣布将 Anaconda 的 Python 发行版整合到 Microsoft Excel,这将为全球众多 Excel 用户带来革命性的变革。”
Excel 中的 Python 在 Azure上安全运行
Excel 使用的 Python 代码在 Microsoft Cloud 上以企业级安全性作为一个符合 Microsoft 365 连接体验来运行。Python 代码在 Azure 容器实例中的隔离环境里执行,并利用来自 Anaconda 的安全软件供应链。
Python in Excel 通过阻止 Python 代码访问用户身份来确保数据隐私,并在独立容器中隔离网络上的工作簿。
只能通过内建的 xl() Python 函数发送工作簿数据,而 Python 代码的输出只能作为 =PY() Excel 函数的结果返回。
Excel 中的 Python 为团队打造
用户可以放心地共享含有 Python 的 Excel 工作簿。团队成员可以轻松地与 Python 在 Excel 的分析交互和刷新,不需要担心安装附加工具或管理 Python 运行环境及其依赖。
用户可以利用他们钟爱的协作工具,如 Microsoft Teams 和 Microsoft Outlook,来共享工作簿,并通过评论、@提及和与同事的共同编辑在 Excel 中无缝合作。为含 Python 的工作簿设置的敏感度标签会确保它们符合组织的信息保护政策。
Python 在 Excel 代表了微软对 Python 的坚定承诺
Python 在 Excel 的实现得益于微软多个团队之间的紧密合作,这包括微软 Excel、微软开发者部门、微软安全、微软 Azure 和微软研究团队。这个项目展现了 Python 对微软的重要性,以及微软与 Python 社区合作的承诺,旨在使 Python 变得更好并为每个人提供更便捷的访问。
这包括 Guido van Rossum,Python 创始人、荣誉 BDFL,现为微软的杰出工程师,为 Python 在 Excel 的架构提供了指导。
以下是Guido van Rossum对Excel公共预览版的评价:
“看到 Python 和 Excel 这种卓越、紧密的结合终于浮现出来,我感到非常激动。我预计这两大社群在此次合作中会探索出有趣的新用法,从而提升各自的能力。三年前当我加入微软时,我甚至未曾想象过这会变为现实。Excel 团队真的做得太棒了!”
如何在 Excel 中使用 Python?
目前,Excel 中的 Python 功能仅对运行 Windows Beta Channel 的用户开放。该功能将首先在 Windows 11 的 Excel 中推出,版本为 16.0.16818.20000,之后将在未来的某个时间扩展至其它版本的操作系统。
要在 Excel 中体验 Python 功能,请加入 Microsoft 365 Insider Program。为了获得 Excel 应用的最新版本,请选择 Beta Channel Insider 级别。
在预览版期间,Excel 中的 Python 将作为 Microsoft 365 订阅的一部分。预览结束后,某些功能在没有付费许可的情况下可能会受到限制。在全面推出之前,微软会发布更多的详细信息。