Devin是一个人工智能的软件工程师。
目前它仍在积极开发中,但已成为一种突破性的工具,被誉为世界上第一个完全自主的人工智能软件工程师,程序员。
Devin 是由一个称为 Cognition AI 的公司开发,承诺通过处理端到端的软件项目(从规划和编码到调试和部署)而无需人工干预,从而彻底改变软件开发环境。然而,最近的文章、讨论和许多视频对这些说法提出了质疑,称其开发人员可能对Devin 造了假,或者至少有炒作的嫌疑。
让我们来看看创始人介绍的 Devin 未来的一些功能。
Devin 产品概况
Cognition 成立于 2023 年 11 月,员工分布在纽约和旧金山,是由华裔吴文俊、Walden Yan 和 Scale AI 前工程师 Steven Hao 共同创建。吴文俊曾与他人共同创办了虚拟网络初创公司 Lunchclub。他于 2022 年离开 Lunchclub。
Devin 被设计为独立的 AI 团队成员,并配备了一套开发工具,包括安全计算环境中的 Shell、代码编辑器和浏览器。它使用先进的人工智能来规划和执行复杂的工程任,并且学习新技术、识别和纠正错误,包括至训练和微调人工智能模型。
其团队的开发人员声称,它可以自主构建和部署应用程序,使其不仅仅是一个编码助手,而是一个“成熟的软件工程师”。
开发者的承诺
认知人工智能将 Devin 定位为软件工程领域的变革性工具,能够显著优于其他人工智能编码模型。
根据该公司分享的基准测试,Devin 在 SWE-bench 编码基准测试中具有很高的问题解决率,展示了其在现实场景中的熟练程度。人工智能自主运行和处理复杂任务的能力一直是一个主要卖点,有望提高软件开发的效率和创新。
怀疑论不断上升:Devin 造假?
尽管拥有这些令人印象深刻的经验,但在一段病毒式传播的视频和几篇声称Devin的能力可能被夸大的文章推动下,开发者社区内部还是出现了怀疑。
批评者们认为,虽然Devin展示了其潜力,但认知人工智能提供的演示和数据可能无法完全反映其在日常编码任务中的操作能力。这些批评在很多平台上引起了关注。
根据一段引起广泛用户关注的视频,它说Devin自主完成的任务可能是预先安排或简化的,以提高绩效评估结果。这种怀疑还在其他几篇文章和视频中得到了呼应,其中作者质疑用于评估Devin表现的基准的透明度。
在Youtube用户 Internet of Bugs 发布的视频中,作者表明 Devin 无法像其开发者声称的那样在 Upwork 平台上完成任务。
开发者社区反应
开发者社区对Devin反应不一。
一些开发人员对人工智能减少普通编码任务的潜力表示热情,从而使人类开发人员能够解决更复杂和更具创造性的问题。
然而,其他一些人则持谨慎态度,指出所声称的功能与不受控制的环境中的实际性能之间的差异。这场争论还延伸到了关于人工智能在软件开发中伦理影响的讨论,包括工作岗位的取代和人工智能生成的代码的可靠性。
前特斯拉人工智能总监安德烈·卡帕蒂 (Andrej Karpathy) 表示了肯定 :
“在我看来,自动化软件工程看起来与自动驾驶类似。”他接着称,软件工程有望发生重大变化。它将涉及更多受监督的自动化,同时用英语传达高级命令、想法或进展策略。
其实,就像任何其他生成式人工智能工具一样,Devin 的表现取决于使用它的人!这些只是高效用户手中的工具,使他/她的任务变得不那么繁琐和耗时!
受投资人重复追捧
一个能编写和修复代码的聊天机器人的承诺吸引了对一家成立六个月的初创公司的二次投资,是在它似乎搞砸了产品发布会之后。
据一位审查了交易条款的投资者称,一家名为“创始人基金”(Founders Fund)已牵头向 Cognition 投资了 1.75 亿美元。
这位投资者说,包括新的投资金额在内,这家风险投资公司对这家初创公司的估值为 20 亿美元。根据 PitchBook 报道,就在一个月前,Founders Fund 以 3.5 亿美元的估值领投了这家初创公司的 A 轮投资。
Cognition 的融资是人工智能初创公司在几乎没有收入的情况下以天价估值融资的最新佐证。此类交易甚至吸引了像 Founders Fund 这样的风险投资公司,而这些公司曾表示,由于竞争加剧和估值过高,他们正在回避大多数人工智能投资。
如此一来,在人工智能驱动的机器人软件领域,一家成立仅一年、没有收入的初创公司以 15 亿美元的估值从知名风险投资者那里筹集到了 3 亿美元。
结语
Cognition 是众多利用人工智能辅助软件工程师的公司之一。还有像微软旗下的 GitHub、谷歌和亚马逊以及 Magic、Replit 和 Codeium 等初创公司都提供了自己的人工智能编码助手。
那么,Devin是假的吗?现在下结论还为时尚早,但随着人工智能继续更深入地融入各个领域,开发社区对 Devin 等工具的审查是很重要的事。
虽然Devin代表了人工智能驱动的软件开发领域向前迈出的重要一步,但其能力的真正范围仍然是一个有争议的话题。Devin 能否真正兑现 Cognition AI 的承诺,还有待在更广泛的现实应用中看到。
目前,开发者社区仍然保持警惕,我们需要共同看到 Devin 如何发展以及它最终将如何影响软件工程的格局。
这场持续不断的争论,强调了人工智能技术在被广泛接受和实施之前透明度和严格、独立测试的重要性。随着像 Devin 这样的人工智能工具不断发展,它们必须伴随着强有力的讨论和评估,以确保它们满足开发者和他们想要转型行业设定的更高期望。