Devin
AI编程开发
Devin

Cognition ai实验室发布全球首位AI程序员 : Devin。Devin是世界上第一位能够通过单一提示进行编码、创建网站和软件的AI程序员,已成功通过领先人工智能公司的实际工程面试,甚至完成了Upwork 上的真实工作,Devin是一个自主代理,通过使用自己的 shell、代码编辑器和网络浏览器来解决工程任务。

Cognition ai实验室发布全球首位AI程序员 : Devin。Devin是世界上第一位能够通过单一提示进行编码、创建网站和软件的AI程序员,已成功通过领先人工智能公司的实际工程面试,甚至完成了Upwork 上的真实工作,Devin是一个自主代理,通过使用自己的 shell、代码编辑器和网络浏览器来解决工程任务。包括以下的一些能力:

1、可以学习如何使用不熟悉的技术。

阅读博客文章后,Devin 在 Modal 上运行 ControlNet,为 Sara 生成带有隐藏消息的图像。

2、Devin 可以端到端地构建和部署应用程序。

Devin 制作了一个模拟生命游戏的互动网站!它逐步添加用户请求的功能,然后将应用程序部署到 Netlify。

3、Devin 可以自主查找并修复代码库中的错误。

Devin 帮助 Andrew 维护和调试他的开源竞争性编程书籍。

4、Devin 可以训练和微调自己的人工智能模型。

Devin 只给出了 GitHub 上研究存储库的链接,即可对大型语言模型进行微调。

5、Devin 可以解决开源存储库中的错误和功能请求。

只需提供 GitHub 问题的链接,Devin 即可完成所需的所有设置和上下文收集。

6、Devin 可以为成熟的生产存储库做出贡献。 ‍

此示例是 SWE-bench 基准测试的一部分。 Devin 解决了 sympy Python 代数系统中对数计算的错误。 Devin设置代码环境,重现错误,并自行编码和测试修复。

Devin 的突出之处在于其超前思考和计划复杂任务的能力。它可以做出数千个决定,从错误中吸取教训,并随着时间的推移变得更好。此外,它还拥有人类工程师所需的所有工具,例如代码编辑器和浏览器,触手可及。

Devin核心功能:

Devin 到底能做什么呢?几乎任何你扔给它的东西。无论是学习新技术、从头到尾构建和部署应用程序,还是查找和修复代码中令人讨厌的错误,Devin 都能满足您的需求。它甚至可以训练自己的人工智能模型并解决开源项目中的问题。

  • 长期推理和规划:能够执行需要复杂决策的工程任务。
  • 使用开发工具:掌握 shell、代码编辑器和浏览器等开发者工具。
  • 积极协作:能够实时报告进度,接受反馈,与用户共同作出设计选择。
  • 学习新技术:能够快速掌握并应用不熟悉的技术。
  • 构建和部署应用:从头到尾完成应用的构建和部署。
  • 自主发现并修复错误:独立发现并解决代码中的问题。
  • 训练和微调 AI 模型:设置并微调大型语言模型。
  • 处理开源仓库问题:应对开源项目中的错误和功能请求。
  • 贡献到成熟生产仓库:解决复杂的生产级仓库问题。
  • 完成实际工作任务:能在平台如 Upwork 上完成真实工作。

在 SWE-Bench 基准测试中,要求代理解决 Django 和 scikit-learn 等开源项目中发现的实际 GitHub 问题。Devin无需协助即可正确解决了 13.86%的问题,远远超过了之前 1.96% 的最佳水平。即使提供了要编辑的确切文件,以前最好的模型也只能解决 4.80% 的问题。

Devin 代表了人工智能技术的重大飞跃。通过自动化日常任务并让工程师能够专注于更复杂的问题,它为软件开发创新的新时代铺平了道路。因此,无论您是经验丰富的工程师还是刚刚起步的工程师,Devin 都会让您的工作比以往更轻松、更令人兴奋。

相关导航

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注