Cognition ai实验室发布全球首位AI程序员 : Devin。Devin是世界上第一位能够通过单一提示进行编码、创建网站和软件的AI程序员,已成功通过领先人工智能公司的实际工程面试,甚至完成了Upwork 上的真实工作,Devin是一个自主代理,通过使用自己的 shell、代码编辑器和网络浏览器来解决工程任务。包括以下的一些能力:
1、可以学习如何使用不熟悉的技术。
阅读博客文章后,Devin 在 Modal 上运行 ControlNet,为 Sara 生成带有隐藏消息的图像。
2、Devin 可以端到端地构建和部署应用程序。
Devin 制作了一个模拟生命游戏的互动网站!它逐步添加用户请求的功能,然后将应用程序部署到 Netlify。
3、Devin 可以自主查找并修复代码库中的错误。
Devin 帮助 Andrew 维护和调试他的开源竞争性编程书籍。
4、Devin 可以训练和微调自己的人工智能模型。
Devin 只给出了 GitHub 上研究存储库的链接,即可对大型语言模型进行微调。
5、Devin 可以解决开源存储库中的错误和功能请求。
只需提供 GitHub 问题的链接,Devin 即可完成所需的所有设置和上下文收集。
6、Devin 可以为成熟的生产存储库做出贡献。
此示例是 SWE-bench 基准测试的一部分。 Devin 解决了 sympy Python 代数系统中对数计算的错误。 Devin设置代码环境,重现错误,并自行编码和测试修复。
Devin 的突出之处在于其超前思考和计划复杂任务的能力。它可以做出数千个决定,从错误中吸取教训,并随着时间的推移变得更好。此外,它还拥有人类工程师所需的所有工具,例如代码编辑器和浏览器,触手可及。
Devin核心功能:
Devin 到底能做什么呢?几乎任何你扔给它的东西。无论是学习新技术、从头到尾构建和部署应用程序,还是查找和修复代码中令人讨厌的错误,Devin 都能满足您的需求。它甚至可以训练自己的人工智能模型并解决开源项目中的问题。
- 长期推理和规划:能够执行需要复杂决策的工程任务。
- 使用开发工具:掌握 shell、代码编辑器和浏览器等开发者工具。
- 积极协作:能够实时报告进度,接受反馈,与用户共同作出设计选择。
- 学习新技术:能够快速掌握并应用不熟悉的技术。
- 构建和部署应用:从头到尾完成应用的构建和部署。
- 自主发现并修复错误:独立发现并解决代码中的问题。
- 训练和微调 AI 模型:设置并微调大型语言模型。
- 处理开源仓库问题:应对开源项目中的错误和功能请求。
- 贡献到成熟生产仓库:解决复杂的生产级仓库问题。
- 完成实际工作任务:能在平台如 Upwork 上完成真实工作。
在 SWE-Bench 基准测试中,要求代理解决 Django 和 scikit-learn 等开源项目中发现的实际 GitHub 问题。Devin无需协助即可正确解决了 13.86%的问题,远远超过了之前 1.96% 的最佳水平。即使提供了要编辑的确切文件,以前最好的模型也只能解决 4.80% 的问题。
Devin 代表了人工智能技术的重大飞跃。通过自动化日常任务并让工程师能够专注于更复杂的问题,它为软件开发创新的新时代铺平了道路。因此,无论您是经验丰富的工程师还是刚刚起步的工程师,Devin 都会让您的工作比以往更轻松、更令人兴奋。
Tabby是一个自托管的人工智能编程助手,为开发人员提供了一个开源和本地部署的替代方案,支持通过利用第三方开源代码大模型(如StarCoder、CodeLlama、DeepseekCoder)以实现类似于 GitHub Copilot 的功能