官方服务微信:dat818 购买与出租对接

全球首个全自主AI软件工程师Devin:自主学习与编程能力详解

4万

主题

2

回帖

12万

积分

管理员

积分
120677
发表于 2024-12-25 08:48:00 | 显示全部楼层 |阅读模式
    文章目录

    德文是什么?

    Devin 是世界上第一位由 AI 初创公司开发的完全自主的 AI 软件工程师。他有能力独立学习新技术、端到端构建和部署应用程序、独立查找和修复代码错误以及训练和微调人工智能模型。在SWE-bench基准测试中,Devin展示了超越其他AI模型的性能,并正确解决了实际的编程问题。

    官方介绍视频:

    德文的主要特点

    德文拥有以下能力:

   


    长期推理和规划:能够规划和执行需要数千个决策的复杂工程任务,记住每个步骤的相关上下文,随着时间的推移学习并修复错误。使用开发者工具:配备shell、代码编辑器、浏览器等常用开发者工具,在沙盒计算环境中工作。主动协作:能够实时报告进度、接受反馈并根据需要与用户一起做出设计选择。学习新技术:通过阅读博客文章和其他材料,了解如何使用不熟悉的技术。端到端应用程序构建和部署:能够从头开始构建和部署应用程序,例如 Sims of Life 游戏的交互式网站,并将其部署到。自行查找并修复代码库中的错误:帮助维护和调试开源竞赛编程书籍。训练和微调人工智能模型:只需提供研究存储库的链接即可对大型语言模型进行微调。处理开源存储库的问题:只需提供问题的链接,Devin 即可完成所有设置和上下文收集。对成熟生产存储库的贡献:作为 SWE-bench 基准测试的一部分,Devin 修复了 sympy 代数系统中的对数计算错误。做实际工作:在计算机上做实际的编程工作,编写和调试运行计算机视觉模型的代码,最后编译报告。

    德文的审核结果

    Devin 在 SWE-bench 上表现非常出色,这是一个具有挑战性的基准,要求参与者解决开源项目(例如 和 -learn)中的现实问题。 Devin 正确解决了 13.86% 的问题,这个速度远远超过了之前只能解决 1.96% 问题的现有技术水平。即使只给出要编辑的确切文件,之前最好的模型也只能解决 4.80% 的问题。 Devin 独立进行评估,而其他模型则得到协助(即模型被告知哪些文件需要编辑)。这一结果显示了 Devin 在理解和解决现实世界编程问题方面的巨大优势。

    如何使用德文?

   


    Devin现已开放使用,Devin官网地址:

    热门AI工具推荐:
您需要登录后才可以回帖 登录 | 立即注册

Archiver|手机版|小黑屋|关于我们

Copyright © 2001-2025, Tencent Cloud.    Powered by Discuz! X3.5    京ICP备20013102号-30

违法和不良信息举报电话:86-13718795856 举报邮箱:hwtx2020@163.com

GMT+8, 2025-7-12 22:00 , Processed in 0.086021 second(s), 18 queries .