介绍第一位 AI 软件工程师 Devin

认识 Devin,世界上第一位完全自主的 AI 软件工程师。


Devin 是一位孜孜不倦、技术娴熟的队友,同样愿意与您一起构建或独立完成任务供您查看。


有了 Devin,工程师可以专注于更有趣的问题,工程团队可以为更雄心勃勃的目标而奋斗。

 Devin的能力

随着我们在长期推理和规划方面的进步,Devin 可以计划和执行需要数千个决策的复杂工程任务。Devin 可以在每一步中回忆相关的上下文,随着时间的推移学习并纠正错误。


我们还为 Devin 配备了通用的开发人员工具,包括 shell、代码编辑器和沙盒计算环境中的浏览器——人类完成工作所需的一切。


最后,我们赋予了 Devin 主动与用户协作的能力。Devin 实时报告其进度,接受反馈,并根据需要与您一起完成设计选择。


以下是 Devin 可以执行的操作示例:

Devin 可以学习如何使用不熟悉的技术。

在阅读了一篇博文后,Devin 在 Modal 上运行 ControlNet,为 Sara 生成带有隐藏消息的图像。

Devin 可以端到端地构建和部署应用程序。

Devin制作了一个模拟生命游戏的互动网站!它以增量方式添加用户请求的功能,然后将应用部署到 Netlify。

Devin 可以自主查找和修复代码库中的错误。

Devin 帮助 Andrew 维护和调试他的开源竞争性编程书籍。

Devin 可以训练和微调自己的 AI 模型。

Devin 为大型语言模型设置了微调,只给出了指向 GitHub 上研究存储库的链接。

Devin 可以解决开源存储库中的错误和功能请求。只要有一个指向 GitHub 问题的链接,Devin 就会完成所需的所有设置和上下文收集。

Devin 可以为成熟的生产存储库做出贡献。

此示例是 SWE-bench 基准测试的一部分。Devin 解决了 sympy Python 代数系统中对数计算的错误。Devin 设置代码环境,重现错误,并自行编码和测试修复程序。

我们甚至尝试在 Upwork 上给 Devin 提供真正的工作,它也可以做到这些!

在这里,Devin 编写和调试代码以运行计算机视觉模型。Devin 对生成的数据进行采样,并在最后编制一份报告。

 德文的表现

我们在 SWE-bench 上评估了 Devin,这是一个具有挑战性的基准测试,要求代理解决在 Django 和 scikit-learn 等开源项目中发现的真实 GitHub 问题。


Devin 正确地解决了 13.86%* 的端到端问题,远远超过了之前最先进的 1.96%。即使给定要编辑的确切文件,最好的以前模型也只能解决 4.80% 的问题。

*Devin 是在数据集的随机 25% 子集上进行的。Devin 是无辅助的,而所有其他模型都是辅助的(这意味着模型被确切地告知哪些文件需要编辑)。

我们计划很快发布更详细的技术报告,请继续关注更多细节。

 关于认知

我们是一个专注于推理的应用人工智能实验室。


我们正在培养 AI 团队成员,其能力远远超出当今现有的 AI 工具。通过解决推理问题,我们可以在广泛的学科中解锁新的可能性——代码只是一个开始。我们希望帮助世界各地的人们将他们的想法变为现实。


我们资金充足,包括由 Founders Fund 领投的 2100 万美元 A 轮融资。我们感谢行业领导者的支持,包括 Patrick 和 John Collison、Elad Gil、Sarah Guo、Chris Re、Eric Glyman、Karim Atiyeh、Erik Bernhardsson、Tony Xu、Fred Ehrsam 等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/274980.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何利用生成式人工智能撰写英语商务邮件?

写商务邮件简介 在当今数字化时代,能够撰写有效的商务邮件是一项无价的技能。电子邮件是专业世界中主要的沟通方式,在轻松跨越距离和时区的同时,也带来了一系列挑战;它要求清晰、高效,并遵循某些专业礼仪的潜在规则。…

常用的gpt网站

ChatGPT是一款基于人工智能技术的对话型AI助手,能够进行自然语言交互并提供个性化的对话服务。通过先进的深度学习模型,ChatGPT能够理解用户输入的文本,并生成有逻辑、连贯性的回复。它可以回答各种问题、提供建议、分享知识,还能…

2024年软考计划开始了,你准备好了吗?

目录标题 2024年度计算机技术与软件专业技术资格(水平)考试工作计划计算机软考中级科目哪个含金量最高?报考流程和说明 2024年度计算机技术与软件专业技术资格(水平)考试工作计划 一、2024年度计算机软件资格考试(初级…

SSM整合和实战练习笔记

SSM整合和实战练习1 SSM整合springmvc配置业务层 service aop tx的配置mybatis整合配置(方式2容器初始化配置类访问测试mapper层service层controller层 实战练习前端程序搭建后端程序搭建配置类创建实体类三层架构搭建(controller service mapper)功能实现&#xff…

Java学习笔记(7)

练习 package exercise3;public class FightTest {public static void main(String[] args) {Role r1 new Role("kobe", 100);Role r2 new Role("james", 100);while (true) {r1.attack(r2);if (isWin(r1,r2)) break;r2.attack(r1);if (isWin(r2,r1)) br…

虚幻4 | 制作游戏——学习记录(一)

1. 启动Epic后下载虚幻4,打开虚幻4后新建一个第三人称游戏项目,效果如下: (1)内容/ThirdPersonBP/Blueprints中的ThirdPersonCharacter(左下角人物) 这是模板中使用的主要蓝图类,它…

Frostmourne - Elasticsearch源日志告警配置

简介 配置Frostmourne 接入Elasticsearch源进行日志匹配告警,并静默规则,告警消息发送到企业微信,告警信息使用Markdown。 部署安装教程查看: https://songxwn.com/frostmourne_install ELK 安装教程:https://songx…

【Android】 ClassLoader 知识点提炼

1.Java中的 ClassLoader 1.1 、ClassLoader的类型 Java 中的类加载器主要有两种类型,即系统类加载器和自定义类加载器。其中系统类 加载器包括3种,分别是 Bootstrap ClassLoader、Extensions ClassLoader 和 Application ClassLoader。 1.1.1.Bootstra…

从0到1入门C++编程——12 演讲比赛流程管理系统

文章目录 一、创建类并显示菜单二、退出管理系统三、开始演讲比赛四、查看往届记录五、清空比赛记录六、案例源代码 演讲比赛流程管理系统 比赛规则:演讲比赛共有12个人参加,比赛分两轮进行,第一轮为淘汰赛,第二轮为决赛。每名选手…

Java中 final、finally、finalize 有什么区别?

1、典型回答 final、finally、finalize 是 Java 中三个不同的关键字,它们除了长得像之外,其他的(作用和含义)完全不同。 它们三个的区别就好像:雷、雷锋、雷峰塔之间的区别。(是三个完全不同的东西&#…

STM32---通用定时器(一)理论基础

写在前面:在STM32F103中有众多的定时器,其中包括两个基本定时器,基本定时器的内容已经在上节进行了介绍,基本定时器的功能、结构、使用都较为简单。而STM32F1中还含有4个通用定时器(TIM2\3\4\5),这些定时器…

【c++】特殊类的设计

💻文章目录 📄前言🌻特殊类的设计无法被继承的类只能在堆开辟空间的类无法被拷贝的类只能在栈开辟空间的类 🌺单例模式饿汉模式懒汉模式 📓总结 📄前言 你可听说过只能在堆上创建的类、无法被拷贝的类、甚至…

14双体系Java学习之数组

数组 ★小贴士 数组中保存固定数量的值,声明数组时需要制定数组中元素的类型,数组的长度在创建数组时设定。 保存数据的数据结构有很多,Java的标准函数库中就包含了许多复杂的数据结构,比如map、tree和set,以后会讲解的…

如何做代币分析:以 ARB 币为例

作者:lesleyfootprint.network 编译:mingfootprint.network 数据源:ARB 代币仪表板 (仅包括以太坊数据) 在加密货币和数字资产领域,代币分析起着至关重要的作用。代币分析指的是深入研究与代币相关的数据…

【考研】高等数学总结

文章目录 第一章 极限 函数 连续1.1 极限存在准则及两个重要极限1.1.1 夹逼定理1.1.1.1 数列夹逼定理1.1.1.2函数夹逼定理 1.1.2 两个重要极限1.1.2.1 极限公式11.1.2.1.1 证明1.1.2.1.2 数列的单调有界收敛准则1.1.2.1.2.1 二项式定理1.1.2.1.2.2 证明 1.1.2.2 极限公式21.1.2…

Linux - 进程信号

1、信号入门 1.1、生活角度的信号 你在网上买了很多件商品,再等待不同商品快递的到来。但即便快递没有到来,你也知道快递来临时, 你该怎么处理快递。也就是你能“识别快递”;当快递员到了你楼下,你也收到快递到来的通…

深圳市优质IDC服务商

深圳市南方联合科技有限公司是一家立足深圳、辐射全国的电信中立数据中心运营商,依托与电信运营商、IT 设备厂商在资源及渠道上的优势,借鉴业界成功运营经验,为用户提供持续、高速、安全的互联网数据中心服务(IDC)、企…

C#集合和数据结构,随笔记录

C#集合和数据结构 System.Collections命名空间包含接口和类,这些接口和类定义各种对象(如列表/链表、位数组、哈希表、队列和堆栈)的集合 System.Collections.Generic命名空间: 所有集合都直接或间接基于ICollection接口 列表类集…

Java项目:48 ssm008医院门诊挂号系统+jsp(含文档)

作者主页:舒克日记 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文中获取源码 项目介绍 本选题则旨在通过标签分类管理等方式实现 管理员;个人中心、药房管理、护士管理、医生管理、病人信息管理、科室信息管理、挂号管理、诊断…

案例--某站视频爬取

众所周知,某站的视频是: 由视频和音频分开的。 所以我们进行获取,需要分别获得它的音频和视频数据,然后进行音视频合并。 这么多年了,某站还是老样子,只要加个防盗链就能绕过。(防止403&#xf…