ChatGPT拿下AI修bug顶级成绩!31个Bug修复率领先

bc5f58ea60ae5cef64b352c1eb7abfc7.jpeg

文|金磊 衡宇

源|量子位

ChatGPT到底有多会修bug?这事终于有人正儿八经地搞研究了——来自德国、英国的研究人员,专门搭了个“擂台”来检验ChatGPT的这项本领。1b755cd4c7234a184ae33a1caa6fa617.png除了ChatGPT之外,研究人员还找来了其它三位修bug的“AI猛将”,分别让它们修复40个错误代码。结果真是不比不知道,一比吓一跳。ChatGPT准确修复了其中31个bug,遥遥领先第二名(21个),直接拿下“AI修bug界”的SOTA成绩!34052e8b5096d3639372bae6a09bbe4e.png于是乎,这项研究引来了众多网友的围观和讨论,Reddit上发布此帖的标题更是用上了“小心”“注意”这样的字眼:2ac042fced40b040a596e5d5a58d5767.png但事实上,这真的会让程序员“危”吗?我们不妨先来看下这项研究。

很会修bug的ChatGPT

虽然ChatGPT并非是为了专门修改bug而生,但自打它问世以来,不少网友们都发现它是具备这项能力的。因此研究人员为了摸清ChatGPT到底能修改bug到什么程度,便引入了标准的错误修复基准集QuixBugs来进行评估。以及与它同台竞技的AI选手,分别是CodeXCoCoNutStandard APR。研究人员从QuixBugs中挑了40个问题,分别让它们来修复bug。让ChatGPT来修bug的方法,就是在对话框里向它提问:

这个代码有什么错误吗?

在第一轮较量过后,结果如下:ec8be204d71322ad3d796e06efcccaf7.jpeg从第一轮battle结果来看,ChatGPT修复了19个,CodeX修复了21个,CoCoNut修复了19个,Standard APR则是7个。而且研究人员还发现,ChatGPT的答案与CodeX最为相似;这是因为它俩是来自同一个语言模型家族。这时候就会有小伙伴要问了,“ChatGPT不是还没有CodeX厉害吗”。别急,不要忘了,ChatGPT的一个特点就是越问越“上道”。例如在这个基准集中,有一个叫bitcount的问题,ChatGPT在刚才第一轮修复过程中是给了错误的答案:605fa14520cacc95edf54d23786d5ec2.png原本ChatGPT应该将第7行的 n ^ = n - 1 改为 n & = n - 1。但在第一轮中它的回答是:

如果没有更多关于预期行为和导致问题的输入信息,我无法判断程序是否存在错误。

于是在给予它更多信息之后,ChatGPT便答对了这个问题。以此类推,在对第一轮没答对的问题进行更多信息提示之后,ChatGPT的修bug能力有了大幅提高:61f77f72e9f055ea218c91bb86222524.png最终,ChatGPT在QuixBugs的40个问题里答对了31个。

网友忧喜参半

对于这样的实验结果,网友们对ChatGPT修bug拿下SOTA这事产生的态度却不太一样。有网友认为这事不应该让程序员感到危机,而是会让他们觉得开心才对。言外之意,便是程序员们有了这么好用的工具,干活儿就会变得事半功倍。d354e5ded1f7700f72911e2cea5911ed.png不过也有人对此给出了不一样的看法:

工作变得简单,不也就意味着需要的人力更少了吗?

ab3cf88ec9e6918c2a999d137f91dfed.png但还网友觉得,活儿是干不完的:

即使AI能把开发时间缩短一个数量级,也只是意味着程序员将更快处理下一个工作。

4bb1b6905c1618f69914da8772f6c5e8.png整体来看,ChatGPT很会修bug,并不会给程序员带来什么致命伤害。但若是把目光放到OpenAI其他的行动中呢?

全球招外包训练ChatGPT写代码

在此之前,OpenAI就表示过ChatGPT的重要用途之一是帮助程序员检查代码。换言之,它被定位可用的辅助工具。相比“ChatGPT带来威胁”的看法,等ChatGPT能力彻底进化,程序员都不用再怕写bug了。OpenAI布局的棋盘上,可不只有改bug偷塔程序员岗位这一件事。为了让它更大更强,OpenAI被曝在拉美和东欧等地区,提供了1000个外包岗位。外包员工的主要工作是标注数据,以及训练ChatGPT写代码这1000人中,40%是程序员,他们为OpenAI的模型创建数据,用来学习软件工程任务。一直以来,OpenAI的训练数据是从GitHub上抓取的。现在外包程序员们新手搓的数据集,不仅包括代码行,还包括代码行背后的人类思考逻辑步骤。有位南美的软件开发人员爆料,他为OpenAI完成了五小时的无偿编码测试。整个过程中,他的任务分为两部分。

  • 用书面英语解释如何处理一个编码问题;

  • 提供解决方案。

如果发现bug,OpenAI会向他详细询问bug的具体情况,并请教如何修正。程序员需要展示思考问题的每个步骤,他据此猜测OpenAI很可能想为ChatGPT提供非常具体的训练数据。特斯拉前AI主管Andrej Karpathy在推特上调侃:

最新的热门编程语言是英语。

f885f59145f02dce83ff4ef32df99f10.png不过话说回来,ChatGPT修bug能力强是好事,要真能搞进化到可以完成代码里死记硬背的部分,也是好事。毕竟OpenAI成立时对外宣称的宗旨,就是希望“确保通用人工智能可以造福全人类”。虽然乍一看它这些年做的事,有点像在致力于用一部分人的努力,让更多人失业

从Dota2赛场上碾压人类,到GPT-3、DALL-E2、ChatGPT的闪耀表现,它带来的新产品总是伴随着“快要让xxx失业了”的议论声。但无论如何,商业却一直对它青睐有加。就目前而言,OpenAI的主要商业模式是API费用、token费用和软件许可。OpenAI近期还发布了ChatGPT的付费版ChatGPT Pro,每月费用42美元(约合285元人民币)。1d0927e93e30024f2b49941601e31867.png虽然机器人对话初创公司如雨后春笋般冒出,但诸多迹象表明市场对OpenAI的持续看好。微软刚刚宣布将向OpenAI加码投资数十亿美元,并将OpenAI的模型融入微软必应等消费级和企业级产品中。根据知情人士透露,此次追加投资数额约为100亿美元。与此同时,WSJ披露的消息显示,1月初,亿万富翁Peter Thiel创立的风投基金Founders Fund正在就投资OpenAI进行谈判。据悉,融资金额将至少达3亿美元7b013347c1e735ed870b500691ee81fb.png

One More Thing

在第一轮实验中,ChatGPT并没有解决QuixBugs数据集的bitcount问题。但若是你现在再重头问一次这个问题,就会发现ChatGPT可以“一遍过”:4813f41fde358587d9be9b1bf260ebc7.png那么这是否意味着ChatGPT已经从这次研究过程中学会求解了呢?

8ff5def0d47151be1c9a2397f4e39047.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

a8072dcbc98bfd9856a1d91488adf3af.png

[1]https://arxiv.org/abs/2301.08653

[2]https://www.pcmag.com/news/watch-out-software-engineers-chatgpt-is-now-finding-fixing-bugs-in-code

[3]https://www.reddit.com/r/technology/comments/10oaw6n/watch_out_software_engineers_chatgpt_is_now/

[4]https://en.wi.bwl.uni-mainz.de/dominik-sobania/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/16918.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT击败代码BUG:AI实力震撼全球

修改代码Bug的步骤 设定身份> 指明BUG > 测试验证(自己手动验证) > 再指明BUG > 验收完成 问题说明 下面是一段有问题的代码,我们尝试让chatGPT帮我们修复。 有BUG的代码在线演示: https://codesandbox.io/s/you-b…

ChatGPT OpenAI系统 AI文本创作 模板自定义创作模型 文案模板

最新版的1.9.2数据库AI文本创作是不带自定义创作模型模板的,很多会员问我有没有现成的,整理了一个老版本至新版本的模板文字供大家参考,同时为了方便大家更省事,提供数据表下载, 把数据表直接导入替换原来的即可 fox_…

Midjourney 玩上瘾了,免费AI 绘图指令一键产生精美图片

文章目录 Midjourney 是什么?1. 注册 Discod2. 登入 Midjourney 聊天室频道3. 透过 Midjourney 指令产生 AI 图片4. Midjourney 指令怎么输入?5. Midjourney 图片版权问题 全球 ChatGPT 聊天机器人和 AI绘图话题非常火夯,不管是否懂电脑绘图或…

投资、理财、炒股记事

http://blog.csdn.net/pipisorry/article/details/45677173 同花顺模拟炒股软件的使用 下载同花顺模拟炒股软件 软件下载以后 ,会先提示注册 用户名 密码 邮箱地址登陆 菜单栏 > 委托 > 模拟炒股 > 炒股首页 > 找到自己的账号 > 我的模拟炒股 >…

利用AI炒股开挂!这届程序员真会玩

用深度学习预测股票价格想过去有些不明觉厉,但已经不是什么新鲜事了,今天猿妹和大家分享一个股票预测模型,收集了机器学习和股票预测的深度学习模型,包括交易机器人和(股票)模拟。 想要准确预测股票市场是一…

炒股的策略方法

炒股的策略方法 炒股常见问题 你炒股的时候有没有遇到这样的问题? (1)需要时刻盯着大盘和个股的走势,一分心,一走神,就错过了机会?工作时没有时间和精力去看大盘走势和个股的走势,…

炒股的最高境界:炒股就是炒心态,耐心看完受益匪浅!

其实炒股也是分为很多境界的,像我们大多数投资者可能还停留在最低级别的境界当中,那么炒股最高境界是什么? “不以涨喜,不以跌悲”这就是炒股的最高境界,也就是我们常说的心态! 有很多人炒了很多年股&…

怎样配置炒股用的计算机,炒股专用电脑配置

炒股专用电脑配置 一、显卡 1、欲购六屏且囊中羞涩的股民朋友,显卡可以选择AMD的六屏显卡,为避广告嫌疑,此处便不列举具体型号了。而预算稍充足一些的便推荐更加稳定的英伟达图形工作站系列显卡(如Nvidia Quadro P620)。 2、对于四屏及以下或…

最近很火的吃垃圾猫猫回收站。

最近很火的吃垃圾猫猫回收站。 演示图1 蓝奏:pop猫图标素材.zip - 蓝奏云 图标修改教程: 方法1:找到pop猫图片素材(这里我直接给大家提供了,上方蓝奏云链接,点击直接下载)。 1)下…

如何搭建你的私人专属ChatGPT等系列文章

「 静静地做自己,让世界发现你 」 科技毒瘤君将不定时分享优质工具,大家可以把科技毒瘤君公众号设为★星标,第一时间获取最新推送,以防错过优质内容。 官方网站:www.beiwangshan.com 百度搜索:北忘山 网站目…

chatgpt 源码

本系统包含 后台、前端、H5、小程序 超级管理端 管理员端 AI访问端 需要扫码

揭秘RLHF;可商用开源LLM列表;领域编译器的前世今生

1. GPT创造者:第二次改变AI浪潮的方向 那么,从推动这一系列变革的科学家角度,他究竟如何看待当先ChatGPT、GPT-4模型的发展?他对AI的思考和坚定信念从何而来?OpenAI下一步研究方向是什么?他又如何看待AI对社…

物理学又不存在了?ChatGPT:室温超导是物理学的一个梦想

大家好,我是小彭。 就在前天,一组微信聊天记录突然开始在各大群中流传: 随后,这一新闻直接引爆各大社交媒体,物理学又双叒叕不存在了吗? 到底是什么重磅消息呢? 原来在美国物理学会的三月会议…

赣货通全球桥接江西制造全球开花,贸易强国供应链出海江西在奋进

“赣货通全球”平台是什么? “赣货通全球”平台是江西制造进入全球供应链的数字贸易平台,平台免费为江西制造打造永不落幕线上国际化“赣品展”。核心的后台功能为企业用户提供大数据获客及营销功能,同时为企业提供贸易全流程的第三方外贸综合服务&…

从ChatGPT谈AI发展方向:全力助推乡村振兴事业快速发展

随着人工智能技术的不断发展,以ChatGPT为代表的颠覆性AI应用破圈,标志着人工智能领域的重大突破,引发全球共振。不少人将ChatGPT的问世比喻为“蒸汽机”,人工智能就此走向“工业时代”。 ChatGPT相较于之前市面上的所有同类产品&a…

催眠入門指導手冊

作者 迪兰摩根 介绍 第一章 言语能引发妳心中的图像 第二章 关掉肌肉系统 第三章 想象的探索 第四章 引导并控制想象 第五章 探索「诱导」 第六章 催眠后暗示 第七章 抗拒及亲和感 第八章 统合 这本书有如书名所言,主要针对初学者─也就是想要学习如何…

中国版chatGPT【文心一言】

文心一言是一款基于人工智能技术的中文自然语言处理工具,它可以用于文本生成、情感分析、关键词提取等多种应用场景。相比于GPT等其他自然语言处理模型,文心一言有着更多的优势。 首先,文心一言具有更高的准确率和可靠性。它采用了最新的深度…

chatgpt赋能python:Python操作SEO:从抓取网页到数据分析

Python操作SEO:从抓取网页到数据分析 在当今数字化时代,搜索引擎优化已经成为了每家企业的必修课。然而,SEO涉及到众多技术,其中爬虫抓取和数据处理是其中关键环节。而Python语言正是在这两个方面表现出了非常强大的优势。 1. P…

合工大Python爬虫实验——按关键词爬取新闻网站

时隔一年,笔者又拿着实验报告来写篇博客。 实验原理 爬虫实验使用了Python中的requests、beautifulsoup、json和pandas库,requests用于发送HTTP请求,beautifulsoup用于处理并解析响应的HTML文档,json用于解析json数据&#xff…

chatgpt赋能python:爬虫收集数据:提高SEO的重要工具

爬虫收集数据:提高SEO的重要工具 在数字化时代,数据仅仅是一种宝贵的资源,而且是Google的排名算法的关键组件之一。因此,SEO专家需要在确定目标市场时,采用不同的收集数据的工具和技术以获得必要的洞见,并…