ChatGPT修bug横扫全场,准确率达78%!程序员要开心了

ChatGPT到底有多会修bug?

这事终于有人正儿八经地搞研究了——

来自德国、英国的研究人员,专门搭了个“擂台”来检验ChatGPT的这项本领。

除了ChatGPT之外,研究人员还找来了其它三位修bug的“AI猛将”,分别让它们修复40个错误代码。

结果真是不比不知道,一比吓一跳。

ChatGPT准确修复了其中31个bug,遥遥领先第二名(21个),直接拿下“AI修bug界”的SOTA成绩!

于是乎,这项研究引来了众多网友的围观和讨论,Reddit上发布此帖的标题更是用上了“小心”“注意”这样的字眼:

但事实上,这真的会让程序员“危”吗?

我们不妨先来看下这项研究。

很会修bug的ChatGPT

虽然ChatGPT并非是为了专门修改bug而生,但自打它问世以来,不少网友们都发现它是具备这项能力的。

因此研究人员为了摸清ChatGPT到底能修改bug到什么程度,便引入了标准的错误修复基准集QuixBugs来进行评估。

以及与它同台竞技的AI选手,分别是CodeXCoCoNutStandard APR

研究人员从QuixBugs中挑了40个问题,分别让它们来修复bug。

让ChatGPT来修bug的方法,就是在对话框里向它提问:

这个代码有什么错误吗?

在第一轮较量过后,结果如下:

从第一轮battle结果来看,ChatGPT修复了19个,CodeX修复了21个,CoCoNut修复了19个,Standard APR则是7个。

而且研究人员还发现,ChatGPT的答案与CodeX最为相似;这是因为它俩是来自同一个语言模型家族。

这时候就会有小伙伴要问了,“ChatGPT不是还没有CodeX厉害吗”。

别急,不要忘了,ChatGPT的一个特点就是越问越“上道”。

例如在这个基准集中,有一个叫bitcount的问题,ChatGPT在刚才第一轮修复过程中是给了错误的答案:

原本ChatGPT应该将第7行的 n ^ = n - 1 改为 n & = n - 1。

但在第一轮中它的回答是:

如果没有更多关于预期行为和导致问题的输入信息,我无法判断程序是否存在错误。

于是在给予它更多信息之后,ChatGPT便答对了这个问题。

以此类推,在对第一轮没答对的问题进行更多信息提示之后,ChatGPT的修bug能力有了大幅提高:

最终,ChatGPT在QuixBugs的40个问题里答对了31个。

网友忧喜参半

对于这样的实验结果,网友们对ChatGPT修bug拿下SOTA这事产生的态度却不太一样。

有网友认为这事不应该让程序员感到危机,而是会让他们觉得开心才对。

言外之意,便是程序员们有了这么好用的工具,干活儿就会变得事半功倍。

不过也有人对此给出了不一样的看法:

工作变得简单,不也就意味着需要的人力更少了吗?

但还网友觉得,活儿是干不完的:

即使AI能把开发时间缩短一个数量级,也只是意味着程序员将更快处理下一个工作。

整体来看,ChatGPT很会修bug,并不会给程序员带来什么致命伤害。

但若是把目光放到OpenAI其他的行动中呢?

全球招外包训练ChatGPT写代码

在此之前,OpenAI就表示过ChatGPT的重要用途之一是帮助程序员检查代码

换言之,它被定位可用的辅助工具

相比“ChatGPT带来威胁”的看法,等ChatGPT能力彻底进化,程序员都不用再怕写bug了。

OpenAI布局的棋盘上,可不只有改bug偷塔程序员岗位这一件事。

为了让它更大更强,OpenAI被曝在拉美和东欧等地区,提供了1000个外包岗位

外包员工的主要工作是标注数据,以及训练ChatGPT写代码

这1000人中,40%是程序员,他们为OpenAI的模型创建数据,用来学习软件工程任务。

一直以来,OpenAI的训练数据是从GitHub上抓取的。

现在外包程序员们新手搓的数据集,不仅包括代码行,还包括代码行背后的人类思考逻辑步骤

有位南美的软件开发人员爆料,他为OpenAI完成了五小时的无偿编码测试。

整个过程中,他的任务分为两部分。

  • 用书面英语解释如何处理一个编码问题;

  • 提供解决方案。

如果发现bug,OpenAI会向他详细询问bug的具体情况,并请教如何修正。

程序员需要展示思考问题的每个步骤,他据此猜测OpenAI很可能想为ChatGPT提供非常具体的训练数据。

特斯拉前AI主管Andrej Karpathy在推特上调侃:

最新的热门编程语言是英语。

不过话说回来,ChatGPT修bug能力强是好事,要真能搞进化到可以完成代码里死记硬背的部分,也是好事。

毕竟OpenAI成立时对外宣称的宗旨,就是希望“确保通用人工智能可以造福全人类”。

虽然乍一看它这些年做的事,有点像在致力于用一部分人的努力,让更多人失业

从Dota2赛场上碾压人类,到GPT-3、DALL-E2、ChatGPT的闪耀表现,它带来的新产品总是伴随着“快要让xxx失业了”的议论声。

但无论如何,商业却一直对它青睐有加。

就目前而言,OpenAI的主要商业模式是API费用、token费用和软件许可。

OpenAI近期还发布了ChatGPT的付费版ChatGPT Pro,每月费用42美元(约合285元人民币)。

虽然机器人对话初创公司如雨后春笋般冒出,但诸多迹象表明市场对OpenAI的持续看好。

微软刚刚宣布将向OpenAI加码投资数十亿美元,并将OpenAI的模型融入微软必应等消费级和企业级产品中。

根据知情人士透露,此次追加投资数额约为100亿美元。

与此同时,WSJ披露的消息显示,1月初,亿万富翁Peter Thiel创立的风投基金Founders Fund正在就投资OpenAI进行谈判。

据悉,融资金额将至少达3亿美元

One More Thing

在第一轮实验中,ChatGPT并没有解决QuixBugs数据集的bitcount问题。

但若是你现在再重头问一次这个问题,就会发现ChatGPT可以“一遍过”:

那么这是否意味着ChatGPT已经从这次研究过程中学会求解了呢?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7276.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

区块链龙头股都有哪些?区块链概念股有哪些?

区块链龙头股都有哪些?区块链概念股有哪些? 区块链技术的应用程序似乎很广泛,它可以用于金融服务行业,例如,用于转移资金。它可以切断中间人,并可能带来更大的效率。这有可能提高不同行业的储蓄水平,从而提高盈利水平…

2019区块链概念股龙头

除了在教育行业的运用,区块链技术如今也被运用在其它社会事业的管理上。在国,社会事业种类特别多,需要处理的数据量也十分巨大。在档案管理,个人社会信用、公证、身份认证、遗产继承以及代理投票方面的作用十分突出。只要需要网络…

海外上市中国概念股每日行情

海外上市中国概念股每日行情 (单位:美元) 股票名称股票代码开盘最低最高收盘涨跌额涨跌幅成交量市值市盈率小时日期网易NTES39.8739.2540.2339.520.020.05%541482 $ 1,235,955,00025.994:00pm2/17/2005新浪SINA23.3423.1423.8023.18-0.091-0.39%168105…

九龙证券|受益行业红利,这些龙头股获资金青睐!

今天职业普涨,15个职业主力资金净流入。 证券时报数据宝计算,今天沪深两市主力资金净流出16.34亿元,较昨日流出力度大幅减缓。其间创业板净流入2.41亿元,沪深300成份股净流入17.13亿元。 今天职业普涨,申万一级职业中…

一起来创建A股上市公司细分行业龙头数据库

为什么要搭建呢? A股市场无论牛市、熊市还是 震荡市场更多的还是结构性机会,也就是行业及题材板块的热点轮动,此消彼长,这会是一种常态。 因此选股环节愈发重要,选对大趋势却没有选好板块--无用;选对了板块…

高效的股票数据接口工具有哪些?

我们已经知道了量化投资是是通过数量化方式及计算机程序化发出买卖指令,以获取稳定收益为目的的交易方式,而其中最重要的载体是数据。在金融领域中量化的应用让金融分析师、外汇交易员、产品研发员等技术人员又有了新的用武之地,转型成为量化…

A股各概念板块龙头股大全

A股各概念板块龙头股大全一、新兴信息产业龙头1、车联网龙头——软控股份002073 启明信息002232.荣之联0026422、通信网络龙头——恒宝股份0021043、通信设备制造龙头——新海宜002089.东方通信6007764、物联网互联龙头——三五互联300051.大唐电信600198.二六三0024675、三网融…

企业微信的聊天机器人来了,免费下载(Python版)

大家好,这里是程序员晚枫,个人网址:python-office.com 上次分享了微信机器人的视频以后,视频下面有一个热门评论: 什么时候开发企业版微信机器人?自动回复、自动群发等等~ 在经历了一段时间的查找和开发以…

从辩证的角度看待chatGPT,我们该如何对待?

从辩证的角度,看待chatGPT 0.什么是ChatGPT(客观阐述)1.通过唯物辩证法的五对基本范畴进行分析1.0.内容与形式1.1.现象和本质1.2.原因与结果1.3.必然与偶然1.4.现实与可能 2.使用ChatGPT会给我们带来的好处2.0.减轻劳动负担2.1.提供灵感和思路…

ChatGPT真的像媒体宣传的那样“四平八稳”吗?

最近ChatGPT非常的火爆,曝光度很高,很多官方媒体和个人的自媒体公众号都进行各种追逐。有些文案写的太好了,真的都要信了。其中有一篇“遨游四海,惊艳于某州”类似旅游宣传的文案。为了测试一下于是仿照他们的问话方式对ChatGPT进…

只需 5 分钟即可使用 ChatGPT 构建完整的 REST Web API

您是否有兴趣为您的 Web 应用程序构建一个健壮且高效的 RESTful API,但又不想花费数小时的时间和精力进行编码?不要再观望!在这篇博文中,我们将向您展示如何使用 ChatGPT(OpenAI 的一种高级语言模型)的强大…

云服务器升级node-chatgpt网站搭建

有时候安装网站程序对node版本有要求,今天讲下怎么升级node到最新版本。 之前我们讲了一些基础内容,相关知识可以参考。 云服务基本配置:腾讯云服务器小白保姆级教程_大鹏bmfm的博客-CSDN博客 node安装教程 腾讯云服务器安装node_大鹏bmfm…

chatgpt赋能python:Python如何连接自己电脑服务器

Python如何连接自己电脑服务器 Python作为一门流行的编程语言,不仅仅可以用来进行数据分析、爬虫等工作,还可以通过networking库实现与服务器的连接。本篇文章将介绍如何使用Python连接自己电脑的服务器,并提供一些实用的技巧和经验。 什么…

冲浪涨停预警,让你快速跟上涨停板通达信选股指标图解

通达信选涨停股选股公式 源码 涨停公式思路: 如何捕捉涨停股?选择涨停的时候一定要记得底部涨停的成交量要放量,不然第二天会冲高回落,因为底部成交量过小意味着很多人被套不愿意卖出股票,主力拉升期吃不到筹码,直接造…

【汇正财经】沪深创集体红盘,两市近百股涨停

盘面回顾: 周五美股大幅调整,影响今天开盘情绪,两市早盘低开,不过在上周的整体做多氛围下,市场积极性仍然比较,两市低开高走,尾盘均收红。今日成交8073亿,北向资金全天净卖出44.25亿…

超级牛散也踩雷!这A股宣布大消息

公司被债权人申请重整一事被法院正式立案7个多月后,5月24日,*ST搜特收到了法院的终结预重整程序通知书和不予受理重整申请裁定书。 消息曝出后,*ST搜特股吧则瞬间炸锅,投资者纷纷留言“完了”、“没盼头了”、“最后的希望终究还…

2月9日龙虎榜买入及卖出数据以及涨停板具体情况

2月9日龙虎榜买入及卖出数据以及涨停板具体情况 市场涨停榜情况: 1、妖股:翠微股份 2、六板:保利联合 3、五板:恒宝股份(6天5板)、冀东装备(6天5板) 4、四板(20%二板&am…

第二证券|热门板块再次爆发,早盘主力抢筹超10亿元!

抗原检测、房地产概念股团体冲高,板块热度居高不下。 抗原检测概念股团体上涨 12月9日早盘,新冠抗原检测概念股团体上涨,概念指数涨4.74%,明德生物涨停,九安医疗、万孚生物、热景生物涨幅居前,分别上涨8.4…

上海亚商投顾:沪指尾盘拉涨0.42% 天然气板块掀涨停潮

亚商投顾前言:无惧大盘大跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 市场情绪 沪指全天横盘震荡,临近尾盘小幅拉升,创业板指一度涨近1%,食品、白酒、旅游等大消费…