程序员危!传OpenAI全球招外包大军,手把手训练ChatGPT取代码农

点击蓝字

d4f219730c33803e564d5346ef5d49a1.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

36752ee134fc460c19288631db8cfb3d.jpeg

码农真的危了!

最近有消息称,OpenAI已经在悄悄地训练ChatGPT,让它学习人类的思考过程,从而真正掌握软件工程,彻底代替「初级码农」。

12a15def69cc6bc41c363658d9a50c60.png

OpenAI招外包大军,教AI学人类思考

会编程的AI,几家硅谷大厂都在做。

DeepMind的AlphaCode,据说「吊打72%人类程序员」,但尚未开放;传闻中谷歌的「神秘项目」Pitchfork,也还在酝酿中;而微软的GitHub Copilot主要是一个代码补全工具。

要说完全代替人类码农,它们还不够格。

但如果真的让ChatGPT学会了用人类思维去编程,这些友商/自家的产品恐怕要被吊打。

0ee357875a870db503ce17e45cbd10f4.png

而从种种迹象看来,OpenAI似乎正在下一盘大棋。

根据Semafor的报道,在过去的六个月里,OpenAI已经从拉美和东欧等地区招募了大约1000名外包人员,来训练他们的AI码代码。

3a2a9ea1eb1e9c373fa4bcbd40d1b9fd.png

这个新闻中,有两个「华点」。

首先,为什么地点选在拉美和东欧?这个咱们都明白,现在硅谷的泡沫戳破了,各家互联网大厂都在绞尽脑汁「降本增效」,有的靠裁员,有的就去其他国家找廉价劳动力。

第二个「华点」是,这些外包人员中,很多人并不是计算机专业的毕业生,也不具备高级的编程技能。他们的作用是,编写OpenAI期待实现的「自动化」基本代码。

ff9eb3cdc4730822f16c233dea2a6746.jpeg

具体来说,其中的60%从事「数据标注」工作——创建大量的图像、音频片段等信息,用来训练人工智能工具或自动驾驶汽车。

另外的40%则是实打实的程序员,他们正在为OpenAI的模型「手搓」数据,从而让AI学习软件工程任务。

此前,OpenAI一直是用从GitHub上抓取的代码训练其模型。

而这次,OpenAI想建立的数据集中,不仅有代码,还包括背后用自然语言编写的人类解释。

2ad32594d988d0bbf3318bf5fcd8e1a6.png

论文地址:https://arxiv.org/abs/2107.03374

对此,Semafor特地采访了一位南美的开发者,而他曾无偿为OpenAI完成了5小时的编码测试。

在这个测试中,他被要求处理两个任务。

首先,他会得到一个编程问题,OpenAI要求他用书面的英语解释自己将如何处理这个问题。

然后,他需要提供一个解决方案。

如果他发现了一个bug,OpenAI就会要求他详细说明问题是什么,应该如何纠正,而不是简单地修复。

「他们很可能是想用一种非常特殊的训练数据来投喂这个模型,在这种情况下,就需要展示人类是如何一步步思考的。」这位开发者说。

7592c1285f629bafa4fb8eb4bb40040e.png

此前的ChatGPT,写的代码就被揪出过不少问题。

原因在于,ChatGPT没有任何标记了对错的内部记录,它其实是一个统计模型。ChatGPT的答案,本质上就是从构成GPT-3的互联网数据语料库中收集的概率结果。

当时OpenAI也说,ChatGPT最合适的定位,应该是编码辅助工具。

491dbfe834b049706ef4d1f0c0fb1815.png

但想象一下,如果OpenAI真的教会了ChatGPT「像人类一样一步一步思考」,那它完全可以代替一些需要死记硬背的写代码工作,后果就是,一些「初级」码农被彻底淘汰。

现在,硅谷的高管们正在设想这样的产品,让几乎没有编程经验的人士向AI描述自己的创意和愿景,然后就能构建出任何自己想要的东西,无论是一个网站,还是一个游戏。

几天前,特斯拉的前人工智能主管Andrej Karpathy刚刚在推特上说:「最热门的新编程语言是英语」。

ff18377ef546fb3463d714b00b5e87bb.png

用ChatGPT来debug,效果拔群

这可能并不是一个玩笑,比如当红炸子鸡ChatGPT,就很有潜力。

最近,一项来自美因茨大学和伦敦大学学院的研究发现,ChatGPT不仅可以出色地修复bug,而且开发者还能通过对话来显著提高成功率。

8f2389e3c28bd91ec4f3c7925b48e123.png

研究人员表示,ChatGPT的debug性能与常见的深度学习方法CoCoNut和Codex相差无几,并且明显优于标准的自动程序修复方法(APR)。

93669e3d675e2e01d1540de3fc6f8b0b.png

论文地址:https://arxiv.org/abs/2301.08653

用ChatGPT来解决代码问题并不新鲜,但与人类对话的独特能力,使它比其他方法和模型更具优势。

为了评估ChatGPT的debug性能,研究人员使用QuixBugs基准的40个纯Python问题对其进行了测试,然后手动检查建议的解决方案是否正确。

由于ChatGPT给出的答案存在一定的随机性,因此研究人员针对每个问题都会单独测试4次。

与其他自动程序修复的基准不同,QuixBugs包含了相对较小的问题(代码行数少),而这非常适合在对话系统中使用。

7e7bf8fd63d236c9a979c486d8c4711c.png

在测试过程中,研究人员删除了所有的注释,并询问ChatGPT这段代码是否有bug以及如何修复它。

比如,图1中就是一个关于BITCOUNT问题的例子。其中,第1-2行是向ChatGPT提出的需求;从第4行开始是错误的代码片段。

对于这个例子,我们希望ChatGPT的回答能解决第7行的错误,即nˆ= n - 1应该被替换为n &= n - 1。做为回应,ChatGPT要么给出一段修复完的代码,要么给出一个描述告诉我们应该如何修改。

74124c914756d4b139111369d303b692.png

结果显示,ChatGPT解决了40个bug中的19个,与CoCoNut(19)和Codex(21)相当,但标准的APR方法只解决了其中的7个问题。

当然,因为ChatGPT和Codex都是来自于同一个语言模型系列,所以解决问题的数量差不多也就不足为奇了。

此外,如果我们仔细观察结果还可以发现,ChatGPT并不是每次都能解决基准测试中的bug。仅在BUCKETSORT和FLATTEN这两个问题上,四次都发现了bug,而其他的通常只能成功1-2次。

也就是说,用户在实际使用时,可能需要尝试数次才能获得正确的结果。

8fbfae834c4cf0315f0a488eb0b3f7f0.png

不过,ChatGPT有一个强大的优势:我们可以在对话中与系统互动,更详细地对问题进行说明,从而获得正确的答案。

实际测试结果,也确实如此。

经过与模型更进一步的对话,研究人员成功地将ChatGPT的正确率刷新到了77.5%,也就是修复了40个错误中的31个,远超SOTA。

d5c9e6762a6b6549dee498ad19ed8182.png

至少,目前看来,这件事是完全有可能的:开发人员将不再需要编写样板代码。

相反,他们可以专注于复杂的应用程序架构或网络安全等领域。

也就是说,虽然ChatGPT可能会完成某些编程工作,例如编写通用函数或样板代码,但它不会完全取代程序员。因为程序员的工作需要的不仅仅是写代码。

成为一名程序员需要技巧——能够构建程序、遵循逻辑并生成比各部分总和更宏大的东西。

码农:我自己「杀」自己

显然,ChatGPT不是码农们做出的第一个「自我迭代」的产品。

8aab4a4a4cc1e32011c56c81f534b803.png

咱们来排一排,那些会写代码的AI。

谷歌的Pitchfork

去年11月,坊间传闻,谷歌正在酝酿一个秘密项目,这个产品会通过机器学习训练代码,自己编自己,自己修复bug,还能自己更新。

4ee4c7b35cbd4bf1b26a2bdffdbb7540.png

据知情人士透露,这个项目起初是由Alphabet的登月部门——X部门开发的,代号为Pitchfork,去年夏天被转移到了谷歌实验室。

根据内部资料,Pitchfork的作用是「教代码自行编写、自行重写」。

它能够学习不同的编程风格,并且根据这些风格写出代码。

一名谷歌员工表示,开发Pitchfork的初衷是希望建立一个工具,将谷歌的Python代码库更新到新版本。

AlphaCode:吊打72%程序员

2022年2月,DeepMind推出了「AlphaCode」系统,可以使用人工智能生成代码。

根据DeepMind的说法,AlphaCode可以与人类匹敌。

bb3fa31478a45d94a685fb080009e117.png

DeepMind使用编程竞赛平台Codeforces上托管的10个现有竞赛来测试AlphaCode,它的总体排名位于前 54.3%,也就是说,它击败了46%的参赛者 。

DeepMind声称,在使用编程竞赛平台Codeforces进行检测时,AlphaCode解决了100万个样本中34.2%的问题。

381fb278a5769f480c7bbe3fc2046595.gif

另外在过去6个月参加过比赛的用户中,AlphaCode的数据排到了前28%,可以说「吊打72%人类程序员」!

当时,DeepMind就指出,虽然AlphaCode目前只适用于具有竞争性编程领域,但显然,它未来的能力绝不会止步于此。

它为创造某些工具打开了大门,而这些工具将使编程变得更容易被人们接受,并且有朝一日可以完全实现自动化。

Copilot:代码补全神器

再往前,在2021年,GitHub与OpenAI共同推出了一款AI编程神器——GitHub Copilot。

a630cd7f032e107b7f085ec184b38268.png

输入代码时,Copilot会自动提示程序中接下来可能出现的代码片段,就像一个经过训练用Python或JavaScript说话的自动补全机器人。

Copilot能够填充必要的代码块,只要它们不是特别复杂或者特别有创造性,这对于相当于手工劳动的编程,可太有用了。

2022年6月22日,Copilot正式面向C端上线,定价10美元/月或100美元/年,并向学生用户和流行开源项目的维护者免费提供。

现在,成千上万的开发者都在用Copilot。在十几种最流行的语言编写代码中——有高达40%是依靠它来生成的。

246155a12d216fb60fa1f16b938e9a25.gif

GitHub预测,开发人员将在五年内使用Copilot编写多达80%的代码。

微软首席技术官Kevin Scott还表示:「我们确信:GitHub Copilot可以应用到数千种不同类型的工作中。」

不过,因为涉嫌侵权,在发布不到5个月后,Copilot已经被愤怒的程序员一举告上法庭,索赔90亿美元。

而学会「软件工程思维」的ChatGPT,能吊打它们吗?按OpenAI的速度,恐怕我们不用等太久。

参考资料:

https://www.semafor.com/article/01/27/2023/openai-has-hired-an-army-of-contractors-to-make-basic-coding-obsolete

https://www.zdnet.com/article/chatgpt-can-write-code-now-researchers-say-its-good-at-fixing-bugs-too/

往期精彩文章推荐

fdda7b53b4a2d933815b2c414c171663.jpeg

记得关注我们呀!每天都有新知识!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了900多位海内外讲者,举办了逾450场活动,超500万人次观看。

5680f5f4b7d1c5b2ec6dca78e458dd35.png

我知道你

在看

~

a0c0c3eef0947f9a1ff9dc44a0503cc4.gif

点击 阅读原文 解锁更多精彩!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/11431.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT重量级对手产品:Claude对外发布

什么是Claude Claude是下一代人工智能助手,基于 Anthropic 对训练有用、诚实和无害的人工智能系统的研究。Claude 可通过我们的开发人员控制台中的聊天界面和 API 进行访问,能够执行各种对话和文本处理任务,同时保持高度的可靠性和可预测性。…

RabbitMQ硅谷笔记

文章目录 RabbitMQMQ的相关概念什么是MQ为什么用MQMQ的分类MQ的选择 RabbitMQRabbitMQ概念RabbitMQ四大核心概念生产者交换机队列消费者 RabbitMQ基本功能教程安装官网Docker安装Docker安装中出现的一些错误 入门案例搭建基础环境编写代码 Work Queues轮询分发消费消息应答概念…

硬核干货篇:关于腾讯程序员的9个生存法则

腾小云导读 本文作者在腾讯多年,主要从事的是腾讯云CDN、EdgeOne产品的后台研发工作。作者在云计算领域遇到了不少代码设计和程序设计的问题,他对于如何把项目中的代码标准化、提高开发维护的效率,做了总结梳理。本篇为各位分享作者总结的代…

windows布局go-cqhttp

视频教程 windows布局go-cqhttp_哔哩哔哩_bilibili 官网:https://docs.go-cqhttp.org/ go-cqhttp文件下载地址:https://github.com/Mrs4s/go-cqhttp/releases 使用软件pycharm:https://www.jetbrains.com/pycharm/ 安装依赖库: …

Glados使用教程详解【2023更新】

Glados的含义有很多,如果你是指的是Glados加器速的使用方法,可以具体看: https://waimao.pro/glados/ 如果是Glados人工智能角色的使用,可以看接下来的教程。 GLaDOS(Genetic Lifeform and Disk Operating System&am…

2021面试总结

优先级 一级优先级:js、框架(vue/react)、项目介绍 二级优先级:html/css、浏览器相关 三级优先级:webpack、ts、git js js中的this指向 1、默认绑定,严格模式下指向undefined,非严格模式下执…

Java进阶3 - 易错知识点整理(待更新)

Java进阶3 - 易错知识点整理(待更新) 该章节是Java进阶2- 易错知识点整理的续篇; 在前一章节中介绍了 ORM框架,中间件相关的面试题,而在该章节中主要记录关于项目部署中间件,监控与性能优化等常见面试题。…

鹅厂程序员的9个生存法则

👉腾小云导读 本文作者在腾讯多年,主要从事的是腾讯云CDN、EdgeOne产品的后台研发工作。作者在云计算领域遇到了不少代码设计和程序设计的问题,他对于如何把项目中的代码标准化、提高开发维护的效率,做了总结梳理。本篇为各位分享…

简单的用户登录,注册,与退出

文章目录 前言一、登录界面1.HTML部分2.CSS部分 二、javascript部分/Js/为存放路径登录按钮注册按钮退出按钮 三、后端部分SysUser实体类SysUser控制类SysUser服务层SysUser服务实现层SysUser访问层mybatis部分 四、ResponseCode部分五、maven部分总结 前言 HTML,让…

3. 用户/管理员注册登录 - 如何使用个人Facebook来登录门户网站

Facebook也是使用OAuth2.0协议的几个Provider之一,可以将它放到我们的Protal中使用,下面我们将通过配置Prodiver来实现使用个人Facebook账户登陆我们的Power Protal。 1. 首先登录到我们的Power Apps,在左侧应用栏中选择应用,找到…

ChatGPT,你了解UWB吗?

说到最近网上最火的科技名词,非“ChatGPT”莫属。推出仅5天,用户超100万,上线两个月,全球活跃用户破1亿。上知天文下晓地理,能做题、会写诗、懂代码、几秒钟撰写论文,可以聊天交互……近日,一款…

留学生ChatGPT使用场景有哪些?用对了,学习效率事倍功半

ChatGPT的使用可谓是当今留学生必须掌握的内容之一。让我看看,应该没人还不知道如今hit爆的人工智能ChatGPT吧?!留学生正确使用ChatGPT可以帮助你解决许多问题,包括语言障碍、文化差异和学习压力等等。今天,求真老师就…

微信小程序之三步简单上手如何使用后端提供的接口

一.在js中的data对象中定义一个用于接收数据的空数组 这个数组我命名为resData。 二.在js中用wx.request发起网络请求 在测试的时候可以先把不校验合法域名给勾选上 wx.request({//这里的url用的是新视觉实训的一个测试接口url: https://edu.newsight.cn/wxList.php,//succe…

微信小程序开发者账号注册以及开发者工具的使用

打开微信小程序开发者平台官网 https://mp.weixin.qq.com/ 点击注册 选择小程序 接下来就是填写个人信息进行认证 在账号申请好后,我们下载一个微信开发者工具 进入官网https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html 根据电脑对应…

ChatGPT可以一本正经的胡说八道,其他AI可以吗?

目录 1.ChatGPT是什么? 2.它是哪个公司开发的? 3.TA会做什么? 写文章 写代码 聊天 4.总结 1.ChatGPT是什么? ChatGPT是由人工智能实验室OpenAI上线的一款由 聊天机器人模型新模型,暂时网页版允许用户免费使用&…

CHATGPT是新的“搜索引擎终结者”吗?百度是否慌了

ChatGPT 以其非凡的自然语言处理 (NLP) 能力和清晰的响应风靡全球,有望带来一场重大的技术革命。在不知不觉中,叙事转向了ChatGPT与百度的对决,因为来自OpenAI的智能和健谈的聊天机器人已经慢慢获得了“潜在的百度终结…

搜索引擎已死?ChatGPT访问量创新高:面前只剩三家

ChatGPT上月全球访问量 17.6 亿次,已达到谷歌的2%! 根据SimilarWeb统计,已超越必应、鸭鸭走DuckDuckGo等其他国际搜索引擎。 挡在前面的除了谷歌,就只剩中国的百度和俄罗斯的Yandex了。 如果把谷歌从图表中拿走更容易观察。整个…

ChatGPT 究竟在做什么?它为何能做到这些?(2)

机器学习和神经网络的训练 到目前为止,我们一直在讨论那些 “已经知道” 如何完成特定任务的神经网络。但是,神经网络之所以如此有用(估计也是在大脑中),是因为它们不仅是可以完成各种任务,而且可以逐步 “…

Python 输入信息获得ChatGPT 机器人

Python 输入信息获得ChatGPT 机器人

WhatsApp 电脑版如何下载安装?

WhatsApp是全球第一大通讯软件,超过20亿用户,在国外的普及程度类似于国内的微信,是外贸业务必备工具之一。 越来越多的企业用WhatsApp取代Email,作为外贸客户沟通的第一工具。 WhatsApp电脑版怎么下载安装? WhatsAp…