OpenAI发布ChatGPT!手把手debug代码!

卷友们好,我是rumor。

已经好久没看OpenAI的官网[1]了,但今天冥冥之中感觉受到了什么召唤,心想GPT4什么时候发布,莫名地就打开了,果然有料:

d955d740b2a035bebcd8e74725b90ce2.jpeg

试用:https://chat.openai.com/

它把魔抓又伸向对话了!来一起看看官方放出的case吧:

帮人Debug代码,并进行多轮询问:

d38ad5a6b7358d950df15e4690fddd52.jpeg

识别出危险问题并拒绝回答,但用户说明意图后给出了更好的回复:

015d088c676da3df29e7c5176886c8bf.jpeg

执行指令,甚至改很多遍也不生气:

f738e6fc0d3dad0d203ccc1954c21af1.jpeg

还有个指代消解的case太长就不放了,OpenAI在最后还拿InstructGPT做了对比,可以看到InstructGPT只是冰冷地执行指令,而ChatGPT则更有温度一些。

从上面的例子可以看到,对比今年其他厂的对话工作,ChatGPT有几项明显的优点:

  1. 基于GPT3.5,有着更多样的训练数据,别的我不知道,反正debug代码有点东西

  2. 强大的多轮上下文理解能力,从指代消解、写信的例子看出来的,如果对历史消息没有很好的记忆理解,可能就新起一个话题了

  3. 更像人。目前大部分模型都是直接回答,而ChatGPT显然跟用户有一个「Chat」的过程,比如debug代码的时候,上来先回复「很难说,再多给点信息」

更像人的对话策略,是很难做出来的,因为我们不知道怎么才算「像个人」。谷歌为了解决这个问题,曾经拆分出了一堆指标。

而这次OpenAI则是采用了和DeepMind Sparrow[2]一样的策略,既然不知道用哪些维度衡量对话的好坏,那直接基于用户的反馈去训练,让模型自己学就好了。

基于反馈的训练,那不就是宇宙的终点强化学习吗。

d2468da75af34b5481ce56fb8f60615e.jpeg

ChatGPT的制作分为如下几步:

  1. 用监督数据基于GPT3.5训练一个对话模型,训练数据是标注人员手把手写出来的

  2. 人工标注模型生成的多个结果,训练一个给对话回复打分的模型

  3. 用打分模型作为反馈,基于PPO算法训练一个对话模型

上面的步骤其实跟DeepMind的工作很像,也很直觉,但DeepMind额外针对黄赌毒对话做了些训练,目前还不知道ChatGPT是怎么实现的,不过以他们LM一把梭的性格,有可能全是数据堆出来的。。。

当然,ChatGPT还是有一些局限的,比如:

  1. 说一些不明所以毫无疑义的话

  2. 重复问相同的问题,或者轻微调整后答案变化很大

  3. 很啰嗦,从case里也看出来了,这主要是训练数据带来的偏差,标注同学会更倾向长句子

  4. 也不是所有模糊情况都会反问

  5. 有些黄赌毒问题还是没法识别,作者们在打算用API解决

目前,为了让大家给出更多的反馈,OpenAI顺势在11.30-12.30之间举行了一个反馈比赛[3],感兴趣的同学可以积极参与。

最后,让我们对应该过阵子就会发布的GPT4拭目以待吧!

参考资料

[1]

OpenAI Blog: https://openai.com/blog/

[2]

Building safer dialogue agents: https://www.deepmind.com/blog/building-safer-dialogue-agents

[3]

Feedback Contest: https://cdn.openai.com/chatgpt/ChatGPT_Feedback_Contest_Rules.pdf

9eb9e01168eb7c2b04cc2c20ea7ff8c6.jpeg


我是朋克又极客的AI算法小姐姐rumor

北航本硕,NLP算法工程师,谷歌开发者专家

欢迎关注我,带你学习带你肝

一起在人工智能时代旋转跳跃眨巴眼

「不会debug代码的模型不是好AI」1375eae85757ad9919be1f2cc7481f4a.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/4490.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【哪些工作会被ChatGPT取代?】我用ChatGPT全自动化生成代码进行了深度分析

【哪些工作会被ChatGPT取代?】我用ChatGPT全自动化生成代码进行了深度分析 前言 配置好ChatGPT的几个小时之后,我发现了一个宝藏网页https://github.com/f/awesome-chatgpt-prompts,也是我这篇文章的灵感所在,github里面给出让chatgpt扮演…

GPT-3/ChatGPT 复现的经验教训

为什么所有公开的对 GPT-3 的复现都失败了?我们应该在哪些任务上使用 GPT-3.5 或 ChatGPT? 对于那些想要复现一个属于自己的 GPT-3 或 ChatGPT 的人而言,第一个问题是关键的。第二个问题则对那些想要使用它们的人是重要的(下文提…

Day921.chatGPT

chatGPT Hi,我是阿昌,今天学习记录的是关于chatGPT的内容。 一、什么是chatGPT ChatGPT(全名:Chat Generative Pre-trained Transformer),ChatGPT 是一种基于 GPT (Generative Pre-trained Transformer)…

面向开发人员的 ChatGPT 提示词教程中文版 - ChatGPT 版

面向开发人员的 ChatGPT 提示词教程中文版 - ChatGPT 版 1. 指南1-1. 提示的指南1-2. 配置1-3. 提示语原则原则 1: 写出清晰而具体的指示技巧 1: 使用分隔符来清楚地表明输入的不同部分技巧 2: 要求提供结构化的输出技巧 3: 要求模型检查条件是否得到满足技巧 4: "少许样本…

ChatGPT支持第三方plugins,并且推出了网络浏览器和代码解释器两个插件

2023年3月23日,OpenAI实现了对ChatGPT插件的初步支持,还推出了两个插件,一个网络浏览器和代码解释器,并且开源了知识库检索插件的代码,任何有信息的开发者都可以自行托管,以增强ChatGPT的功能。 在目前已实…

06-发送短信验证码实现登录功能

1、发送短信验证码实现登录功能的流程 1.1、获取验证码流程 1.2、登录流程 1.3、页面带有图形验证码的流程 2、 注册登录二合一页面的开发 2.1、将src目录下的App.vue页面上通用显示的删掉 2.2、在router目录下的index.js文件中通过懒加载的方式添加login.vue页面 对于rout…

手把手教你使用短信验证码接口

因为闪速码短信平台可以免费赠送200条使用,所以本文档以闪速码为列讲解。 一、账号注册、登录 一、注册、登录闪速码(www.shansuma.com),进行实名认证。实名认证分为个人认证和企业认证,值得注意的是:个人…

最好用的发短信(验证码、语音短信)接口

使用阿里大鱼短信接口 注册 进入大鱼页面,如果没有账号,则自行注册,再此不在过多详述。注册完成或者有账号的则在首页中点击加入“加入阿里大鱼”,如下: 创建引用 点击“管理中心”,然后再点击右上角…

短信接口调用-手机短信,验证码

本文章短信平台接口基于中国网建SMS短信平台API,相关网址为点我打开--->中国网建SMS短信平台。注册后即可立即使用,无信息审核验证延迟。 通过中国网建第三方API发送一条短信,需要知道以下信息:用户注册时的Uid:用户…

Android-短信验证码

效果图 简介 基本上只要需要登录的APP,都会有验证码输入,所以说是比较常用的控件,而且花样也是很多的,这里列出来4种样式,分别是: 表格类型 方块类型 横线类型 圈圈类型 其实还有很多其他的样式&#xff0c…

SmS-Activate一款好用的短信验证码接收工具

前言 有些国外应用在使用应用上的功能时需要注册账号,由于某种不可抗因素,我们的手机号一般不支持注册,接收不到信息验证码,于是我们可以使用sms-activate提供的服务,实惠又稳定,最近sms-activate.org网站…

发送短信验证码+登陆功能

业务: 手机端点击发送验证码,调用第三方平台(我们用的是“任信了”平台)的接口,去给手机发短信验证码。 过程: 代码: /*** 发送短信验证码 * param json 前台传入电话号码* return 返回发…

ChatGPT专业应用:生成新闻稿

正文共 949 字,阅读大约需要 4 分钟 媒体工作者必备技巧,您将在4分钟后获得以下超能力: 生成新闻稿 Beezy评级 :A级 *经过寻找和一段时间的学习,一部分人能掌握。主要提升效率并增强自身技能。 推荐人 | Kim 编辑者…

ChatGPT专业应用:创作对联

正文共 727 字,阅读大约需要 3 分钟 文化工作者必备技巧,您将在3分钟后获得以下超能力: 创作对联 Beezy评级 :B级 *经过简单的寻找, 大部分人能立刻掌握。主要节省时间。 推荐人 | Kim 编辑者 | Yolanda ●此图片由L…

如何高效性的使用ChatGPT

目录 简单介绍 考虑以下几点 举几个例子 简单介绍 ChatGPT是由OpenAI开发的一种自然语言处理模型,它基于GPT(Generative Pre-trained Transformer)架构,旨在为用户提供更加流畅、准确的对话体验。 ChatGPT通过在大规模的互联网…

Claude在线AI注册教程(免费、可平替Chatgpt)

Claude 是Anthropic公司开发的AI聊天机器人,与ChatGPT类似,由OpenAI前副总裁创办。虽然比不上GPT4,但在连续对话能力、写小说、编写代码、解释概念等方面表现出色 Claude 目前还处于免费使用阶段,只需注册一个Slack账号即可以&am…

「ChatGPT最强竞品」爆火:不限量不要钱免注册!一手实测体验在此

点击上方“视学算法”,选择加"星标"或“置顶” 重磅干货,第一时间送达 金磊 丰色 发自 凹非寺量子位 | 公众号 QbitAI 家人们,终于!终于! 免费、支持中文、无需注册、不用骚操作直接可用的类ChatGPT产品&…

AIGC——使用Cursor对比直接使用chatGPT有哪些技巧

Cursor等chatGPT相关工具的那些用法 1. 聊聊it团队经常面临的问题2. 试想一些AI辅助的应用场景3. 看回现实可用的工具及其使用3.1 加载文件作为对话上下文3.2 源码工程辅助阅读3.3 批量文件式输入口3.4 规范核查工具3.5 写PPT3.6 口述业务流程或逻辑生成持续图流程图 4 通用思路…

ChatGPT 创业:如何用人工智能 AI 开一家赚钱的公司

这是一篇演示如何使用 ChatGPT prompt (提示词)的文章。 在了解 ChatGPT 的文案写作能力后,我产生了一个念头,如果让它来写一篇命题作文,会是怎样? Prompt 提示词,和人工智能 AI 对话中一个重要…

如何高效使用 ChatGPT?

最近 ChatGPT 非常火。如果你刷社交媒体,大概已经被各种消息搞得头晕脑胀。从大佬到普通人都对这个话题表现出了浓厚的兴趣,就连 ChatGPT 为主题的学术研讨会通知我都已经收到 3 份了。 参与到这个话题里自然是有好处的,例如可以更容易获取流…