AI:从技术视角理解chatGPT

OpenAI发布了ChatGPT,这是一个基于其GPT-3.5语言模型(LM)的对话式人工智能模型。ChatGPT使用来自人类反馈的强化学习(RLHF)进行微调,并包括一个审核过滤器来阻止不适当的互动。

该版本是在OpenAI博客上宣布的。ChatGPT的训练方法与用于训练OpenAI的指令跟随语言模型InstructGPT的方法相同,即RLHF。RHLF使用两个数据集:一个是人类写的例子,用于GPT-3.5 LM的监督微调;另一个是人类标记的LM输出比较,用于训练强化学习的奖励模型。OpenAI发布了ChatGPT,以获得用户的反馈并探索其局限性。

今天ChatGPT的研究发布是OpenAI迭代部署越来越安全和有用的AI系统的最新步骤。从GPT-3和Codex等早期模型的部署中获得的许多经验教训为这个版本的安全缓解措施提供了参考,包括通过使用来自人类反馈的强化学习,大幅减少有害和不真实的输出…我们知道仍有许多限制…我们计划定期进行模型更新,在这些方面作出改进。但我们也希望,通过为ChatGPT提供一个可访问的界面,我们将获得关于我们尚未意识到的问题的宝贵用户反馈。

GPT-3.5是OpenAI的GPT系列大型语言模型的最新产品。今年早些时候,OpenAI发表了一篇关于InstructGPT的技术论文,它试图通过将LM的输出与用户的意图 "对齐 "来减少其毒性和幻觉。首先,LM的基线 "政策 "在一组提示LM的数据集上进行了微调,同时还有人写的期望反应。接下来,从LM生成的对提示的反应数据集中训练奖励模型,这些反应由人类标签人员进行排序。最后,通过使用奖励模型的近端政策优化(PPO)进一步微调基线政策。
在这里插入图片描述
图1.ChatGPT训练过程

使用这种技术,OpenAI将GPT-3的幻觉率从41%提高到21%。InstructGPT也产生了 “在提示尊重的情况下,比GPT-3少了大约25%的有毒输出”。ChatGPT使用同样的一般方法进行训练,但在第一步,人类通过编造自己和一个假想的聊天机器人之间的对话来生成一个数据集。OpenAI的研究人员发现,这在他们的训练数据中产生了偏差(“看起来更全面的较长答案”),这导致该模型有时会产生冗长的回应。

科技界一直在积极尝试使用该模型。在Hacker News关于ChatGPT的讨论中,一些用户指出,该模型的回答比GPT-3的回答 "沉闷 "和 “更有过滤性”。一位用户回答说。

我理解为什么人们对这上面的 "安全保险杠 "感到有些沮丧。但我想说的是,我实际上对这些安全控制的质量印象非常深刻。这是一个人工智能,似乎知道它可以和不可以给一个体面的反应。我不知道这是否是硬编码或训练出来的,但当你把它与GPT3中通常出现的幻觉相比较时,这真的令人印象深刻。

在Twitter上,语言学家和NLP教育家Rachael Tatman想知道OpenAI是否发表了关于ChatGPT的技术论文。AI企业家Will Spagnoli回答说。

他们在发布第一个[InstructGPT]模型时发表了一篇论文,解释了他们是如何做到的,而新的ChatGPT和text-davinci-003只是同一事物的最新版本,只是现在他们有了更多来自人类反馈的标签数据,导致了性能的提升。

OpenAI没有发布ChatGPT的代码或模型,但在网上有免费的演示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7612.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【已解决】ChatGPT报错Access denied 1020

报错原因Access denied 当我们刚开始想玩一玩chatgpt的时候会出现下面报错,接下来博主就帮大家分析一下原因,以及解决办法。 翻译成英文之后是这样的: 可以看出来是,ChatGPT阻止了我们的ip地址访问,因为ChatGPT不是…

Unity3D C# 基于观察者模式的全局消息机制(事件系统)

本文将从思路和实现讲解基于观察者模式的全局消息机制的实现过程 如果喜欢请给我的博客或者我的项目点个免费的star吧 项目内包含本文全部完整源码(可运行) 一、消息机制 虽然前两篇文章以及写过消息机制是为何物了,但是这里我还是想重申一下,但是稍微…

Unity之ChatGPT提问

Unity中normalized的含义及用途 今天偶然发现一个不用账号也可以使用ChatGPT的网站,就问了几个关于normalized的问题,也顺便让自己深刻理解向量归一化用途,感觉真的是太强大了,以下是我提的问题。 问题1.Unity normalized 的意思…

ChatGPT 提问,软件杂项部分

堆内存与栈内存一般分别 有多少 ChatGPT 堆内存和栈内存的大小取决于操作系统和编译器的限制以及程序的运行环境。以下是一些常见的默认大小范围,但请注意这些值可以因环境而异: 栈内存大小: Windows平台:默认情况下&#xff…

目标是复制 ChatGPT?又一开源替代品来了

翻译 | 王子彧 出品 | CSDN(ID:CSDNnews) 随着 ChatGPT 火爆出圈后,国内外企业也相继推出类 ChatGPT 产品,如百度文心一言、阿里通义千问,微软新 Bing、Google Bard,Adobe Firefly 等等。 最近…

加速与 ChatGPT 交互,用 ChatClipboard 轻松复制粘贴 AI 响应!

ChatClipboard 中文简介 ChatClipboard 是一个方便的桌面应用程序,旨在通过简单的几个步骤,让用户能够快速获取 ChatGPT 的响应结果。 当你需要寻求 ChatGPT 的帮助时,只需将文本复制到剪贴板中,然后单击 ChatClipboard 中的按…

GPT-4 Technical Report译文

我们创建了 GPT-4,这是 OpenAI 努力扩展深度学习的最新里程碑。GPT-4 是一个大型多模态模型(接受图像和文本输入,发出文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人…

无需注册,不限次数!北大团队搞出ChatExcel

来源:量子位 做Excel表,真就动动嘴就够了! 看,输入想要干的事:给学生成绩排个名吧。 简单敲个回车,表格唰一下就列好了! 检查一遍也没错。 还能跨表格处理。 比如标记出两张不同表格中排名都在前…

让ChatGPT告诉你Java的发展前景

Java版电商购物系统项目实战 最近很多人问我Java的发展前景怎么样?该怎么学Java基础?java这么卷还该不该学等等。那今天老王以电商场景为例,再结合ChatGPT的回答和大家聊的一下Java有哪些应用前景和技术层面的落地方案。(在收获干…

easyExcel导入表格

easyExcel导入表格 本文章是介绍java&#xff0c;通过easyExcel导入较为复杂的表格 导入表格如下 前提工作导包 <!-- hutool--><dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>5.6.0<…

【根据模板导出多sheet表格数据】

文章目录 1. 根据模板导出多sheet表格数据1. 先上代码2. 模板展示3. 数据构造1.实体类创建2. sql数据构造(主要是需要把结果集别名映射到对应的实体类上) 2. 无模板多sheet导出1. code部分 3. 效果演示image-20220930172145001结言 本文章主要是记录自己的一些心得和之前写过的…

如何将excel表格数据导入postgresql数据库

作者&#xff1a;瀚高PG实验室 &#xff08;Highgo PG Lab&#xff09;- 禹晓 实际的工作中&#xff0c;我们经常会碰到统计数据的工作&#xff0c;有些维度的统计数据因为工作需要我们需要导出为excel作为报表附件供不同的部门审查。为了方便以后的对比工作&#xff0c;领导会…

table表格直接导出Excel文件

注&#xff1a;如遇到复杂表格时可用此方法做前端导出 导出事件 handleDown() {var html "<html><head><meta charsetutf-8 /></head><body>" document.getElementsByTagName("table")[0].outerHTML "</body&g…

将ChatGPT整合到Word中

引言 自ChatGPT出现&#xff0c;各种基于它的软件扩展纷至沓来&#xff0c;目前Word支持ChatGPT的add-in有两款&#xff0c;可以通过: 插入->获取加载项->搜索openai查看。 其中Ghostwriter从介绍上看功能比较单一&#xff0c;而且软件需要购买&#xff0c;用自己的API-k…

用上ChatGPT的这几个功能,你的开发效率不高都难

ChatGPT去年12月份开始火得不行了&#xff0c;它彻底改变了程序员开发代码的方式。怎么来提高程序员开发程序的效率呢&#xff1f;可能现在大多数软件开发人员仍然没有习惯使用 ChatGPT&#xff0c;本文将介绍几种方式来提升和简化自己的工作。 一、重构你的代码 如果你是一个开…

Intellij:自然语言到代码自动生成 by ChatGPT

背景 Intellij是一个非常流行的开发工具&#xff0c;它被广泛用于软件开发。随着OpenAI训练的ChatGPT模型越来越智能&#xff0c;我们开发了一个名为EDQL的Intellij插件。这个插件可以将ChatGPT的智能写代码能力转化为代码。 安装和尝试: https://github.com/chengpohi/edql/re…

chatgpt到底颠覆了什么 第二部分

以第二个理由就是两个字&#xff0c;垄断。 现在谈到范式转变&#xff0c;如果首先谈的还是算法&#xff0c;那说明还没有透彻理解范式改变范式改变&#xff0c;首先要改的是什么。是什么&#xff1f;是参赛资格。 过去我相信大企业大团队聚拢了许多聪明的脑袋&#xff0c;但我…

chatgpt 到底颠覆了什么 第一部分

ChatGPT一出来&#xff0c;一堆搞NLP的立马哭了。为什么&#xff1f;不该问为什么哭&#xff0c;而该问为什么还不哭。 有两个立马大哭的理由。 第一个理由很多人说了&#xff0c;范式改变。 虽然说没有哪个研究领域&#xff0c;甚至没有哪个领域敢说自己真的是天道酬勤绝对公平…

文心一言---中国版的“ChatGPT”狂飙的机会或许要出现了

⭐️我叫忆_恒心&#xff0c;一名喜欢书写博客的在读研究生&#x1f468;‍&#x1f393;。 如果觉得本文能帮到您&#xff0c;麻烦点个赞&#x1f44d;呗&#xff01; 近期会不断在专栏里进行更新讲解博客~~~ 有什么问题的小伙伴 欢迎留言提问欧&#xff0c;喜欢的小伙伴给个三…

果然,ChatGPT 技术还是被拿去搞黄色了!

转自&#xff1a;顶级程序员 此前&#xff0c;推出的各类AI绘画工具。 想要制作出还能看得过去的作品&#xff0c;需要一定的美术功底和美感&#xff0c;上手门槛一点也不低。 大部分绅士顶多做个饱饱眼福的观众&#xff0c;完全没有参与感。 啪得一下很快啊&#xff0c;最近一…