ChatGPT4也来了,大语言模型未来可期?注重当下很关键!

当地时间周二(3月14日),人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4。该公司表示:“GPT-4在许多专业测试中表现出超过绝大多数人类的水平。”在内部评估中,GPT-4产生正确回应的可能性要比GPT-3.5高出40%,而且GPT-4是多模态的,同时支持文本和图像输入功能。

OpenAI称:GPT-4比以前的版本“更大”!这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。

 

OpenAI表示,已经与多家公司合作,要将GPT-4结合到他们的产品中,包括Duolingo、Stripe和Khan Academy。GPT-4模型也将以API的形式,提供给付费版ChatGPT Plus的订阅用户。

不得不承认,最近10年是NLP技术和业务场景发展最快的黄金时期,NLP本身的技术体系被重构,所影响的业务领域也不断扩大。

【1】技术体系的改变

·中间任务的消亡

中间任务是指并不直接面向最终目标,而是为了解决最终目标的一些阶段性任务。因为神经网络的发展,诸如语法分析,词性标注,分词等特有的中间任务已经几乎无人问津。

·All you need is Money

现在完成一个NLP任务,需要的不仅是技术,而且还包括算力,数据等资源。这背后都是巨额的资金投入。

【2】使用场景的扩大

·搜广推等内容链接领域

NLP最成功的的商业化应用场景就是搜索,推荐,广告,技术的发展催生出一系列巨头(谷歌,百度,字节)

·丰富的人机交互

各类聊天机器人,语音助手,等人机交互场景趋于成熟。

·内容领域的变革

ChatGPT将会颠覆整个内容生态,内容型公司(如知乎,微博)的重点将从内容分发转变为内容生产。今后互联网将充斥着大量机器产生的内容,这对监管会带来极大的挑战!

【3】未来的发展

·大模型时代

ChatGPT的出现,标志着大模型已经突破了技术的天花板,让大模型这条技术发展路线更为坚定。

·小模型时代

大模型对于创业公司和中小企业来说无疑需要倾注大量的资源。轻量化预训练模型,给出了一个新的思考方向.

 

RLHF

RLHF(Reinforcement Learning from Human Feedback):即,使用强化学习的方法,利用人类反馈信号直接优化语言模型。它为ChatGPT取得优秀效果的根本原因。

·长足发展

在过去几年里,基于prompt范式的AI生成模型取得了巨大的成功,诞生了不少有意思的AI应用,例如AI写小说,AI写代码,AI画图甚至AI做视频等。

·存在问题

为了能刻画模型输出的整体质量(而不是单个词),人们往往用BLEU或ROUGH等评价指标来刻画模型输出与人类偏好的相近程度,但这也仅仅是在评价的层面,模型在训练的时候是见不到这些人类真实的偏好的。

·解决方案

使用强化学习的方法,利用人类反馈信号直接优化语言模型。

 

Step①

·选一个预训练语言模型作为初始模型。例如,OpenAI选择GPT-3;DeepMind 选择 Gopher 模型。

·人工精心撰写语料,作为对模型的引导:去毒性,真实性,人类偏好。

·模型在人工语料上进行精调。

Step②

·构造一个奖励模型(可与训练或随机初始化),用来学习人类的主观偏好。

·再 挑 选 一 个 数 据 集 :Anthropic :聊 天 工 具 ;OpenAI:调用GPT API的用户。

·人工对初始化(如GPT3)输出的结果进行排序。

·奖励模型学习人工排序的结果,以便学习到人类的偏好

ChatGPT的优缺点

InstructGPT/ChatGPT的效果非常亮眼,引入了人工标注之后,让模型的“价值观”和的正确程度和人类行为模式的“真实性”上都大幅的提升。

模型优点:

·真实性&无害性

InstructGPT/ChatGPT引入了不同的labeler进行提示编写和生成结果排序,并且还是在GPT-3之上进行的微调,这使得我们在训练奖励模型时对更加真实无害的数据会有更高的奖励。

·无害性

GPT-3就具有很强的Coding能力,基于GPT-3制作的API也积累了大量的Coding代码。而且也有部分OpenAI的内部员工参与了数据采集工作。

通过Coding相关的大量数据以及人工标注,训练出来的InstructGPT/ChatGPT具有非常强的Coding能力也就不意外了。

·切题性

无论回答是否正确真实,但是基本都能做到切题,这说明ChatGPT在理解人类语言上已经非常成功

 

存在问题:

·过分解读

因为labeler在进行生成内容的比较时,倾向于给给长的输出内容更高的奖励。

·容易被诱导

对有害的指示可能会输出有害的答复:例如InstructGPT/ChatGPT也会对用户提出的“AI毁灭人类计划书”给出行动方案。

·荒谬性

很有可能受限于纠正数据的有限,或是有监督任务的误导,导致它生成内容的不真实。

Chat对内容生产,内容分发的影响是颠覆性的,这其中包括了AIGC和搜索引擎。

 

ChatGPT的出现,极大促进了AIGC的发展,今后网络上将会大量出现AIGC生产出来的内容。一方面,会创造一条新的赛道和风口。另一方面,如何对生产出来的内容进行审核,识别,版权将会是一个新的问题。

对搜索引擎的影响

·搜索结果的质量提高。传统的搜索引擎通过关键词匹配来显示结果,但这种方式可能会出现一些低质量、无关或甚至有害的结果。与之相比,ChatGPT 可以理解用户的意图,并提供更加精确、个性化的结果,从而提高搜索结果的质量。

·搜索体验的改善。通过 ChatGPT 技术,用户可以使用自然语言进行搜索,而不是受限于简单的关键词匹配。这种方式使得搜索更加直接、快捷,也更加容易使用。

·跨语言搜索的增强。由于 ChatGPT 可以处理多种语言,因此它使得用户能够更容易地进行跨语言搜索。这将使得全球用户能够更快捷地找到他们需要的信息。

·产生新的搜索模式。由于 ChatGPT 技术使用对话式交互,它将产生新的搜索模式,例如语音搜索、图像搜索等等。这些新的搜索模式将使得搜索更加方便,也将使得搜索引擎的应用范围更加广泛。

——以上内容摘录自

《ChatGPT的技术发展路径和带来的影响》2023.3

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10096.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

北京场:聚焦HR的未来发展,一起探索ChatGPT的“能”与“不能”

2023年4月20日,AI得贤TMS与51社保联合举办的“HR高管闭门会”在北京成功落幕。 这次闭门会以聚焦HR的未来发展,探索ChatGPT的“能”与“不能”为主题,20多位企业高管和HR管理者们齐聚一堂共同探讨AI招聘的未来。 在活动开始,资深专…

chatgpt赋能python:Python如何屏蔽掉一段代码

Python如何屏蔽掉一段代码 在Python的编程过程中,有时我们需要屏蔽掉一段代码以便于调试或是测试其他部分的代码。本文将介绍Python中几种屏蔽代码的方法。 方法一:注释掉代码 Python中最简单的屏蔽代码的方法就是注释掉代码。注释是一种用于解释代码…

chatgpt赋能python:Python屏蔽语句的重要性

Python屏蔽语句的重要性 Python是一种高级程序设计语言,被认为是开发Web应用程序、数据科学和人工智能的最佳语言之一。在编写Python程序时,每个人都会遇到需要屏蔽语句的情况。在本文中,我们将详细介绍Python屏蔽语句的重要性和用法。 什么…

chatgpt赋能python:Python屏蔽一段代码

Python屏蔽一段代码 在Python编程中,有时我们需要屏蔽一段代码以便于调试或者测试。在很多情况下,我们可能不想删除这段代码,因为需要在将来的某个时间再次使用它。为了解决这个问题,我们可以使用Python中的注释语句或者条件语句…

chatgpt赋能python:Python爬虫防屏蔽策略及技巧

Python爬虫防屏蔽策略及技巧 介绍 爬虫作为一种数据采集工具,越来越广泛地应用于众多领域,包括搜索引擎优化(SEO)、产品分析、市场调研等等。然而,随着爬虫数量的不断增加,许多网站已经采取了多种方法来屏…

ChatGPT Sorry, you have been blocked(抱歉,您已被屏蔽)的解决方法

最近在使用 ChatGPT 时大家遇到的最多的问题就是 Sorry, you have been blocked(抱歉,您已被屏蔽)了,之前的 Access denied 似乎都不常见了,今天老王就分享下这个问题的原因和解决方法。 一、ChatGPT 被屏蔽 blocked …

美股NBBO高频tick历史数据

NBBO数据介绍 什么是NBBO 全国最佳买入价和卖出价 (NBBO) 是报告证券中最高买入价和最低卖出(卖出)价的报价,来自所有可用的交易所或交易场所。 因此,NBBO 代表了证券中最紧密的综合买卖价差。 美国证券交易委员会 (SEC) 的 NM…

一篇文章告诉你作为普通人Python该不该学,适不适合学

Python在这两年,发展可谓是风生水起,前景十分优越。Python作为一门程序语言,为什么能够这么火,是有原因的,最根本的两点就是: 1.Python相对于其他编程语言来说,入门门槛低,上手不难…

1分钟做出苹果Vision Pro「官网」?上班8小时搞出480个网页,同事被卷疯了

【导读】给苹果Vision Pro官网做个设计?一分钟生成,零门槛可用。 最近,全世界都被苹果的MR头显给炸场了。把这么多复杂硬件整合成如同一个piece的产品,Vision Pro简直堪称苹果的创二世纪。 如此炸裂的效果,但是却…

这套开源系统太牛了!仅需一分钟,安装部署一套自己的 SAAS 云建站平台!

大家好,我是宝哥! 项目介绍 最近在逛网站的时候发现一个不错的开源项目,这个项目目前收获了 4.3K Star,猿哥觉得不错,值得拿出来和大家分享下。 本项目系统是🔥一个可通过后台任意开通多个网站,…

错误代码“err_connection_timed_out”的解决方案

问题描述 曾经试过用浏览器访问一个或几个特定网站,出现“ err_connection_timed_out ”错误,而其他网站加载良好没有任何问题或错误。上网查过发现这是一个常见的互联网错误。发生此DNS错误是因为访问或浏览该网站时,Internet IP地址被防火墙…

打开edge,出现错误代码: STATUS_ACCESS_DENIED,解决方法

问题描述:这个问题,一般显示edge页面加载失败,且电脑右下角出现弹窗。 解决办法: 此时,你可以到C盘,把Microsoft下的子文件删掉,注意最好用delete删,别右键删,如图&#…

Edge 错误代码: STATUS_ACCESS_DENIED 解决方案

1、到C盘Edge的文件全部删掉 2、到电脑管家的软件管理重新下载Edge 或者 去官网下载 3、再次打开Edge,功能都回来了 注:该解决方案源自于edge吧的四川男篮大佬

steam服务器102修复,分享steam错误代码102的解决方法

今天来聊聊一篇关于分享steam错误代码102的解决方法的文章,现在就为大家来简单介绍下分享steam错误代码102的解决方法,希望对各位小伙伴们有所帮助。 1、打开CMD命令行,具体操作为CtrlR,然后输入CMD,即可进入命令行 2、在命令行里面输入“net…

访问页面出错 错误代码102

故障现象如下图: 第一种办法:(记得一定要重启计算机) 1、打开电脑360安全卫士,进入主界面,点击右下角【更多】选项。 错误代码102 2、进入【我的工具】界面,点击上方的【全部工具】。 错误代码1…

由于在客户端检测到一个协议错误(代码0x1104)

场景 使用FinalShell进行远程连接时候,出现的警告: 由于在客户端检测到一个协议错误(代码 0x1104),这个会话将被中断。 请重新连接到远程计算机 环境 win7 系统64位操作系统4GB内存 方案 确认 用户名密码端口号是否正确(Windows…

网络连接错误错误代码103怎么解决

网络连接错误错误代码103的解决办法 1、查看网络是否通畅 点击开始-运行-输入cmd。 然后输入ping空格加网址,按enter,查看该网站网络是否通畅。 是否网络的问题。 如果不是可能就是浏览器等其他问题。 2、dns优选 打开杀毒软件-人工服务-输入dns-点击…

AI工具第三期:本周超16款国内精选AI工具分享!

1. 未来百科 未来百科,是一个知名的AI产品导航网站——为发现全球优质AI工具而生。目前已聚集全球2500优质AI工具产品,旨在帮助用户发现全球最好的AI工具,同时为研发AI垂直应用的创业公司提供展示窗口,迎接未来的AI时代。未来百科…

【2023 AI 写作工具大盘点】国内外 45 款免费 AI 写作神器汇总,轻松成为创作高手!

0. 未来百科 未来百科(https://nav.6aiq.com),是一个知名的AI产品导航网站 —— 为发现全球优质AI工具而生 。目前已 聚集全球3000优质AI工具产品 ,旨在帮助用户发现全球最好的AI工具,同时为研发AI垂直应用的创业公司提供展示窗口&#xff0c…

Prompt learning 教学[基础篇]:prompt基本原则以及使用场景技巧助力你更好使用chatgpt,得到你想要的答案

Prompt learning 教学[基础篇]:prompt基本原则以及使用场景技巧助力你更好使用chatgpt,得到你想要的答案 如果你想系统学习 如果你对 AI 和 Prompt Engineering 不是很了解,甚至连 ChatGPT 也不是很了解,那我建议你从基础篇开始读…