竞品还在追赶 OpenAI用GPT-4飚赢自己

赶在百度“文心一言”发布前一天,OpenAI祭出了GPT-4,这对于百度、谷歌们来说,可能是一个重大打击。

人们已经领略过GPT-3.5加持下的ChatGPT,但GPT-4比“前辈”更强大,它具有更高的可靠性和准确性,能够读懂图片,甚至还能角色扮演。目前,GPT-4已被应用到ChatGPT和Bing上,再一次刷新外界对AI的能力认知。

GPT-4越耀眼,谷歌、百度等竞争对手们便越焦虑。毕竟,其他公司忙着对标GPT-3.5时,OpenAI快速将大模型升级为GPT-4,一骑绝尘的样子丝毫“不讲武德”,像一个孤独求败的杀手,眼望着挑战者的到来。

GPT-4打败GPT-3.5

知名KOL和菜头说,因为OpenAI在3月15日凌晨发布了GPT-4,他和他的一些老朋友都没睡好,微信里的消息提示此起彼伏,“感觉像是回到了乔布斯还在世的时候,大家相约线上看苹果发布会的那些夜晚。”

北京时间3月15日凌晨,GPT-4发布受万众瞩目,这是采用GPT-3.5的ChatGPT火爆后的必然结果。看客们想要知道,它比GPT-3.5到底强多少?人们甚至没有兴趣拿它来对比别的同类产品,因为能站在同一起跑线上与之对比的还没有出现。

OpenAI很了解围观者的胃口,在那场更像是产品演示的发布会里,开发者一上来就让GPT-3.5和GPT-4分别尝试回答同样的问题。结果,熬夜的人没白等。

一开始,OpenAI的开发者复制了一篇博客文章,并交给了GPT-3.5,让它进行总结,要求是每个单词都要以“G”开头。结果GPT-3.5直接选择了放弃。轮到GPT-4,它快速地给出了答案,完全符合要求。随后,开发者又让它尝试以字母“A”开头回答同样的问题,GPT-4又做到了。

这还没完,如同提升“节目效果”一样,开发者直接和Discord社群互动起来,选取了网友提出的字母“Q”。再来一遍,GPT-4依然轻松拿捏。

这轮演示,OpenAI特地选取了一个超过GPT-3.5“阈值”的问题来测试,意在表现GPT-4的能力进化水平。正如官方所解释的,在随意的谈话中,GPT-3.5 和 GPT-4 之间的区别可能很微妙,当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。

为了全面且可视化地评估GPT-4的能力提升程度,OpenAI展示了它与GPT-3.5共同参与了多项模拟考试的情况,包括统一律师资格考试、研究生入学考试、医学知识自测、艺术史、微积分等等,结果GPT-4几乎碾压了GPT-3.5。比如,在模拟律师考试中,GPT-4的分数在应试者的前10%左右,而GPT-3.5 的得分排在倒数10%左右。

各项考试中GPT-4领先GPT-3.5

如同苹果发布会每次都会带来一个大彩蛋,GPT-4也带来了一项跨越式的功能——接受视觉输入。这意味着,GPT-4能够看懂图片了。

官方解释:GPT-4在给定由散布的文本和图像组成的输入的情况下,可生成文本输出(自然语言、代码等)。换言之,给它一张带有文字的图片,并提出要求,它就能给出想要的结果。

在演示中,开发者画了一张网站的草图,要求GPT-4用简短的 HTML/JS 将这个草图变成彩色的网站。仅仅几秒钟后,GPT-4就带来了一个完整的网页。

不仅如此,GPT-4还能尝试理解一些流行的“梗图”。如下图所示,让它解释这张图的笑点在哪,GPT-4不但Get到了,还一本正经地解释了一通。

GPT-4解释“梗图”的笑点

GPT-4的识图功能只有体验过才能知道是否如OpenAI说得这么厉害。遗憾的是,目前视觉输入还没有完全开放,仅在一小部分开发者中进行测试。OpenAI创始人Sam Altman解释称,此举是为了防止可能出现的安全性和伦理问题。

GPT-4还有一项特别本领,它可以扮演不同的角色和说话的方式,这与具有固定语气和风格的GPT-3.5不同。基于这个功能,用户可以让GPT-4实现角色扮演并定制它的性格。

就像当年的一代代新款iPhone给人们带来惊奇感受,GPT-4展现了比它的上一代更强大的能力。不过,它也并不完美。与GPT-3.5一样,GPT-4有时仍会虚构事实,“一本正经地胡说八道”还不能完全避免。OpenAI宣称,在内部对抗性真实性评估中,GPT-4的得分比GPT-3.5高40%,显然,它还有很大的提升空间。

谷歌、百度更焦虑了

OpenAI正和当初的苹果走在一样的道路上:成为引领者,并在别人苦苦追赶时,又猛地拉开一大截。

就在GPT-4发布前,互联网巨头谷歌也在YouTube上发布了一支预告片,宣布将AI整合到Gmail电子邮件和GoogleDocs文档等办公应用中。谷歌在视频中费了很大力气展示相关功能,告诉人们可以在文件中进行头脑风暴、校对、写作和改写;利用幻灯片中自动生成的图片、音频和视频,将创意构想变为现实等。

然而,“一点水花都没有,几个小时之后GPT-4开发布会,人一下子就全跑光了。”和菜头如此描述他的观察。从社交网络上舆论风向看,谷歌的AI新动作被铺天盖地的GPT-4消息所淹没——无论是海外的推特还是国内的微博,GPT-4都登上了热搜榜。

和谷歌一样被冷落的AI玩家还有Meta。不久前,Meta公布了旗下全新的AI大型语言模型LLaMA,宣称可帮助研究人员降低生成式AI工具可能带来的“偏见、有毒评论、产生错误信息的可能性”等问题。Meta还放话,这一大模型仅用约1/10的参数规模,就能匹敌OpenAI GPT-3、谷歌PaLM等主流大模型的性能表现。这一新动态在GPT-4到来后,没有在舆论场上再露脸。

OpenAI的光芒越盛,其他科技巨头们就越焦虑。

2月,仓促应战ChatGPT的谷歌还闹出过笑话,其开发的聊天机器人Bard首秀“翻车”,答错问题导致其市值一天之内蒸发约1000亿美元。

在国内,百度也在加急研发与ChatGPT类似的聊天机器人“文心一言”。按照预告,百度将在今天下午举办有关文心一言的新闻发布会。在许多人也许还在好奇文心一言能否比肩GPT-3.5模型下的ChatGPT,结果,OpenAI赶在百度发布会前带来了更强大的GPT-4。

别人忙着对标GPT-3.5时,OpenAI如同冷血杀手一般,亲手击败了自己出品的GPT-3.5。同类竞争公司们有多焦虑,网友们已经自行脑补出了各种“梗图”。

“那种提刀在手,环顾天下,寂寞如雪的感觉,让我忍不住感慨:即便在美国本土,这件事也和绝大多数美国科技公司无关了。”和菜头形容,OpenAI迭代的速度让他感觉到心惊肉跳,“所有试图追赶的人和公司,目前落后进度最少两年。在这种AI爆发式增长的时代,两年就是三辈子。”

回顾GPT的发展,它用5年时间里完成了从量变到质变的飞跃。2018年,GPT-1首次发布,当时的模型参数只有1.17亿个,随后的GPT-2将标准提高到15亿个参数,GPT-3和GPT-3.5的神经网络直接提升到1750亿个参数,而到了GPT-4,采用的参数超过2000亿个,并利用了超过200万个数据源(GPT-3.5使用了45万个数据源),包括互联网上的各种文本、图像、音频和视频数据。

相比之下,2022年初谷歌曾披露其LaMDA 模型参数为1370亿个,不如当时的GPT-3多。而据百度透露,文心一言大模型参数规模达到2600亿,相比GPT-4更多,这或许还能让它留给人们一些期待。

不过,有专家指出,模型参数并不是决定AI聊天机器人能力的绝对因素,在此基础上,对数据的清洗和标注、模型结构设计、训练推理的技术积累都会决定最终产品的表现。

GPT-4甚至不用担心产品化了,它已经应用于ChatGPT和微软的搜索引擎必应(Bing)上。一骑绝尘后,尘土里若隐若现着谷歌和百度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9428.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

上网必备!这些网站绝对是互联网宝藏!带你进入全新的在线世界

互联网上有无数的网站,有些是我们经常使用的,有些是我们不知道的。今天,我要给大家推荐一些非常有用的中国国内网站,它们可以帮助你提高工作效率、学习知识、拓展视野、娱乐生活等等。这些网站都是我从搜索结果中精选出来的&#…

像医生一样的大规模AI模型

目录 华佗:BenTsao相关工作华佗模型实验 HuatuoGPT动机解决方案混合数据的SFT基于AI反馈的RL 医学中的LLM指令微调 华佗:BenTsao 大型语言模型(LLM),如LLaMA模型,已经证明了它们在各种通用领域自然语言处理…

每日一问-ChapGPT-20230414-中医基础-四诊之问诊

文章目录 每日一问-ChapGPT系列起因每日一问-ChapGPT-20230414-中医基础-四诊之问诊中医中的望闻问切介绍,以及对应的名家问诊的具体细节问诊拓展1. 一问寒热二问汗2. 三问头身四问便3. 五问饮食六问胸4. 七聋八渴俱当辨5. 九问旧病十问因6. 再问服药参机辨 当日总结…

麻瓜+AI混合工作流试验 4:咨询顾问向客户讲解,如何全面提升组织的产品能力...

大家都很怕自己的工作被AI替代,如果从好的方面想一想,总能找到一些自我安慰,比如: 咨询顾问——给客户心理按摩、带来情绪价值、充当老板的“嘴替”,耍嘴皮子方面暂时没法被AI替代。 此图为AI对“a slide in microsoft…

亚马逊 MWS上传数据 API部分的相关内容 amazon api 文档

您应了解亚马逊 MWS上传数据 API部分的相关内容 您可以通过亚马逊商城网络服务(亚马逊 MWS) API 的亚马逊 MWS上传数据 API部分,将库存和订单数据上传至亚马逊。您还可以通过亚马逊 MWS上传数据 API 部分,获取上传数据的相关处理信…

ChatGPT 专业应用:撰写警告跟卖者邮件

正文共 1044 字,阅读大约需要 4 分钟 电商运营必备技巧,您将在4分钟后获得以下超能力: 生成跟卖者警告信 Beezy评级 :B级 *经过简单的寻找, 大部分人能立刻掌握。主要节省时间。 推荐人 | nanako 编辑者 | Linda ●此…

亚马逊上如何和卖家沟通

首先找一个商品,打开商品页,看有右边的sold by 点商家名就行,如果是Amazon.com 说明是亚马逊自营,是没有客服的 点进去以后,点ask a question,就可以和商家聊天了

不用写代码就能开发应用,微软将 ChatGPT 整合到更多工具中

近日,微软表示,将把 ChatGPT 背后的技术整合到其 Power Platform 平台上,允许用户在几乎不需要编码的情况下,就能开发自己的应用程序。 ☞技术无关性别,IT 界的“她”力量也能撬动半边天! ☞如何用 23 种编…

重磅发布!微软推出首款 ChatGPT 版搜索引擎,用上了比 ChatGPT 更强大的技术

公众号关注 「奇妙的 Linux 世界」 设为「星标」,每天带你玩转 Linux ! 一夜之间,全球最大的科技公司仿佛都回到了自己年轻时的样子。 在谷歌宣布「实验性对话式人工智能服务」Bard 之后仅 24 小时,北京时间 2 月 8 日凌晨两点&am…

ChatGPT 进军 B 端?消息称微软将允许企业创建定制版 ChatGPT

来源:AI前线 作者:凌敏 据 CNBC 2 月 7 日报道,微软计划发布一款软件以帮助其他公司创建自己的类似于 ChatGPT 的聊天机器人。 知情人士透露,微软计划在今年晚些时候发布软件,帮助公司、学校和政府等客户创建类似于 Ch…

欢迎使用查重软件

TOC推荐 推荐大家一个靠谱的论文检测平台。重复的部分有详细出处以及具体修改意见,能直接在文章上做修改,全部改完一键下载就搞定了。怕麻烦的话,还能用它自带的降重功能。哦对了,他们现在正在做毕业季活动, 赠送很多免…

文本在线查重(Online Copy Detection)的实现

文本在线查重(Online Copy Detection)的实现 1 概述 1.1 需求 给定一段文本,需要返回其和网络开放性数据相比的整体重复率以及具体的重复情况(具体重复的句子/字符串以及重复程度)。 1.2 问题分析 该问题属于copy…

查重系统,在线提交作业

查重系统,在线提交作业 后台代码和数据库源地址: https://gitee.com/aynuzbj/check-system.git 该系统使用SSM三层架构实现查重 文件上传,对各个数据库表的基本操作等 1、登录自己的GitHub账户,并创建一个与我的查重系统项目的项…

[ChatGPT 勘误] SAP UI5 的 sap.ui.base.Object

ChatGPT 对 SAP UI5 sap.ui.base.Object 作用的解答: 在SAP UI5中,sap.ui.base.Object是所有UI5对象的基础类。该类提供了一个通用的、灵活的基础框架,可用于构建SAP UI5应用程序。该类提供了许多方法和属性,包括但不限于以下内容…

从零实现Transformer的简易版与强大版:从300多行到3000多行

前言 最近一直在做类ChatGPT项目的部署 微调,关注比较多的是两个:一个LLaMA,一个ChatGLM,会发现有不少模型是基于这两个模型去做微调的,说到微调,那具体怎么微调呢,因此又详细了解了一下微调代…

机器人国内免费

该网站无需注册即可免费使用,大家打开网站即可使用,而且相应速度是目前我使用的这几款免费网站中最快的一个了,大家可以测试一下,回答的风格和chatGPT几乎无异。 网站链接:https://chat.forchange.cn/

Chat 插件上线,免注册即可使用~

OpenAI 新上线的 Chat 可谓是火爆出圈,这个语言对话模型可以回答问题,承认错误,挑战不正确的前提,还能帮你修改代码中的 bug…… Chat 的应用场景很广泛。它可以用于处理多种类型的对话,包括对话机器人、问答机器人和客…

高效创作助手:ChatGPT最新版实现批量撰写聚合文章的全新水平

随着人工智能技术的不断发展,ChatGPT最新版作为一款智能创作助手,实现了批量撰写聚合文章的全新水平。它能够在短时间内生成高质量的文章,极大地提高了创作效率。本文将从随机8-20个方面对ChatGPT最新版进行详细的阐述,让我们一起…

IntelliJ IDEA 的chatGPT插件 Bito

1、chatGPT爆火 最近你是否听说过“ChatGPT”这个词?它指的是一种基于深度学习技术的人工智能语言生成模型。自从2018年由OpenAI发布以来,ChatGPT就备受关注,甚至在2022年成为了全球最强AI模型之一。 2、chatGPT介绍 ChatGPT(Gen…

从选题、创作、编辑、推广到优化,23个必用的内容营销工具

咱们做内容营销的,要懂营销懂产品,看得懂技术语言,写得了行业洞察,做出来的内容要有创意还要接地气,专业内容也不能落下,除了会写,还要会运营会设计会剪视频,简直就是全才嘛。 但是…