ChatGPT搅动AI又一波风潮,却扒出了百度的长板

文|智能相对论

作者| 叶一城

野火燎原,openAI搞出的chatGPT大有当年alphaGo的架势,搅动整个AI业界春心荡漾。

从openAI的大金主微软,到昔日明星alphaGo的爸爸Google,都火急火燎地要出来表态——前者要彰显主权并在内部全面应用,后者作为全球AI领头羊怎么能失了对称的地位,要发布对应的产品。

国内科技圈自然也发扬了闻风而动的优良品格,在元宇宙概念疲软后,有关的没关的都纷纷贴上来。股市上各种妖魔鬼怪横行,对于上涨,某些董秘的回复中,否定或许还带着捡漏的窃喜。

而“AI大户”百度在宣布发布类似的产品“文心一言”后,股价也立刻上涨。

股民们冤不冤?这次可能不太冤,因为就“中国版ChatGPT”而言,不管腾讯、阿里怎么站位的,某种程度上百度确实最有技术资格,也最能从ChatGPT的落地应用中获得现实的商业价值。

判断谁能在技术的风口上占便宜,第一步永远是先看技术的本质。

ChatGPT从产品形态上,是“一个使用自然语言处理技术实现和人类互动对话的产品”,而其内在本质,就是一个预训练大模型。所谓“大”,就是在巨量到一般人无法想象的数据训练下拥有庞大的参数规模,因为“大”而见识多,博学多才,任何领域都懂,只要稍微调教一下就能出产特定场景的应用。

ChatGPT并不是一次性发展而来的,其属于openAI的一系列预训练模型,所谓GPT,即Generative Pre-Trained Transformer,就是通过Transformer为基础模型,使用预训练技术得到通用的文本模型。从已经公布的论文看,从2018年起,GPT家族已经先后拥有GPT-1,GPT-2,GPT-3,以及图像预训练iGPT等模型,而目前火得一塌糊涂的ChatGPT,更像是一个GPT-4之前的过渡版本GPT-3.5,因为强大的对话能力突然爆火起来。

不同的是,ChatGPT采用了新的指示学习(Instruction Learning)和人工反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)来指导模型的训练,前者为ChatGPT带来理解能力,后者通过人工标注反馈的方式来增强模型的效果,实现GPT的进化。

在一系列进化下,ChatGPT的参数总量与GPT-3一致,达到了1750亿,实现了从GPT-2的15亿的跳跃。

说到底,ChatGPT就是一个积累已久、有着特殊训练方式的大模型,它的发展是有技术进化路线的。

而“巧合”的是,百度大力投入的产业级知识增强文心大模型ERNIE,具备跨模态、跨语言的深度语义理解与生成能力,其技术演进几乎走出了同样的进程。

早在2019年3月,百度就做出了文心 ERNIE 1.0,这一技术创新与“同类”GPT-1、BERT的差距都只有几个月,而且百度积累的大规模知识和海量多元数据,让文心得以快速发展——搜索业务给大模型所需要的庞大数据训练量带来了天然的便利。

例如,在文心的发展过程中,2021年,ERNIE 3.0大模型即拥有千亿参数;与超强算力方联合的鹏城-百度·文心作为一款融合了自然语言理解和自然语言生成的大模型,其参数量达到了2600亿,相对GPT-3和ChatGPT提升了50%。

去年9月,百度CEO李彦宏判断人工智能发展在“技术层面和商业应用层面,都有方向性改变”。据推测,百度那时候就开始做文心一言。

除了参数规模扩大、能力增强,文心与ChatGPT一样,也在适应不同需要进行技术进化。目前文心大模型总量已经有36个,以其中的知识增强轻量级大模型ERNIE 3.0 Tiny为例,该模型能够通过多任务知识蒸馏手段将千亿多任务大模型的所学迁移至轻量级模型中,训练了10亿级、亿级、千万级不同体量大小的轻量级大模型,实现了优秀的泛化能力。

回过头来看,百度在技术上一直在做与GPT相同的事,但是晦涩的技术决定了它始终缺乏足够的曝光度,直到大洋彼岸的ChatGPT突然搞出了“大新闻”,举起了旗帜,于是,这就成了百度彰显自身技术能力的契机。

从GPT-3到ChatGPT,与从“文心”到“文心一言”(英文名ERNIE Bot)的命名方式,也“惊人巧合”——原本就是一样的技术迭代过程罢了,百度之所以3月就能马上做出来,甚至按目前的节奏内测还可能提前,原因就在于ChatGPT要的那些技术百度都有,产品上再加入对话算法等,很快就能对齐。

至少在NLP领域,目前国内还没用企业能够看齐百度。

而在现实价值方面,实际上ChatGPT做的各种对话、各种辅助功能,都与百度的业务线较为契合,无论是内部的搜索+信息流,还是对外提供的诸如智慧城市等B端解决方案中,都能得到很好的利用。

尤其是,AI与搜索的契合一直是百度近些年的努力方向,以传统精确搜索为主、“文心一言”的工具型搜索为辅的方式,也更符合未来搜索的形态。

当然,其他辅助的,比如芯片(算力相关)、开发框架(飞桨),百度也都有成熟的“基建配套”了,

不过,百度面临的问题还是那个老生常谈的话题:能不能持续投入下去,等待真正的商业价值回报?毕竟,ChatGPT吹得再响,现实的问题肯定少不了,得有一个成熟的过程。

说白了,在没有进入强人工智能时代,ChatGPT再厉害其本质也只是“小孩学舌”,学得更多当然就更像,但也只是“知其然不知其所以然”。

这不是说小孩学舌就没有用,能够学起来很像、能解决一些问题,价值也很大。只不过,带过孩子的都知道,小孩学舌在面临认知问题时,会出现很多逻辑尴尬。

目前ChatGPT在一些对话上就出现了这个问题,例如解一道简单的数学题,能给你扯一大堆,但结果就是不对。又例如很多专业领域的会话,和官样文章一样看似内容很多、逻辑严密,但就是言之无物。

一些程序界大佬惊呼ChatGPT的健壮性远超人类,要开除外包程序员,实际危言耸听。所谓健壮性无非就是设定规则的执行,就像数数,人从0数到300,肯定容易出错,机器数,当然就不会出错,没啥好惊奇的。

无论如何,ChatGPT还有一些路要走,最有资格也最能得益的百度,在风潮面前仍然要咬牙继续坚持才好,这其中的投入或许会更大。

*本文图片均来源于网络

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/52386.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

音视频技术开发周刊 | 297

每周一期,纵览音视频技术领域的干货。 新闻投稿:contributelivevideostack.com。 Geenee AR为品牌商和零售商提供虚拟试穿应用 这意味着Geenee AR的虚拟试穿解决方案能够与品牌商现有的销售渠道无缝集成。 谁说苹果掉队了?WWDC上只字未提AI&a…

摩尔定律被提出 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 4 月 19 日,在 1918 年的今天,克利福德贝里(Clifford Berry)出生。他是世界上第一台电子数字计算设备 Atanasoff…

你的GPT跟ChatGPT可能只差了一个DPU

“人类永远不会嫌网络太快,就像永远不会嫌高铁太快,你只会嫌它慢,希望它更快些。” 一个月内,百度、阿里、腾讯、商汤、讯飞、360等国内大厂扎堆发布“中国版 GPT ”,这家的名字还没记清楚,另一家的又蹦了出…

最快下月!地表最强语言模型GPT-4发布在即?CEO暗示:已通过图灵测试

【导读】千呼万唤始出来!GPT-4,真要来了? 作为史上最受期待的AI模型,GPT-4真要来了? 这几天,AI分析师罗梅罗的一篇专栏文章,一经推出便迅速「引爆」了整个AI科技圈。 他表示,「GP…

chatgpt赋能python:错误后如何继续编辑Python代码

错误后如何继续编辑Python代码 作为Python程序员,即使有多年的编程经验,我们还是难免会犯错误。有时您可能会意识到自己写错了代码,但有时会发现错误类型与源自身的知识不同。 然而,无论这些错误类型如何,Python都提…

ChatGPT实战:情感顾问助你告别单身生活

爱情很美好,但这个事学校不讲,家长不教,至今孤身一人的小伙伴怕是不在少数,出现问题时,没有“知心大姐”交心,只能自己一个人硬扛,有时候就是一层窗户纸,没人帮你捅破,最…

因为写不出拖拽移动效果,我恶补了一下Dom中的各种距离

前端Q 我是winty,专注分享前端知识和各类前端资源,乐于分享各种有趣的事,关注我,一起做个有趣的人~ 公众号 点击上方 前端Q,关注公众号 回复加群,加入前端Q技术交流群 背景 最近在项目中要实现一…

大型 3D 互动项目开发和优化实践

点击上方 前端Q,关注公众号 回复加群,加入前端Q技术交流群 开发背景 得益于“元宇宙”概念在前段时间的爆火,各家公司都推出了使用 3D 场景的活动或频道。 https://img13.360buyimg.com/imagetools/jfs/t1/220303/24/28446/2896414/6476b7f1F…

建立数字化、学习型人事平台,HR 与业务终于不再「隔空对话」

本篇文章暨 CSDN《中国 101 计划》系列数字化转型场景之一。 《中国 101 计划——探索企业数字化发展新生态》为 CSDN 联合《新程序员》、GitCode.net 开源代码仓共同策划推出的系列活动,寻访一百零一个数字化转型场景,聚合呈现并开通评选通道&#xff…

程序员因薪资低拒绝offer,HR恼羞成怒,网友瞬间炸翻了..

一名程序员员在求职过程中,碰到一位薪资谈不拢就恼羞成怒的HR,并说出“估计你一辈子就是个程序员”这样的话。 从这位测试员和HR的聊天内容中,我们可以看到二者的谈薪过程。 首先,HR开出15k的薪资,测试员表示太低了&a…

模拟书本世界-Ai外语训练平台-文字冒险游戏-程序介绍

首先给出这个平台的进入链接:模拟书本世界 www.chatlangue.com 然后我会简要介绍一下这个平台。最后我会分享一下这个程序是如何实现的。 简要介绍:这个平台既是一款游戏又是一款外语学习软件。你通过这个平台可以进入一本书的模拟世界,这个世…

chatgpt赋能python:Python如何将英文转化为中文的最佳方法

Python如何将英文转化为中文的最佳方法 介绍 在现代全球化社会中,国与国之间的交流越来越频繁,相应的语言翻译工具的需求也愈发迫切。Python是一种易于学习、快速上手的编程语言,适合初学者和经验丰富的程序员使用,在语言翻译方…

chatgpt赋能python:Python做出来的图:探究数据可视化的魅力

Python做出来的图:探究数据可视化的魅力 在当今数字化时代,数据可视化是一种越来越重要的手段。随着数据分析和处理技术的飞速发展,现在可以轻松地使用Python编写代码来实现复杂而美丽的图形化呈现。 Python:强大的工具 Python…

chatgpt赋能python:Python图表:可视化数据的艺术

Python图表:可视化数据的艺术 作为一种易于学习和使用的编程语言,Python在数据科学和数据分析领域中的应用越来越普遍。Python的一个强大的功能是其图表功能,可以帮助我们将数据转化为可视化图表,从而更好地理解数据、提供洞察和…

chatgpt赋能python:Python面积图:简单易学、功能强大的数据可视化工具

Python 面积图:简单易学、功能强大的数据可视化工具 Python 是一种目前非常流行的编程语言,拥有强大的数据处理和可视化功能。其中,Python 的面积图是一种非常实用的数据可视化工具,能够直观地展现数据的变化趋势和占比关系。 什…

如何自己制作简历模板?简历在线制作的方法介绍

找工作时好看并有意义的简历是十分重要的事儿,如何制作一份出色的简历,在漫天的简历中脱颖而出呢?如何自己制作简历模板?今天七分简历--简历在线制作就来给大家介绍方法吧。 1.选用正确的简历模板 所谓正确的简历模板,…

用HTML做一份个人简历

学习了基本的HTML知识后&#xff0c;今天尝试用Html做一份个人简历。需要用到的基础知识是&#xff1a; Html表格&#xff1a;以<table></table>标签作为开始&#xff0c;<tr></tr>作为行&#xff0c;<td></td>作为列。 <th></…

手把手教你打造自己的简历编辑网站-编辑完后可以一键导出为PDF

如何打造自己的简历编辑网站 目录 如何打造自己的简历编辑网站一.相关环境配置A.服务器环境B.服务器面板 二.相关软件安装A.安装Node.jsB.安装yarn 三.部署简历网站A.开始安装 先看下效果&#xff0c;然后下面开始教大家搭建操作了 一.相关环境配置 A.服务器环境 系统&#x…

简历上的照片怎么制作?这两种方法真的很简单

怎么制作简历上的照片呢&#xff1f;简历是每个人在找工作的时候必须要用到的&#xff0c;在简历中&#xff0c;除了填写我们出众的履历和工作技能之外&#xff0c;还有一个很重要的影响因素&#xff0c;那就是我们放在简历中的证件照&#xff0c;一个好的照片可以让面试官一眼…

手机怎么做个人简历?多行业简历模板自由选择

如何利用手机来制作简历呢&#xff1f;现在找工作的时候&#xff0c;大多会使用手机来查看各种招聘app软件的信息来选择自己喜欢的工作。那么为了能够更好的获取面试的机会&#xff0c;那么准备一份优质的个人简历是必不可少的&#xff0c;那么从手机上如何下载一个精美简历模板…