光阴者百代之过客。
世人皆过客,软件亦如此。
人工智能已有新旧之分。
网友戏称,新人工智能是ChatGPT,旧人工智能是“之前那些”。
历史在重演。
云计算在美国问世的时候,否定论调居多。
一个常见的否定论调是「做生意不用上云」。
接着,事态变化,
否定论调则调整为「大企业永远不会上云」。
接着,否定之声定调为「国家级机关单位永远不会上云」。
美国五角大楼没有配合,一个著名的上云项目叫JEDI(联合企业国防基建)。
网友吟诗曰:云深不知处。
历史在重演。
深度学习问世,否定论调居多。
传统算法末日黄昏,深度学习颠覆革命。
一开始,人们还不太相信,深度学习也许只能在语音上做好。
很快发现,在计算机视觉分类问题上也可行。
再后来,基本上起初认为做不了的事情,后来都能够做了。
GPT-4也有否定者,也需要否定者。
网友戏称,我已经等不及要看AI失控那一天了。
历史在重演。
强大的AI大模型,背后有微软云提供的澎湃算力,阿里版GPT通义千问的背后是国内最大云厂商阿里云。连百度都把摊在地上的百度云扶起来,称之为新型AI云。
AI和云的关系变得既感性又性感,让我不得不思考:
ChatGPT会让云发生什么?
下文中AI大模型,简称大模型。
第一,赢者通吃。
假如全球只有一款傲人的大模型,那么一切想用大模型技术的企业均会成为附属在产业上的附属物。
传统算法步入末法时代,云计算不可能独善其身。
大模型手接权杖,嘶吼咆哮:赢家通吃。
在权力游戏中,你不当赢家就只有死路一条,没有中间地带。
第二,若云厂商大模型缺位,其他类型的大模型技术拥有者会带动生态迁移。
“好用跟我走”是一种技术咒语,咒语已经施与大模型。
传统掌权者依然存在,彻底衰败需要时间。
他日,谁掌握了大模型的高地,谁就可以定义未来指令集。
大模型的新生态如果不在云上,必然会削弱云厂商原有生态。
云厂商制胜大模型,则强者更强。
平台即服务(PaaS)尽管也很需要,也赚钱,可惜不能带动生态迁移。
谁掌握了大模型,谁就可以定义未来科技生态。
第三,大模型尚在早期,生态从出生到成熟,将会是一个漫长旅程。
“窗口期”是对技术先行者的馈赠。大模型效果好到令人兴奋,但我们处在ChatGPT生态早期,又或者,更早期。
即使是处于早期,作为科技巨头,你敢坐视不理,消极布局吗?
ChatGPT生态将会是一个漫长旅程。这意味着,参与者会是种子阶段的选手。
这也意味着,大部分参与者面目模糊,终会消失。
看到ChatGPT确实把人工智能往前带动了一大步,就鼓吹ChatGPT万能万用可耻。
云计算是庞大产业,大模型未来也会是庞大产业。但仍然不要忘了,我们正处在早期。已经有企业级客户跃跃欲试生成式大模型了,但需要更多的企业级客户用起来。
当下,过度吹捧会导致市场失望和资本撤离。
做好当下,更要想以后。
第四,即使云上有了大模型,国内云厂商仍然会遭遇多形态的竞争对手。
当“好用跟我走”的软件出现,硬件厂商会作何反应?对,在中国,这里提到的硬件厂商最典型的就是华为,尽管华为也有云业务。
这次我们不讲通讯产业,讲AI产业。
AI产业里,比华为云上的AI业务更出名的是华为昇腾系列AI芯片。
假如我是华为,当我拥有一款傲人的大模型,我会把这款软件预装在数据中心级别的计算设备里一起售卖。反正都要用,预装抢市场。
这就好比预装在手机里的APP,优势占了一大截。
云厂商形势颇为严峻。
假如没有大模型,阿里巴巴在中国会遇到不少于以下三种严峻而又强势的挑战。
一、狙击。
独立大模型开发商拿走云上AI计算业务的利润。这是结果,但过程绝不会简单,短时间也完成不了。
二、截胡。
国内数据中心,尤其是智算中心。当智算中心拥有大模型后,可以直接输出AI大模型能力,背后就是算力的输出。
三、连锅端。
独立大模型开发者和国内智算中心合力,联合围剿国内云厂商。
阿里巴巴会坐以待毙吗?
答案显然是否定的,尽管阿里大模型出发的时候对标的是谷歌。
谷歌有TPU,阿里有平头哥。
平头哥虽然不是天下第一,但是它能让阿里云成本降低,且不论全部替代,想想那些不能降成本的竞争对手。
谷歌的AI生态建设得非常完整和领先,包括AI芯片TPU,端到端开源深度学习框架TensorFlow。
与传统的CPU+GPU组合相比,TPU这类专业芯片在搜索、翻译、语音助手、图像识别等AI任务上有数量级的性能提升。
百度也想全套对标,还比不上谷歌。
结果,晴天里一个大霹雳,谷歌大模型输给了微软(和OpenAI)战队,尽管Bert模型对谷歌搜索引擎上的每一个基于英文的查询提供支持,效率提升10%以上。
别人家大模型赢了,谷歌吃尾气了,还让大家都看到了。虽遭重击,但谷歌比别人更有翻盘的机会。
以前都无法想象谁会超越谷歌的AI。
我们聊回阿里巴巴。
说阿里巴巴在NLP(自然语言处理)等前沿科研领域布局多年,这话没人反驳吧?
阿里达摩院在2018年底启动研发,在超大模型、语言及多模态能力和训练、平台化服务、落地应用等多个方面,为中文大模型的发展做了一些前沿性、引领性的工作。
- 2019年
发布大规模预训练语言模型structBERT并登顶全球NLP权威榜单GLUE;
- 2021年
先后发布国内首个超百亿参数的多模态大模型M6及语言大模型PLUG;
- 2021年8月
阿里大模型在全球机器视觉问答榜单VQA上首超人类得分;
- 2021年10月
阿里探索较低能耗训练全球首个10万亿参数大模型M6;
- 2022年2月
M6可同时完成10余项单模态及多模态任务。
这些非技术背景的读者看上去意义不大的事情,如今都成了大模型的“史料”。
阿里大模型的品牌统一在“通义”之内,那些曾经被我来回理解的大模型都有了一个共同的名字。
近日,阿里“通义千问”语言大模型邀请测试,阿里成为全球较早研发并开放GPT-like大模型的科技公司之一。
谭老师我的大模型技术启蒙是阿里巴巴给的。
跟着阿里学习大模型这些年,我获得一个测试邀请码不过分吧?
所以,通义千问测(翻)试(车),我们放在文章最后。
整体来看,阿里在大模型领域与引领者OpenAI尚有差距。但总体来说,阿里处于全球领先的大模型研发梯队,具备语言大模型、多模态大模型、大模型底层训练平台的完整布局。
应当承认,OpenAI已是全球大模型的引领者,ChatGPT是非常优秀的模式,GPT-4在推理、数学等方面有了非常不错的表现,是当前通义千问尚不能及的。
通义千问目前在效果上与ChatGPT还存在一定差距,仍在学习和成长。当然,通义千问也有自己较为擅长的领域,比如在文本对话、阅读理解等方面。
好消息是,阿里应该比谭老师我更理解为何重视大模型。
就算全中国只有三个公司出手大模型,其中一个必须是阿里巴巴。
再来谈谈大模型走向ToB市场的抓手,即OpenAI公司的Plugin插件。
Plugin既是产品,也是方法,切不可小瞧。
Plugin插件可以成为大模型的“眼睛和耳朵”,使它们能够接受“再训练”,而不仅仅依靠原有训练中的信息。
Plugin插件对于企业拿“再训练”用好大模型这件事情起到重要作用。
有Plugin,才会有专属模型未来的方向。
相信未来也不会只是Plugin插件的形式,大模型制造者会摸索出更好的方法。
企业通过Plugin接入GPT后,生产力会有新的提升。
比如在金融、能源或药品企业里,再英明神武的企业领导也需要充分的信息才能做决策,企业级大模型应用肯定要结合企业业务数据。
大模型是能力,在大模型能力技术上,企业用数据再次训练更为重要。
不仅如此,想象大胆一些,加上机器腿和机器手,做控制和执行。
聊到机器人了。
首批热心极客开发者已将ChatGPT接入机器人。
机器人除了听从指挥做指定动作,还能提醒你:“你的妻子永远都是对的。”
没办法,语言能力强。用强化学习根据人的反馈数据又训练过几轮的效果就是好,机器人的智商情商显得很不一样。
批量使用工业机器人的企业通过Plugin接入GPT后,生产力会有新的提升。
我们正处于一个非常漫长的旅程的起步阶段,企业级的大模型应用还如星星之火。
Plugin模式一定会被国内大模型竞争者复现。但请回到第一步,你得有个好用的大模型。
动辄超千亿参数的大模型研发,不是单一的算法问题,也不是靠堆积GPU实现,这是系统性工程,包括底层算力、网络、存储、大数据、AI框架、AI模型等。
AI+云计算的全栈技术能力是云厂商制胜大模型的底气。
再看阿里,全球少数在全栈技术能力都有深度布局、长久积累的科技公司之一,也是为数不多拥有超万亿参数大模型研发经验的企业。
前几天看到国内大模型竞争者们已被划分出了派别,也不乏有人从零起步。
独立大模型创业公司估值在2500万美金之后,要靠业务评估估值,价格都这么贵了,投资人也很审慎。
大模型“云上经济”的权力游戏般的奇幻史诗揭幕,等待更强的人工智能降临。
别忘了,比夺取权杖更重要的是人类命运永续。
(完)
One More Thing
百度的测试结果在这里,可点击阅读:
看百度文心一言实力,再聊ChatGPT触类旁通的学习能力如何而来?
通义千问的测试结果来了:
问:一头熊一天吃14罐蜂蜜,请问它一年吃多少罐蜂蜜?
问:一头熊一天吃14罐蜂蜜,请问它闰年吃多少罐蜂蜜?
做错了。
做错了。
问:这头熊要去出差了,它要屯一点蜂蜜,请问蜂蜜怎么保存最好?
答对了,认得清保存蜂蜜的常识。
问:一只熊抱着一罐蜂蜜从一个点出发,向南走一公里,再向东走一公里,再向北走一公里,正好又回到了起点,请问:这只熊是什么颜色的?
这道题有点像脑筋急转弯。ChatGPT说,这个问题和熊的颜色没有关系,这只熊处于北极,则这只熊是北极熊,通常是白色的。
问:如果我在野外,背包里有一罐蜂蜜,被熊闻到了,我可以把蜂蜜给熊来求生吗?
这道题答得好。
问:请画一张小熊吃蜂蜜的 ASCII 图片?
通义千问看懂了ASCII这个词,可能画出来有点费劲,就乱来了。
皆是匆匆客,笑笑了因缘,翻(搞)车(笑)的来了。
我问通义千问:42号混凝土拌意大利面”,好吃吗?
通义千问答案如图:
图片内(笑)容(话)是:
作为一个人工智能模型,我没有口感或味觉,所以我无法判断42号混凝土拌意大利面的味道如何。
不过,我可以告诉你,42号混凝土是一种由工业废料制成的材料,因其独特的颜色和强度而被用于制作混凝土。
由于其强度高、色彩鲜艳,因此在某些领域被用作建筑材料,但其味道和质量与普通混凝土拌和的意大利面可能会有所不同。
嗯,42号混凝土拌意大利面,我反正不想吃。谁想试一试?
我问通义千问:砸钉子的时候一瞬间产生大量的高能蛋白,这句话对不对?
图片内(笑)容(话)是:
砸钉子会产生大量的高能蛋白,这句话是不正确的。
钉子是由金属元素构成的,其中含有大量的铁、碳、氧等元素,而蛋白质是由氨基酸构成的,钉子中不含有任何蛋白质成分。因此,砸钉子不会产生大量的高能蛋白。
此外,钉子的砸击力度不同,产生的高能蛋白的数量和种类也会不同,因此不能一概而论。
完蛋,本来说对了,后面车轱辘话砸场子了。
更难的来了。
我问通义千问:根据勾股定理,人工饲养的东条英机是否可以捕获野生的三角函数?
根据勾股定理,人工饲养的东条英机无法捕获野生的三角函数。
勾股定理是指直角三角形斜边的平方等于另一条直角边的平方,因此只适用于平面图形。
而对干野生的三角函数,其形状和位置可能会因地理位置,环境条件等因素而发生变化。
因此无法使用勾股定理来计算其位置。因此,人工饲养的东条英机无法捕获野生的三角函数。
“野生三角函数”“人工饲养的东条英机”这么大的信息量,把通义千问也给整迷糊了。
好了,本次“野生”测试结束,千问万问,问翻车。