澜舟科技周明:大模型正在催生新AI中台 | 中国AIGC产业峰会

鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

ChatGPT爆火,吹起了大模型、AIGC的风口,但伴随着兴奋而来的,还有普遍的焦虑

大模型时代,我们究竟应该做些什么?

我想现在,一是要看到未来AGI的绝对趋势;二是要找到自己的长处,脚踏实地去做;三是要营造一个好的生态环境,大家多交流、互相成就。

这就是面对如此“焦虑”,世界顶级AI科学家、曾任ACL主席的周明,在首届中国AIGC产业峰会现场给出的最新观点。

9b3d61eefc69b9956a50ba3cccf5eedd.png

2021年6月,周明成立澜舟科技,这是一家以NLP技术为基础的认知智能公司。同年,澜舟科技的“孟子”模型以10亿参数“四两拨千斤”,登顶中文语言理解权威评测基准CLUE。

当ChatGPT的大潮来袭,作为国内最先一批有准备的人,周明认为,与此前的大模型不同:

首先,ChatGPT对用户的意图理解非常清晰,也更加准确。

其次,多轮对话的建模非常好,还有若干解析能力

但同时,站在工业界角度,很多需要解析能力的任务,用单独的引擎能达到比ChatGPT更好的效果。

所以,找到ChatGPT的应用场景非常关键

026758d7d1eca1414fbeca76fc3c10a9.png

基于这样的思考,周明博士站在To B角度,分享了对AI 2.0时代进行数智化转型的看法,从自身角度解答了“怎么用ChatGPT”、“我们应该做什么”的问题。

为了分享周明博士的更多精彩观点,量子位在不改变原意的基础上,对他的演讲内容进行了编辑整理,以飨读者。

演讲要点

  • 大模型时代,新的AI中台正在出现。

  • ChatGPT对用户的意图理解更加清晰准确,多轮对话的建模显现若干解析能力。

  • 对于企业而言,并不是必须用AI 2.0、一定要抛弃AI 1.0。

  • OpenAI和微软做对了什么?一是看到未来,二是发挥所长,三是互相成就。

(以下为周明演讲全文)

AI 2.0时代,不一定要抛弃AI 1.0

过去N多年,企业在完成信息化之后,期待的是智能化。但其实,这个智能化过去没有很好地发展起来。

很多企业做所谓AI中台,用AI中台支持各项业务,效果不是很理想。现在有了大模型,大家都在考虑我能不能搞一个新的AI中台来支持所有业务。

认知智能涵盖很多方面的因素:第一是语言理解,第二用推理、预测、决策去解决问题。这在很多方面都有用处,包括翻译、客服、知识图谱、推荐问答,都是企业智能引擎的一部分。

所以如何搞一个大模型,作为某种意义上的AI中台来支持企业各项业务,就是我们现在要考虑的一个问题。

回到大模型,支持下游任务无非有两种做法:GPT-3之前,是做模型的微调,去修改模型参数;而GPT-3之后,像ChatGPT,它就是用prompt(提示词),不需要对大模型进行修改,通过提示就能把大模型的很多能力牵引出来解决问题。

这样一来下游任务的开发就变得非常简单了,做prompt就可以了。

现在大家都去追ChatGPT,其实大模型是多种多样的,包括一开始BERT、T5到GPT-1、GPT-2等等。那么ChatGPT跟以前的大模型有什么区别

我的理解是:第一,它对用户的意图理解更加清晰准确;第二,多轮对话的建模非常好,有若干解析能力。

不过,站在工业界角度,很多解析能力其实不用ChatGPT也能做得很好,比如翻译。用单独的引擎跟ChatGPT比,可能还比ChatGPT厉害。

在这种情况下,到底要用ChatGPT来干什么

两种考虑:一个是在ToC层面上,AGI能力越多越好,用户在一个简单界面中,就可以想干什么干什么,不用来回来去翻。

另一个是在ToB环境下,把问题理解、多轮对话的能力,接上企业自己的核心引擎,好好结合起来。因为对于企业来说,很多AGI功能是基本不用的,甚至还有可能捣乱。

a39313773b8d5ab6b84e6af8ad7b6f0b.png

现在都在讨论AI 2.0,AI 2.0对应的是AI 1.0。

1.0是什么?一个模型一个引擎,一个模型一个任务。而AI 2.0,就是一个模型N个任务,甚至可以想象未来一个模型解决无穷个任务。现在当然达不到这个状态,但是有这样的趋势。

好处是,一个模型N个任务,可以提高开发效率。另外大模型到一定程度有涌现能力,让人产生了一些对未来人工智能深深的遐想,这是以前单模型、单任务永远出不来的。

但对于企业而言,并不是必须用AI 2.0、一定要抛弃AI 1.0。

企业应该把AI 1.0功能引擎和AI 2.0的部分能力(如问题理解和多轮对话的能力)无缝对接起来,形成一纵一横的合力。

e83be371ea0aedb64c9dc797c8e54514.png

大模型来了,能有效改进企业的智能化研发环境。过去任务太碎片化,一个任务一个模型,研发人员准备各种feature的代价太大,维护成本也比较高。现在有了大模型,代价就减少了很多,通过本地部署或者云,整体开发效率提高了很多,维护也容易了。

我们就在想,有这样的开发新范式,在企业经营场景中会有哪些新发现?

举一个例子,金融行业用大模型,你得拿金融数据做continue training才会更准。再拿金融领域常见的任务、长期积累的一些标注数据做监督学习,才能让模型适用于真实场景。这时候再拿模型去完成一些已有任务或新任务,效率才会提高。

类似于ChatGPT,具体怎么用呢?一个是用ChatGPT做底座,做foundation model训练金融大模型,另一个是用ChatGPT,在人机交互环境下对企业的各个引擎进行调度。这样一来,就能让原来的智能客服具有多轮对话、意图理解能力,推动新一代智能客服的出现。

澜舟在做大模型的时候,尤其考虑了企业落地的问题。

第一,是大模型企业数智化应用的边界。是把大模型当作一种分发机制,还是当成基础模型支持下游训练?

第二,是大模型结果的可控性和安全性,不能一会儿对,一会儿错。

还有,企业以前的功能引擎如何无缝地接入大模型。

最后,企业数据要如何巧妙地用起来,如何把模型做得更轻。

为此,我们训练了孟子的一系列模型,并进行了开源。结合用户的需求,我们不追求非得是千亿模型,十亿、百亿、千亿我们都可以提供,然后基于用户的数据快速做continue training。

基于互联网中文数据,以及来自企业、客户的中文数据,孟子模型很懂中文。

另外,我们也做了很多AIGC的工作,包括小说的续写,关键词生成,实体渲染等等。

基于这些工作,我们跟中文在线合作了一个网文版类ChatGPT引擎。

0eb86dca3b21a7c89b523fd4f81cf316.png

澜舟在做企业落地的时候,以孟子大模型为底座,拿用户行业数据和用户任务数据做continue training的例子,还包括和同花顺一起做的金融大模型,和传神合作的翻译大模型,和华夏金融合作的舆情分析大模型,以及跟数说故事公司一起做的AIGC大模型,这些大模型都已经落地了。

多说一句,行业搜索引擎也会被重新定义。第一是从关键词匹配到语言理解,第二是从数据到深度理解,第三是从简单信息获取到内容生产。

OpenAI和微软做对了什么?

最后说一点感想。这张图这两天很火,是黄仁勋当时把DGX-1的第一台机器赠送给了OpenAI。

25462b0fe06d42b01a47bba98921271d.png

现在,OpenAI已经是AI领域的翘楚,英伟达是全球科技领域市值第五的公司,还有微软,也坚持投入AI,跟OpenAI长期合作,三家公司现在发展非常好。

他们做对了什么?

第一,是拥抱未来。他们看到AI的主旋律是一定要抓住的,并且持续为之努力。

第二,是脚踏实地。每个企业都有自己的特点,OpenAI、微软和英伟达,都是在把自己的长处发挥出来。

第三,是互相成就,而不是互相拆台。比如说微软突然把OpenAI做的事都给做了,或者OpenAI往下游走,去跟英伟达形成竞争关系。

我想说这句话的意思是,现在咱们中国AIGC开始火了,大家蜂拥而上,大厂、小厂、研究机构、学生、老师都有小小的焦虑。

这时候,一是要看到未来AGI的绝对趋势;二是要找到自己的长处,脚踏实地去做;三是要营造一个好的生态环境,大家多交流、互相成就,才能促进整个AIGC的发展。

谢谢大家!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/17196.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网文版ChatGPT来了:大模型辅助写作,澜舟和中文在线联手出品

衡宇 发自 凹非寺量子位 | 公众号 QbitAI AIGC爆火,ChatGPT一枝独秀,想要追逐、赶超,从什么角度切入比较好? 澜舟科技创始人兼CEO、AI大拿周明的想法是“在垂直领域的应用”。 也就是说,不学ChatGPT的“AGI”梦想&…

怎样让ChatGPT在其内部训练神经网络?先让它想象自己有4块3090

©作者 | Posibilitee 单位 | 悉尼大学 怎样让 ChatGPT 在其内部训练神经网络?这个话题有点超乎大多数人的理解。 步骤是这样的: 1. 先让它伪装成 Ubuntu 18.04,给它说你安装了 Python 3.9, Pytorch 1.8, CUDA 11.3 和其他训练一个 pytor…

网页打不开

有没有老哥懂得啊 我挂上梯子后电脑老是打不开界面,但是手机却可以。之前chatgpt也是

利用“超越数字化”的这 7 个技巧来改变您的业务

21世纪的技术正在改变人们工作的方方面面。企业转型的需求前所未有的大。指数型的技术组合所叠加的颠覆性效应和规模可能超过以往人类社会的任何一次产业革命。《超越数字化》为企业领导者提供了一份实用的变革路线图,旨在帮助他们的公司在面临各种不确定性变化的情…

一直被低估的美图,正悄悄成为AIGC领跑者

【潮汐商业评论/原创】 也许多年之后再回望历史,2023年将被视为标志性的一年。它不仅是疫情之后的复苏之年,更是人工智能在中国乃至全球迎来爆发的一年。 从来没有这样的景象——在2023年的前3个月,全球互联网被AIGC话题“刷屏”&#xff0…

数字孪生是指通

这里写自定义目录标题 创建平面创建立方体创建约束调整立方体的尺寸调整立方体的位置创建楼梯设置场景单位创建平面创建线段调整线段的位置创建公路删除线段创建道路标志创建线段调整线段的位置创建放样模型创建线段调整线段的位置创建放样模型调整放样模型的尺寸调整放样模型的…

面向普通用户和开发者的ChatGPT Prompt Engineering 终极指南

你准备好发掘 ChatGPT 的全部潜力了吗?想象一下拥有一个AI工具,它能在很多方面帮助你 — — 从回答问题和创作有趣内容到提供个性化建议。这就是「Prompt Engineering」的用武之地 — — 一种有效且强大的方法,通过精心创建Prompt和指导&…

代理模式(Java版)-静态代理、JDK动态代理和CGLib动态代理

代理模式前传 前几天有个小朋友问到我代理模式,这个我拿手的嘛。废话不多说,直接开讲?这是不可能的。 一般呢,讲模式之前呢,礼貌上都要讲个前传。象我这种老了根本不怕没有故事祭奠的人,随手一个前传开始。…

『行业分析神器』ChatGPT麦肯锡方法,帮你快速摸清一个行业……

作为一名营销策划人员,是不是经常在做策划方案的时候,面对一个完全不了解的全新的行业,不知道如何下手? 其实,对于咱们营销人来说,行业分析对我们来说非常重要。这是因为只有了解行业趋势、竞争对手、目标…

一文读懂ChatGPT的前世今生(附相关论文下载)

2022年11月,人工智能公司OpenAI推出了一款啥都会的聊天机器人:ChatGPT。它能聊天、能翻译、能做题,还会写情书、写论文、写小说……功能强大到马斯克都表示“我们离强大到危险的 AI 不远了”。 ChatGPT是平地起高楼吗?是横空出世吗…

【ChatGPT】InstructGPT —— 如果这么看的话,ChatGPT 不过就是人类集体智慧调教出来的一个大知识模型?

目录 概述 根据人类反馈进行调教:基于人类反馈的强化学习,RLHF 问题背景

论文阅读之Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer(2020)

文章目录 AbstractintroductionSetupmodelThe Colossal Clean Crawled CorpusDownstream TasksInput and Output Format Experiments总结参考 文章标题翻译过来,大概是:用统一的文本到文本转换器探索迁移学习的极限。 确实挺极限的。 这篇文章主要探讨了…

好家伙!GPT-4 下周要来了!

转自:量子位 GPT-4 将在下周发布 3 月 9 日,微软德国 CTO Andreas Braun 在一场名为 “AI in Focus - Digital Kickoff” 的活动中表示,GPT-4 将在下周发布,将提供多模态模型。自 3 月初发布 Kosmos-1 以来,微软正在与…

Transformer:《Attention is all you need》(论文精读/原理解析/模型架构解读/源码解析/相关知识点解析/相关资源提供)

本文解读Transformer较为详细,是一篇两万字的长文,如果想看简短版的,请参考这篇文章 目录 1 相关背景 1.1 Transformer 1.2《Attention is all you need》 1.3 论文作者 1.4 Google brain 1.5 NIPS 1.6 BLEU score 2 摘要、结论…

独立产品灵感周刊 DecoHack #046 - 试试用 ChatGPT 写周刊

本周刊记录有趣好玩的独立产品设计开发相关内容,每周发布,往期内容同样精彩,感兴趣的伙伴可以 点击订阅我的周刊。为保证每期都能收到,建议邮件订阅。欢迎通过 Twitter 私信推荐或投稿。 💻 产品推荐 1. 转山 - 全自动…

亚马逊数据 各国亚马逊数据API 管理工具

什么是 API 管理? 应用程序编程接口管理(简称为“API 管理”)由一系列工具和服务组成,使开发人员和公司能够在安全的环境中构建、分析、操作和扩展 API。可以在本地、通过云或使用混合本地 – SaaS(软件即服务&#x…

跨境电商如何使用WhatsApp Business与客户沟通?这几个错误需要避免

关键词:跨境电商,WhatsApp Business,客户沟通 WhatsApp Business缩小了客户和企业之间的巨大差距,并提供了直接即时通信的媒介。与客户的个人互动确实帮助许多企业扭转了局面。但很多时候,错误的交流方式可能会使商业…

基于Android的个人健康管理系统

目 录 基于Android的个人健康管理系统 Personal Health Management System Based On Android 1 引言 1 1.1 课题背景 1 1.2 编写目的 1 1.3 关于Android 1 1.4 关于MVC框架 3 2 可行性研究 6 2.1 技术可行性 6 2.2 经济可行性 6 2.3 时间可行性 6 3 需求分析 7 4 总体设计 8 …

大健康生态应用PC管理后台、运动健康、医疗服务、商城系统、内容管理、健康数据统计、系统管理、医疗问诊、慢病管理、科室管理、问诊订单、医疗后台管理、挂号预约、体检订单、运动健康、疾病管理、血压、血糖

大健康生态应用PC管理后台/运动健康/医疗服务/商城系统/内容管理/健康数据统计/系统管理/医疗问诊/慢病管理/科室管理/问诊订单/医疗后台管理/挂号预约/体检订单/运动健康/疾病管理/血压/血糖/运动/睡眠/计步/心率/医院管理/医生管理 Axure原型演示及下载地址:Axur…

ai绘画软件免费的么?如何白嫖ai绘画?

关于ai绘画的大名,相信很多人都听说过吧?但大部分都是只闻其名,未闻其声,而且很多人也都不知道怎么去用ai绘画软件,去哪里用这个ai绘画软件,其实造成这样的原因,主要是这些ai绘画软件都是属于国…