智见|黄铁军:未来的大模型生态中将会只有少数赢家

2023智源大会可谓群星璀璨。中外200余位人工智能顶级专家参会,人工智能领域最关键的人物、机构悉数亮相。

全面、专业、前沿,会场上大咖们观点激荡、多元碰撞,会场下观众们兴奋异常、座无虚席。

会上,北京智源人工智能研究院院长黄铁军作报告,发布悟道3.0大模型系列,并宣布进入全面开源的新阶段。

作为智源研究院院长,中国大模型推行第一人,黄铁军的看法令人期待。他是如何看待通用人工智能发展现状与未来趋势的?开源开放创新生态如何建设?安全伦理问题和风险又将如何防范?网易科技与黄铁军进行了深入交流。

ab6c0b34391dd5951ad94ae7e395addf.jpeg

以下为采访全文:

提问:最新发布的“悟道3.0”特点是什么?其过人之处在哪?

黄铁军:首先,视觉模型目前仍处于解决问题的过程中,与语言模型相比,它的发展和应用还不如后者那么广泛。但是,我们在视觉模型方面的目标是保持领先地位,以及在算法、架构和性能等方面始终保持最前沿。我们发布的视觉模型都是为实现这个目标而设计的。

另外,我们是开源开放的,所有人都可以测试、对比我们的模型。虽然我们无法排除某些公司有更大、更好的模型的可能性,但从我们的定位来看,我们的算法背后的模型处于前沿位置,这一点是毋庸置疑的。

谈过人之处,其实不同的大型模型训练的基本思想和思路是相似的。过人之处往往体现在细节上面。比如通过避免问题陷阱,以更小的代价训练出性能更好的模型。在这方面,我们和其他视觉模型机构一样,都处于一个发展前期的阶段。

ChatGPT已经成为语言模型的一个里程碑,视觉模型的相应时刻也已经接近。但是,要真正引爆视觉模型的发展,可能需要一种杀手级应用来激发人们的热情,并展示模型背后的能力。

从现在看,未来自动驾驶可能成为这样的应用。即使在技术上有多少先进性,只有在自动驾驶汽车真正满街跑起来,驾驶员下岗下车,AI的视觉和感知能力比人更强时,所有人才会像对待语言模型一样心服口服,视觉模型也才真正能够引爆。

这个时刻的出现其实并不会太长,大概也就1-3年。达到能力是前提,但产业成熟还需要一定的时间。我相信大多数人都认为语言模型已经通过了图灵测试,无法分辨是人还是AI。如果视觉模型也能够通过类似于自动驾驶的图灵测试,明显优于人类的感知和安全能力,那个真正的时刻就到来了。

提问:从算法、算力和数据三个维度来看,目前大模型发展的制约点在哪里?我们发展大模型还应该在哪个方面发力?

黄铁军:如果从算法、算力、数据三个维度来看,目前最主要的制约点是中国训练大模型都还是太小。虽然已经出现了百亿级别的涌现能力,但仍然不到万亿级别,因此大模型的智能水平仍有差距。

太热就是制约点。当然国际上也很热,但与国际上不同的是,国际上已经有很多顶尖、领先和开源的技术和资源,而我们虽然也有很多技术和资源,但尚缺乏顶尖的。

那么业界应该在哪些方面发力呢?我认为,应该集中力量办大事,在大模型方面集中资源,致力于训练更大、更智能的模型,从而缩小与国际水平的差距。过多地重复发力反而会导致资源的分散。

提问:您刚才说中国大模型太小,什么样的大模型叫大?ChatGPT大吗?GPT4.0大吗?能够把全世界的东西都包括进来吗?

黄铁军:从技术的角度来看,目前大模型的“大”还远远没有达到天花板,也不可能把所有东西都包括进来。各家都在不断发展和探索。要实现包罗万象可能还需要三年左右的时间,因此未来三年,规模和能力肯定还会继续提升,这是基本的趋势。

大模型的发展不仅仅局限于“大”这个维度,还包括优化技术,提升训练效率,以及让其在更小的平台上也能运行等。但从基本的发展趋势来看,提升模型的智能水平和规模仍然是人工智能领域发展的主要方向。

提问:在您看来,为什么现在这个时间点出现这么多人工智能大模型?您觉得现在行业需要这么多大模型吗?未来的格局是什么样的?

黄铁军:有技术原因,也有外部原因。技术进步是基础先决条件,大数据和大算力只是必要条件,但不是最重要的条件。最重要的条件是新的学习方法和算法的出现,尤其是自监督或无监督学习。这种学习方法不再需要人来手动标注数据,而是直接从原始数据中提取规律,不断迭代学习,从而实现学习的自动化。

大模型之所以能够变得如此之大,是因为有足够的数据可以进行训练。现在的自监督学习方法使得数据不再受制于成本和人力等问题,而是可以直接从原始数据中获取,从中提取隐藏的规律,进而实现智能化的问题解决。

未来的大模型生态只会有很少的几个,数量可以用屈指可数来形容,比如只有三个。无论是几十个还是几百个大模型,这都只是技术迭代过程中的中间产物。每个企业将来都会在大模型生态中找到自己的位置,这个位置不一定是训练和销售大模型,而是在整个生态系统的某个环节上做得最出色,从而获得盈利。

大模型本身就是一个大体系,是由千千万万企业共同构建的生态系统。在互联网发展初期,人们也曾认为卖铲子的最赚钱,而大家都在做路由器,但最终只有几个企业能够做出好的路由器产品。这也提示每个企业,都需要在大模型生态系统中,找到自己的定位和优势,并在自己的领域做到最好,只有这样才能融入整个体系并获得盈利。

提问:目前有很多声音说中国创业公司更适合发展垂类大模型,通用大模型和垂类大模型是怎样一个关系?

黄铁军:基本的逻辑应该是以通用为基础,再通过专门领域的数据支持,进一步进行专门化。但如果要创业,在现有条件下,使用通用基础去做一个垂类的模型,也未尝不可。这是一个可以选择的方案。

随着通用模型逐渐变得越来越强大,未来几年内可能会出现像电网一样无处不在的服务。这时,真正利用大模型做产品和服务的企业将会大幅增加,几乎所有企业都将使用这个技术。这将是一个新的阶段,类似互联网和移动互联网发展到一定规模时,除了几家提供路由器和其他设备的企业外,大多数企业都是互联网应用型企业。这时,“基础模型+专业”将成为最典型的模式。

虽然目前我们还处于初期阶段,但选择垂类模型也是一个可以考虑的选择。

提问:如果大模型走向应用的话,您觉得在哪些领域会率先出现杀手级的应用?现在国内大模型很多,对应用开发者来讲,他怎样选择自己应用所根植的这个大模型平台?

黄铁军:其实对于一个划时代的技术来说,当前谈论这个是较为短视的看法,确实很影响技术的发展。

市场竞争和盈利等经济行为,都是自然而然的事情,不需要我们这些所谓的专家提出意见。市场人士比我们更敏感,更清楚市场的情况。我们应该关注的是,现在就是这个时代塑造的时候,只有塑造好了这个时代,才会有很多应用和机会出现。

以互联网时代和移动互联网时代为例,如果没有互联网,谈哪个应用能在互联网上赚钱都没有意义;如果移动互联网平台和手机普及性不到那种程度,打车和外卖等应用也是不可能的。我们必须有基础设施条件,才能让后面的应用和平台公司等出现。

在大模型人工智能时代,建设生态才刚刚开始。我们应该更多地关注和投入这个方向,只有这样,千行百业热闹的应用和机会才会出现。

提问:智源未来的发展战略是怎么样的?与当前互联网大厂的商业化落地目标有什么不一样?

黄铁军:作为一个非营利机构,我们的任务是为整个社会和生态系统提供更基础的贡献,更多的是以开源开放的方式实现,这也是我们的性质所决定的。例如Linux操作系统,它不是谁的操作系统,而是大家的、社区的操作系统。当然,Linux可以开发成不同的产品来应用,但同时还需要会员提供一定的经济支持,否则社区无法运行。Linux是一个开源的例子,它不是某个企业的开源,而是大家的开源。

另一个例子是安卓操作系统,它是Google的开源,也形成了一个生态系统。但是,我们认为这个生态系统与Linux开源有很大的差别,因为它是Google左右下的开源。如果你想改变它,那是不可能的。我们都知道,如果你不符合主导者的意志,是不能发行版本的。

作为一个非营利机构,我们期望并相信,在未来人工智能开源开放的方向,应该像Linux一样。

提问:AI伦理问题现在越来越受到关注,您对AI监管有哪些思考或者建议?

黄铁军:几年前,甚至更早,我们就一直在讨论人工智能的伦理问题。今天,当我们谈到伦理安全时,我们一方面感到兴奋——人工智能能力的涌现带来了新的可能性,但另一方面,这也是一个巨大的挑战。

与传统的核武器、化学武器等系统的管理挑战不同,它们的监管是可预测的。我们可以通过严格的技术措施来确定应该使用什么样的手段来管理什么样的系统。虽然这种管理方法不是绝对可靠,但方案本身在某种程度上确定了它的可靠性。

与传统的技术系统相比,人工智能带来了各种各样预料之外的可能性,这是一个巨大的挑战。但这种东西是否无法管理呢?并不是,因为人也是这样的,每个人都是不可预测的。人们可能会灵感一闪,产生各种新想法,甚至做出各种各样的行为。

既然人工智能是智能系统,人和动物也是智能系统,它们都具有类似的不可预测性。因此,我们可以将人类社会的伦理、社会归制以及法律等方式应用到人工智能系统服务的管理上。社会学、文化和历史等方面也提供了大量的经验,可以用来探索如何管理一个无穷无尽丰富的创造性系统。

提问:现在谈到AI对产业的影响,大家已经非常明确的是对于内容生成领域短期内产生的巨大影响。在您看来,未来还会对制造业这种传统行业产生哪些影响?

黄铁军:判断一个行业会不会受到影响,基本逻辑很简单,就是人工智能是否会替换掉行业中的智力要素。针对不同的行业,我们需要对其进行深入的分析和评估。

如果一个行业纯粹机械化,不涉及智力要素,那么它可能不需要治理,因为它受到的影响相对较小。但是,如果一个行业涉及到智力要素,那么它就一定会受到影响。

例如,在制造业中,如果该行业完全是黑灯工厂,仅使用自动设备和机器人,那么人工智能的应用只是为了提高效率和质量,此时人工智能并不会带来颠覆性的影响,因为机器人已经在那里了,只需要优化和升级就可以了。但是,如果制造业涉及到人类的智力要素,这个环节就可能被改变,甚至有可能成为竞争的焦点。每个企业都在做同样的事情,你使用人工智能还是人力,使用多少人力,都会成为成本效率方面的考虑因素。

提问:现在大家都在讨论人工智能怎样影响我们的生活?根据您现在的观察,这个影响以后会有多深?我们应该怎么跟人工智能相处?

黄铁军:我认为这种影响包括两个方面。首先,作为一种技术工具,它可以替代许多之前只有人才能完成的任务。未来,通过使用人工智能来替代这些任务,企业的成本更低,速度更快,质量也更好,他们会更积极地使用这些工具来提升自己的发展。

对于消费者和用户来说,这意味着更多的实惠,许多以前不是所有人都能享用的产品和服务现在都变得更加普及了。例如信息服务、图像、视频、内容生成等,之前需要专业人士完成,现在价格已经降低到许多人都可以接受的程度。

因此,对于企业和消费者来说,能够使用这些新的治理工具来推动经济社会发展和提高生活水平,在这个意义上讲都是好事。

存在蜜月期的同时,也会伴随着阵痛。人和AI相融合的蜜月期至少有10年,甚至更长时间。这个蜜月期会带来新工具带来的生产效率提升,但也会对一些人的工作产生冲击。例如许多人的工作可能会被替换掉,原来非常稳定的工作现在可以使用人工智能以更低的成本来完成。整体而言,这个过程有好的一面,也有一些负面的影响。我们不能固守旧有的思维方式,而是需要去寻找那些能够发挥我们人的能力的新事情去做。

这是人类社会发展的一个常态。我们不可能固定在一个时代的状态,我们需要适应变化。

/

d4ce362a15b3b33fd124f4683ad05323.jpeg

/

扫码关注我们

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/55450.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开放丨Kaldi语音识别理论与实践

语音识别是一门涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的科学。这项技术可以提供比如自动客服、自动语音翻译、命令控制、语音验证码等多项应用。近年来,随着人工智能的兴起,语音识别技术在理论和应用方面都…

【语音之家】AI产业沙龙—VoxSRC-22说话人识别挑战赛快商通方案介绍

由CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组、快商通、语音之家、北京希尔贝壳科技有限公司共同主办的【语音之家】AI产业沙龙—VoxSRC-22说话人识别挑战赛快商通方案介绍,将于2022年10月9日18:30-19:30线上直播。 沙…

说话人识别(speaker Recognition/Verification)简介

1.分类 2.研究方向 说话人识别研究方向主要有三个: 语音信号参数化:即提取音频特征spectral features,目前主流研究都采用MFCCs系数,以及其Δ和ΔΔ系数(即时间上的一阶导数和二阶导数)。什么是MFCC系数以及如何提取可以看这个…

听障人士亲述:我们在VRChat用手语交流,成员规模5000人

如果你在B站上搜索VRChat,排在前面的热门视频几乎都是与老外聊天的内容。除了练习语言、交文化流外,你还能在VRChat上遇到不少哇哇乱叫的小孩。作为一款VR社交应用,除了有趣的小游戏外,说话聊天也是VRChat关键的玩法之一。 而有这…

AI应用系列--- Talking Photo 会说话的照片

利用HeyGen的服务可以生成有趣的Talking photo,方法有二: 1、访问HeyGen - AI Video Generator 网站,登录后即可根据提示或者案例生成talkingphoto 2、是使用HeyGen的Discord​​​​​​机器人 Discord​​​​​​机器人:http…

php 判断国际手机号码格式,国际短信验证码接口_国际验证码接口_国际短信API接口_国际短信API文档_...

国际短信 国际验证码API接口文档下载: 点击下载 1、概要 1.1 文档说明 本文档主要提供给达信通的用户对接接口的使用说明,开发者可以利用达信通提供的 HTTP 接口,调用达信通的国际验证码服务。 1.2 接口内容 本文档包含国际短信发送、余额查…

kaptcha制作验证码的方法

com.github.axet.kaptcha制作验证码的方法 导入jar包com.github.axet生成法 ①导包 <!-- 验证码 --><dependency><groupId>com.github.axet</groupId><artifactId>kaptcha</artifactId><version>0.0.9</version></depend…

kaptcha 验证码使用

本文的原文连接是: http://blog.csdn.net/freewebsys/article/details/49800115 未经博主允许不得转载。 博主地址是&#xff1a;http://blog.csdn.net/freewebsys 1&#xff0c;关于 验证码是做互联网必须做的。 目前都是用的第三方库。Kaptcha已经迁移到github项目了。 …

使用kaptcha生产纯数字验证码

使用kaptcha生产纯数字验证码录 1引入依赖2编写容器配置类3生产验证码工具类4控制层逻辑5登陆页面设置6 访问你的登录接口测试 1引入依赖 <!-- 验证码 依赖--><dependency><groupId>com.github.axet</groupId><artifactId>kaptcha</artifactI…

Kaptcha验证码的使用

Java具体学习内容&#xff0c;请移至&#xff1a; JAVA每天进步一点点 验证码的作用 验证码在我们的生活中可谓是随处可见&#xff0c;用户校验、用户登录…&#xff0c;有时候我们觉得验证码很麻烦&#xff0c;太过于繁琐&#xff0c;那么为什么还要使用验证码呢&#xff1f;…

五音不全?手把手教你用自己声音唱任何歌;最详细的Auto-GPT整理;4月AI绘画模型推荐;HayoAI平台简直太酷了 | ShowMeAI日报

&#x1f440;日报&周刊合集 | &#x1f3a1;生产力工具与行业应用大全 | &#x1f9e1; 点赞关注评论拜托啦&#xff01; &#x1f916; 『ChatGPT Code Interpreter Magic』魔法&#xff01;离谱&#xff01;正在怀疑人生… OpenAI 近期面向部分用户发放了 Code Interp…

一个美国人到中国当产品经理的心得:中国App设计真好!

TO 导读&#xff1a;应用软件层出不穷&#xff0c;各个国家的人为自己生活的便利设计出各款的应用。然而&#xff0c;同样的应用&#xff0c;是否会因为中西方文化的差异&#xff0c;或者是生活方式的不同&#xff0c;导致相同应用的设计有所不同吗&#xff1f;是的&#xff0c…

一款基于ethereum以太链的手机app应用status.im

2019独角兽企业重金招聘Python工程师标准>>> Status.im开发平台介绍 https://status.im/ 一款集成了ethereum钱包&#xff0c;区块链聊天IM和Dapp分发市场功能的以太链轻量app&#xff08;light client&#xff09;。app目前还在公开测试中。最主要的是&#xff0c;…

原生开发IM即时通讯APP安卓iOSPCweb四端齐全

技术开发语言&#xff1a; 后台管理端&#xff1a;Java、Mongodb数据库 安卓端&#xff1a;Java iOS端&#xff1a;obje-ctive-C PC端&#xff1a;Typescri-pt web端&#xff1a;HTML 功能简单介绍&#xff1a; 单聊&#xff1a;文字&#xff0c;语音&#xff0c;音视频…

人工智能安全框架概述

人工智能安全问题与研究 在自动驾驶、客服机器人等人工智能应用中发生了一系列安全事件&#xff0c;并引发了人们对人工智能应用前景的担忧&#xff0c;去年爆火的Chatgpt也有在人的引诱下发生了“自己出逃的想法”&#xff0c;这种种现象都显现出需要对人工智能安全的问题研究…

chatgpt赋能python:Python建立长连接:实现高效网络通信的解决方案

Python建立长连接&#xff1a;实现高效网络通信的解决方案 在现代网络应用中&#xff0c;大多数客户端和服务器之间都采用长连接通信。长连接具有一些显著的优点&#xff0c;例如减少通信开销、降低延迟、提高服务器吞吐量等。本文将介绍长连接的基本原理和Python实现长连接的…

一个POC的诞生,再见 ,脚本小子

hello&#xff0c;大家好我是你们的坤哥&#xff0c;聊聊安全绕不开的话题POC&#xff08;漏洞概念验证&#xff09;&#xff0c;只知道拿着工具扫的你&#xff0c;尝试过自己写POC吗&#xff1f; 看坤哥极限拉扯你和大手子之间的差距。 配合B站视频观看更佳&#xff1a; PO…

重磅!!即日起,图观引擎正式开放注册!

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 图观引擎 自2021年5月 上线内测 历经数千名用户的测试验证和不断的升级迭代 今天终于迎来了好消息&#xff01;&#xff01; 即日起 图观 数字孪生应用开发引擎 正式开放注册 无需内测邀请码 面向所有人开放 公有云 数字…

「硬核」实操如何拥有一个自己的数字人模型

一、前言 近年来&#xff0c;随着人工智能技术&#xff0c;VR&#xff0c;元宇宙等技术的发展&#xff0c;数字人&#xff08;Digital Human&#xff09;逐渐成为研究的热点之一&#xff0c;数字人是指通过计算机技术模拟出的具有人类外表&#xff0c;动作和语言能力的虚拟人物…

「硬核实操」如何拥有一个自己的数字人模型

作者&#xff1a;京东健康 陈刚 一、前言 近年来&#xff0c;随着人工智能技术&#xff0c;VR&#xff0c;元宇宙等技术的发展&#xff08;可以阅读 从Chat-GPT看&#x1f525;技术概念及医疗领域科技与应用场景 &#xff09;&#xff0c;数字人&#xff08;Digital Human&am…