明敏 萧箫 整理自 AIGC峰会
量子位 | 公众号 QbitAI
AIGC热得发烫,不跟上就会被淘汰。
这是当下创投圈最直观的感受。
但“跟上”并不是一件容易的事:怎么跟?朝什么方向跟?
一不留神,就可能与风口错过。
对初创公司而言,如今AIGC技术发展过快,即便从应用层出发创业,公司PPT也不一定能活过一次OpenAI技术迭代;
对投资方来说,短时间内出现的AI新技术和新创业方向太多,从0开始学习很可能与潜力股擦肩而过。
技术狂欢之下,关于国内外大模型创业差异、大模型未来发展方向和AIGC创新性的体现,企业和投资者们有了不一样的思考。
为此,量子位邀请到了元语智能联合创始人兼COO朱雷、峰瑞资本投资合伙人陈石、无界Ai联合创始人马千里和华院数智人商业化副总裁林莱尼,一起来讨论这波AIGC浪潮下,中国面临的新机遇和新挑战。
圆桌环节由量子位主编金磊主持。在不改变原意的基础上,量子位对内容进行了编辑整理。希望能够给你带来更多的启发与思考。
中国 AIGC 产业峰会是由量子位主办的行业峰会,近 20 位产业代表与会讨论。线下参与观众 600+,线上收看观众近 300 万,得到了包括 CCTV2、BTV 等在内的数十家媒体的广泛报道关注。
话题要点
AIGC让很多人才重回AI赛道,长远来看对我国科技发展非常有利。
这轮AIGC热潮让创业者感到焦虑,但更多是在焦虑中前进。
大部分AIGC创业公司的机会可能还是在非模型层,或是做一些垂类模型。
只要AI不背叛人类,就一定会带来社会效率和人类体验的飞升。
成为像OpenAI一样的企业,并不意味着打造一个中国版OpenAI。
国内AIGC这一波巨大的浪潮,大家都说是“iPhone”时刻,但其实更像是初期的PC互联网时刻。
以下为论坛对话全文:
论坛实录
AIGC热潮带来震撼、兴奋和焦虑
量子位金磊:特别感谢各位参与“中国AIGC新机遇”圆桌论坛,如今由ChatGPT引爆AIGC大热潮,尤其是国内已形成了一股燎原之势。因此我们认为站在当下的时间点上,有必要对AIGC的快速发展做一个总结和讨论,以应对即将到来的新机遇。
为此,我们邀请了几位走在业界前沿的企业嘉宾来共同探讨这一话题。
第一位是元语智能联合创始人兼COO朱雷,元语智能是这一波AIGC热潮的先行者。
第二位是峰瑞资本投资合伙人陈石,前沿科技一直是峰瑞资本重点投资的方向。
第三位是无界Ai联合创始人马千里,在生成式绘画方面,无界Ai同样是国内企业中的先行者,目前APP上的用户已超过200万人。
最后一位是华院数智人商业化副总裁林莱尼,华院计算深耕于人工智能数智人领域,长期致力于智能技术赋能产业。
在这场讨论中,我们围绕每个话题设置了一个关键词。第一个话题比较轻松,关键词为“感受”。
我们想首先请各位谈一下,这波AIGC热潮,给您所处的行业及相关业务,带来的最直观感受是什么?
元语智能朱雷:最直接的感受就是震撼和冲击。
尽管我们一直在行业内做大模型探索和开发,会有一定的预期,但这一轮热潮中还是有很多方面超出我们的预判。
体现明显的一个方面是ChatGPT在各行各业中的接受程度和应用深度。这是人工智能发展以来非常大的一个改变。原来AI都是在小圈子或固定环节里应用,这一次是真正实现了破圈,从广度到深度,都是一个非常大的技术变革,这是我们认为的震撼之处。
对我们所处行业来讲,影响大概有两点。
第一,我们正在做的模型迅速被推到了聚光灯下。举例来说,我们在2022年10月正式开源了单模型多任务大模型PromptCLUE,当时的下载量不是很多,但在ChatGPT推出后,尤其是今年1月份,随着全球范围内ChatGPT话题持续发酵,我们的开源模型下载量增长很快,这对我们来说是一个比较大的促进作用,也加速了模型研发。
第二,人才方面。此前在国内氛围的影响下,不少国内外人才加入AI浪潮,但也不免有些人对这一赛道有点失望。如今随着这波巨浪袭来,让很多人才重新回到了AI的大方向之下,所以我认为从长远来看,这会是对我国科技行业的一个重大利好。
峰瑞资本陈石:其实我以前是写程序的,对AI的技术和应用比较了解。我自己本身也经历过之前深度学习的计算机视觉那一波AI浪潮,那么这一次是做生成式AI,以预训练大规模语言模型为主,GPT-4加入了多模态的输入输出。这次的技术变革让我们感到非常惊讶,因为它是一个突然的跳跃,不是连续渐进的变化。
这背后最主要的原因在于,AI其实已经具备了一些通用智能。微软研究院最近有一个报告,认为当下语言模型的发展,我们已经看到了通用人工智能的火花,而且这个火花还在不停燃烧、变大,这是让人很惊喜的事情。
从产业角度来说,我会觉得这一轮技术浪潮和上一轮深度学习浪潮相比,也有很大的不同。上一轮的AI技术变革,总体上来说没有达到预期,主要是在通用性方面比较差,最后只在安防、人脸识别等少数应用场景有一些真正的落地实践,投入产出是不好的。但这一轮的AI技术变革,技术的通用性更好,适用的场景比较宽广,产出价值会比较大。
我认为如果AI会让人类的社会运转效率、体验都实现提升。而这种变化是可以看到的,它也会从本质上改变各行各业,特别是内容生产、教育、科研等,还有其他更多行业都会受到影响。
因此我们对这一轮AIGC浪潮感到非常兴奋。这是人类的福祉,但前提是AI不背叛人类;这也为各位创业者带来了很好的机遇。
无界Ai马千里:站在创业者角度来看,这轮AIGC热潮让我更加焦虑了。
因为它的发展速度太快了,我们去年8月的时候预估,在今年2、3月AI对图片内容的影响会越来越强,变化体现在漫画、GIF、短视频等领域。但没想到,一季度Controlnet加入进来后,诞生了非常多碾压式的新成果。
这就会让人时而觉得焦虑,因为自己在做大量工作时,其他团队可能会追赶上来。
另一方面,这种焦虑其实是全行业范围的,甚至传统行业的人也在焦虑。
这反而形成了一种“抱团取暖”,一些“八竿子打不着”的合作对象找到我们,比如奇瑞汽车、若态潮玩、以及快消品的品牌等,他们把诉求给到我们,我们一起去做训练,甚至还会给大量私有化数据。
要知道这些数据在一般情况下,企业是不会轻易分享出去的,但现在他们愿意提供,也是在担心如果不参与到这轮浪潮中来,就会被淘汰。
虽然有焦虑,但是更多是在焦虑中有前进的感觉,这是创业者的一种感受。
华院林莱尼:我来从数智人领域谈一下感受。
数智人从过去的文本客服,升级为语音客服,再到多模态人机交互系统的发展周期,人机交互模式正持续进化。
目前的数智人技术已经覆盖了较多能力域,如能够回答问题、撰写文章、文本摘要、语言翻译和代码生成等任务,甚至可处理更多小众主题;这些具备多模态交互能力的数智人在许多业务场景中已基本实现“听得清、听得懂、会表达”,并在金融、文旅、传媒、公共服务、医疗、零售、文娱、智能家居等越来越多的行业中商业化落地,提供坐席客服、理财顾问、播报主持、导游导览、虚拟偶像、虚拟歌手等辅助人工服务,已可作为企业或个人在完成一些重复性工作时的辅助工具。
并且,我们都知道全球在医疗和教育方面仍处于严重的资源不足,这两个领域存在巨大需求但缺乏足够劳动力来满足需求,这恰恰是数智人乃至人工智能未来的主要应用之一。
举例来说,许多发展中国家的老百姓由于所处偏远、基层医疗资源匮乏,就医十分困难。
如设置一些专业医疗辅助用的数智人协助医生完成基础的预检和分诊工作,并为病人提供是否需要进一步治疗的建议和相关注意事项等,从而提高医疗工作效率和服务水平;在教育领域,通过AI赋能教育可以根据不同学生的特点因地制宜提供个性化的学习方案,培养学生学习兴趣、提高教育质量等等。
所以数智人的出现既是挑战也是机遇,我们需要保持敏锐的洞察力和前瞻性思维,积极应对它所带来不管是正面亦或负面的影响。
中国AIGC创新性如何体现?
量子位金磊:讨论的第二个关键词,叫做模型同质化和创新性。
就目前来看,无论是AIGC应用的玩法,或是背后算法模型似乎有同质化的趋势。因此,中国AIGC的原创性该如何体现?
元语智能朱雷:这个问题很好,我们也一直在思考这一问题。
可以看到,大部分基础研究、尤其是算法模型方面,很多都是国外率先诞生。再看国内目前做大模型,无论是大厂、研究机构还是初创公司,在基础研究环节都是非常薄弱的,因此基础研究或者原创性探索上,国内目前还有一段距离需要追赶。
但这也不是说目前国内自研大模型没有价值,反而是非常势在必行的。
第一,这可以推动开源数据集、模型这方面的生态构建。
比如在中文语料梳理上,通用语料质量还不够好;还有在开源方面的氛围也比较差,据我们了解国外有很多医疗行业的开源数据集,但国内我们已知的只有2个,开源数据集的质量也不好。
因此要有更多人来做这件事,这也是我们元语智能核心团队在2019年发起中文语言模型评测基准开源社区时,就在倡导的方向和理念。
第二,现在国内对大模型AI基础设施的重视,已经到了相当高的量级。这时对于人才的吸引,包括很多圈外人都愿意加入到这一浪潮中来,从长期角度来看,这件事对于国内做AI基础设施非常有价值。
国内大模型的创新工作,大厂、初创公司都在做,各家的切入点也不同。
比如有专门做和心理咨询相关的,比如元语智能就是在通用大模型之上,做上层专业模型。聚焦在一两个行业里,解决客户的具体问题。
对于国内初创公司而言,创新性主要体现在对行业是否有足够多、深刻的理解,以及是否能迅速在行业内把数据和场景跑起来。这就要求初创公司在模型底层数据、指令微调层面上做一定创新。
无界Ai马千里:做产品创新和拥抱Stable Diffusion生态并不冲突。SD只是帮忙从0-1的原型搭建,但是从底层数据、中层算法、上层应用方面还是要做从1-100的创新。怎么做出这个差差异化,这是每个创业者要思考的事情。
比如我们现在开发国风模型,首先这个模型底层要有大量国风数据,比如中国人面孔、眼睛、汉服等素材,以汉服为例,甚至具体精细区分不同时期、不同民族风格差别、汉服左右衣襟的不同代表意味都大不相同,细节见鬼神,对于关注国风的人来说细节非常重要。谁训练出来了这种带有丰富细节的戏份模型,谁就能具备底层的差异化。
训练数据不是一次性的,而是实时的、自我迭代的。我们平台上每天有200万用户每天创作接近220万张图片,很多图片都会被分享到我们的“广场”里面,我们会将受到关注和喜爱的作品的关键词拿来做进一步训练,使平台能力得到实时增强、这样的话差异化就更体现出来了。这也是为什么我们使用开源Stable Diffusion,但是平台作品和市面上的内容有很大区别,实时自我迭代的数据训练成为了创新点。
当然,除了底层数据,在训练方法方式上也有很多创新点,比如融合GPT的功能,这些功能我不赘述,欢迎大家直接用无界ai上手体验。
华院林莱尼:数智人作为生成式AI技术的其中一种应用,本身包括了好几个层面的内容。就如我们评价一个演员,会从“声台行表”出发。除了外貌、声音这些外在部分,数智人的行为动作、文本表达、语音表达、交互方式甚至个性等都在生成范围内。
刚刚马总从数智人的外貌、类型和风格等方面做了解答。我这边从数智人的内容生成做一些补充。华院计算认为,数智人有三个层次,第一个层次是能说会动,第二个层次是真情实感,第三个层次是能思会想。
其中,第一个层次与 AIGC 技术中的音视频生成相关,第二个层次与文本生成和跨模态生成相关,最后一个层次则是机器人能够有自己的思考,经持续进行自主学习后,涉及策略生成等方面。为达成第三层次的数智人,我们将“常识知识图谱”中的社交常识加入到对话交互框架,实现数智人的情绪系统;通过建立行为概率性知识图谱,该图谱涵盖了5000+ 种不同的行为,实现数智人的个性化交互。
因此,最终生成的数智人,声音外貌或有相像,但结合其形体动作、交互内容以及差异化的个性足以让数智人具备自己情感和个性的个体,拥有独一无二的原创性。当然,目前华院要达成这种具备多模态交互能力且有自己个性和情感的数智人还需在认知智能领域持续、深入的研究。
峰瑞资本陈石:在趋势上看,不仅是国内,海外也是有大量偏同质化的跟进。有个统计数据显示,2022年平均四天出一个大模型,大概90多个大模型,主要是以美国为主。
本轮生成式AI的核心突破还是在算法层面和模型训练范式层面。
算法方面,大家刚刚都提到了Transformer、Diffusion Model,是目前的主流模型,所以现在很多模型都是以他们为底层架构来做迭代和变化的。
从热度方面来看,我不认为这是一个短期热潮或泡沫,我认为它会经历很长时间的进步,并产生出非常大的社会价值和商业价值。业界有人说,大型语言模型是人机接口,还是新形态的操作系统。
首先,语言模型已经成为了人机接口第一界面,以前通过菜单、图形化的方式,人们只能做有限选择,但其实通过语言才是人机交互最自然和灵活的选择。
另外从操作系统角度来看,因为GPT等语言模型已经具备一定的通用智能,有点像大脑或者分发中心,它可以和人类做交互、接收、拆解和分发任务给各种外部插件应用,得到结果后再反馈给人类,所以可以认为它也具备了操作系统的特点。
未来软件行业也在变化,我觉得方向是以语言模型为中枢的应用生态体系。AI除了赋能并提升行业效率产生商业价值之外,人类还可以通过向AI学习,不断提升人类自己的学习能力。
举例来说,人类学习语言是很痛苦的,比如学外语十几年效果可能都不是很好,但是机器学习语言的效率非常高,如果我们能够部分打开AI的内部结构,找到一些其中的规律,或许人类也可以借此提升自己,和机器一起进步,这些事情就具备很大的社会价值。
因此我不认为AIGC热潮会是短期的,它是有长期社会价值和商业价值的。
大模型只能靠“大力出奇迹”吗?
量子位金磊:针对大模型的参数规模,还有一个问题要讨论一下,叫做“大力出奇迹”。大力一定会出奇迹吗?想先请教马总,您觉得大力出奇迹这种方式一定是AIGC必经之路吗?
无界Ai马千里:如果AIGC能出奇迹,不管是大力还是什么力,都是好事情。
在一些语境中,“大力出奇迹”像是一件坏事情一样,好像迫不得已的选择,但它不见得是坏事。
我曾经看过一篇博客叫“苦涩的教训”,是强化学习之父Richard Sutton写的,他认为人类总是自作聪明地去干预机器,教它怎么下围棋、让它学习人类的棋谱,但其实最有效的方法还是自我学习,无监督学习。
一定程度上,我们人类干预太多反而会限制它的发挥。所以本质上,虽然我们需要大量算力、算法上也要跟进,但我们不需要那么强地去干预它,否则效果可能会南辕北辙。
峰瑞资本陈石:大力出奇迹是必然,因为目前这个阶段的突破,就是无监督学习取得的。
无监督学习、特别是大规模无监督学习,此前一直是机器学习领域的圣杯,从来没人取得过这个圣杯。如今OpenAI把它拿下来了,我觉得这是当下被验证的一件事情,也是一个趋势,所以估计大家还会这么做,在算法和训练技术方面如果没有取得大的突破,我觉得大模型还只能这么训练。
对创业公司来说,他如果是做应用层,其实可以不需要自己去训练模型,而是在大模型基础上做调优。所以我觉得,大部分AIGC创业公司的机会可能还是在应用层,或者做一些垂类模型方向。
大模型本身,我觉得未来中国可能不会有太多家、甚至全球也不会有太多家去做。但垂类模型还有一定的机会。
如何看待中国版OpenAI
量子位金磊:接下来的关键词叫做“中国版OpenAI”。这波热潮中,国内有很多大佬纷纷下场布局、广发AI英雄帖,说要打造中国版OpenAI。
所以,就中国目前大环境来看,有必要做“中国版OpenAI”吗?可行性高吗?
华院林莱尼:我对我们国家出现像OpenAI那样基于底层算法研究、研发出划时代创新技术或应用的公司充满信心,尤其我看到现场有不少Z世代的年轻创业者,他们不仅有创新精神,也有情怀和责任感。
但成为像OpenAI一样的企业,并不意味着打造一个中国版OpenAI,我们无需重复他人的道路,在人工智能领域,“创新”是非常重要的。虽然OpenAI打造了一个多模态大模型的底层平台,为我们打开了生成式AI技术的应用大门,但从真实世界应用场景来看,多模态大模型也并非能“一招鲜、吃遍天”。
举例来说,从GPT的1.17亿到GPT-3的1750亿,几年来大模型参数量增长了近1500倍,而Google的Switch Transformer参数量更是达到1.6万亿,海量参数规模所需的庞大算力,是许多企业甚至行业无法提供的。
因此,如何提高算法鲁棒性、提升模型效果,通过小样本学习、多模态学习等实现少量数据完成新领域的训练,仍然是AI需要考虑的问题。
目前,我国已有不少露出小荷尖尖角的AI企业正在茁壮发展,虽然暂时因算力或算法上积累的经验不足,与OpenAI这样全球顶尖的AI公司尚有差距。但我坚信不久的未来,我们将看到属于我们自己的AI代表企业及其创新技术。
元语智能朱雷:我觉得这个说法有一点以偏概全。OpenAI所谓“十年磨一剑”,是因为它最初是以非盈利性目的成立的一家组织。最近它跟微软合作,整体才进入闭源状态,也有了一些商业化的模式。
但其实以商业化为目标的技术研究,国外也有很多公司都在做,而不以商业化为目标的技术研究,国内也有很多,比如高校、研究院、或是一些开源社区等,有一大批开发者和组织,以开源为目的在做这样的事情。
只不过目前国内环境下,大家普遍只会关注到一些有商业光环的项目,但对于那些非商业化的项目大家关注度比较低。
其实包括我们陈石总这样的投资人也好,包括我们量子位这种媒体也好,大家可能真的要做一件事,就是推动国内开源数据集和开源模型的发展,这个可能会成为未来的一个基石。
我认为,国内和国外在这件事上没有本质区别,大家都有一些考虑商业化的公司和以开源为目的的组织。
对中国AIGC新机遇的期待
量子位金磊:最后一个关键词,就是圆桌论坛的议题“中国AIGC新机遇”,我们用简短一句话来谈谈对它的期待。
华院林莱尼:说起这个期待,我们发现互联网企业可能对于35岁+的人群不是很友好,所以我们也在思考一个问题,AI真的创造了失业潮吗?后来我觉得不是。我也是35岁以上的中年人了,在这里说说我的感受。
我很喜欢一句广告词,就是“永不放弃,奔向未来”,虽然我们已经35岁多了,但我们也可能会像Transformer用到一些机制进行自我变革一样,永不放弃奔向未来,用积极和勇敢的心态正面来自未来的机遇和挑战。
无界Ai马千里:我倒觉得可能是比较复杂的一种,你看最近有一个新闻,就是包括马斯克在内,上千名科学家认为AIGC还有AI大模型是一件危险的事情。
我觉得国内的机遇在于,即使你和国外有差距、甚至可能有几倍差距,但对于人类来说够用了就行,就像苏联和美国大战时候,都说自己能毁灭地球多少遍,但其实毁灭一遍就够了。可能AIGC产生的能力会强到,即使两个模型之间有百分之多少的差距都无所谓,只要它对于人类来说够用了就行,这是一个长期的看法。
所以即使我们现在的大模型,的确可能没有外国人那么强,但是从逻辑上来说我们还是能赶上的。
峰瑞资本陈石:这个机遇其实是全人类的机遇,中国也有非常大的机会。当前无论是OpenAI、谷歌、还是其他一些国外大厂,我们很多中国工程师、或者华人工程师,深度地参与了这个研发过程。我觉得,这里面中国是有机会做成大基础模型的,特别是大型语言模型,这是可以做的。为什么呢?
算法层面来说,这其实是大家共同的科研成果,从GPT-3的预训练过程,到包括ChatGPT用到的基于人类反馈的强化学习过程,都有相关的论文详细介绍其中的算法和实施逻辑,大部分训练数据也是开放的。虽然细节上OpenAI可能有一些语焉不详,但其实它剩下的最难的可能是一些具体的工程实施工作。我觉得在具体工程实施方面,我们中国的工程师是不怕的。
算力上,我觉得这个事情需要慢慢来,尽量地想到一些能替代的办法,做到有自己的算力,或是通过别的方式去获取一些算力。
数据上,我觉得我们是可以做到的,因为数据集这个事情,它现在是4500亿的Token(每个约0.7个单词),这个体量的数据相对而言,我们经过努力,应该也是有办法收集和整理出来的。
我认为,凭着中国人的聪明程度,基础模型是可以突破的,当然复现到今天GPT-4这个水平可能还有差距,但也只是时间问题。我们的应用生态一定也会基于这些国外国内的模型蓬勃发展。
其实包括微信、钉钉或是其他当年的手机上的应用生态,我们已经一再证明,中国在软件的应用上是很厉害的,所以我觉得这个是中国的新机遇。
元语智能朱雷:我非常同意陈石总的看法。虽然说现在跟GPT-4比,技术差距还是有的,但是确实是时间的问题,因为从全球范围来看,除了硅谷,就是国内的这波热潮了。
国内AIGC这一波巨大的浪潮,大家都说是“iPhone”时刻,但我觉得更像是初期的PC互联网时刻。大家对于AI这件事认知没有那么强的时候,突然出现一个巨大的机会和机遇,这时候我觉得对于我们台上的各位和台下的现场观众,包括直播的观众,各行各业来说,都是一个巨大的机遇。
但在机遇的同时,这也是一种挑战,所以最后一句话就是我们拥抱AI。
量子位金磊:非常感谢各位嘉宾精彩的总结和分享,由于时间原因,本场圆桌讨论到此为止。刚才嘉宾们所展望和期待一些新机遇,在未来将如何发展,我们明年揭晓答案。