5月18日,由《财经天下》、「市界」、《博客天下》联合举办的2023年异想大会在北京召开,大会以“想象创未来”为主题,邀请来自各领域的多名企业家、专家,探索下一个能够改变商业世界的“异想”。
在大会“天工开物——人工智能劈开千行百业新想象”圆桌对话环节,星尘数据创始人、CEO章磊应邀与印象笔记高级副总裁乔迁、阿里达摩院首席架构师王巍巍、STEPVR创始人、总裁郭成展开对话,圆桌由「市界」内容总监田晏林主持。
在“AI+”异想实现的过程中,企业与个人该怎么做才能同时抵达效率最大化和技术向善的彼岸?在圆桌对话中,各位嘉宾共同畅想了未来AI世界的雏形,并分析解读了ChatGPT对各自行业的影响,以下是星尘数据创始人、CEO章磊的部分观点。
Q:在AI技术浪潮向前奔涌的时刻,许多人对未来感到疑虑:如果大模型最终与千行百业深度链接,人类是否会真的面临自身工作被取代的风险?
A:“我常说懒惰是第一生产力,你必须‘聪明地懒’,才能前进和成长,ChatGPT其实给了我们一个‘懒惰’的机会,我们不用再去做重复的工作了,而是去发挥人类独有的创造力和想象力,最终更好地实现价值,提升人的效能。其次,从最终局来说,机器仍然无法取代人类,为什么?以触觉为例,人体皮肤能够感知到极其微小的、微牛顿级别的刺激,这是基于人类身体的细胞实现的,也是机器无法实现的。人是上帝创造的最精妙的“机器”,人的创造力、想象力,是机器永远无法赶超的。如果机器做到这一点,那它就是人类。我们今天看到机器好像能做很多我们原来能做的事情,引发了一些担忧,但是历史上这样的时刻已经经历了很多次,工业革命、电气革命、信息革命,人类一步一步都走过来了。所以我们一定要相信,这个东西只是帮助我们进化得更快,让社会发展得更快。
Q:有一些行业大佬说,首先被替代的一些职业/人力是一些不会写提示词的人,未来人类在跟机器打交道的时候,咱们企业能够提供什么样的服务,充当了怎样的角色?
A:星尘做的事情,就是让用户忘记提示词,可以自然地调用大模型的能力和知识。这就说到了星尘创业的初衷,其实当年我从硅谷回来,在国内做了一家和股权投资相关的AI公司,需要分析大量NLP方向的数据,但是我发现找的第三方标注人员往往只能提供人力外包,干苦力活,提供的数据没法和我的算法进行交互,而我们需要的是能发现数据规律的数据服务。当时找了很多家以后都不是很满意,就决定这个事情还是自己干吧,而且将来的AI越来越聪明,对数据的要求也会越来越高,市场也会越来越大,所以星尘成立之初的定位就是成为数据策略的专家。当时大家都不懂什么叫数据策略,很抽象。到了今天大模型的阶段,这个概念就很好解释了,在模型创造过程中,所有跟数据相关的事情都需要策划和设计,这就叫数据策略。
我们把数据层分为三层,公开域的数据我们称之为零层。私有创建的、但属于创造公共能力的数据我们称之为一层,比如语文、数学、化学、做诗、写代码,这些能力方面公开的数据不够好、不够多,需要我们去创造或者编纂,也可以叫做中间层。二层就是企业私域的数据,未来大模型落地,多数企业要进行私有化部署,需要构建专项的数据。数据层除了零层的数据,一层二层的数据都需要进行创作、编纂、设计、对齐人类偏好,保证无害性、无毒性,并且对接到企业内部的RPA、API,或者是企业内部的知识库。在这整个过程中大模型每一个任务的设计、每一个能力的数据、怎么去人机协同降低数据生产的成本,星尘都扮演了非常重要的角色。而且我们欣喜地发现,我们的客户已经从原来的BAT、头部AI科技公司,转向了AI普惠的阶段,各行各业的公司都需要AI,都需要我们这样的数据策略专家来帮助他们做出更好的、可落地的大模型。
Q:在人工智能飞速发展的同时,行业也在讨论一些社会伦理的问题,有一些专家提醒说,不要过度开发人工智能,企业怎么看待市场这种担忧,以及如何把握开发的尺度?企业去做人工智能的边界和底线在哪里?
A:星尘的一个重要目标就是AI向善,我们希望AI是来推动人类进步的,而不是滋生犯罪或者其他不道德的事情。我相信一些大佬提出阻止AI发展,想阻止的是AI被用于非法的事情或者不利于人类社会发展的事情。星尘在数据安全这方面是非常重视的,因为我们是一家数据生产和数据服务的公司,所以我们首先要确权,确认数据是谁的。第二,在大模型的环境下,不仅仅是数据和代码的确权,还有模型的确权,模型是谁的,可以怎么用,在这方面我们也非常尊重原作者在科研学术方面的意图。第三,我们也看到很多好的方向在逐渐冒出来,比如有演讲嘉宾提到的可汗学院,虽然说教育行业经历了最近几年的洗礼和整顿,但我觉得越是绝望的时候越看到了大模型对于教育、对于人类知识传播,还有对于外语学习有很强的辅导和定制化的作用,星尘也是非常乐于参与到这些数据制作以及模型训练的过程中,推动人类社会的发展。
Q:描述一下畅想当中未来AI的世界应该是什么样子?
A:我们认为LangChain、Chain of Thought(思维链)这个方向非常值得关注,因为它创造了一个agent,相当于给一个智慧的大脑赋予了眼睛、鼻子、手,可以有感官、观察、回忆、反思和决策,通过添加中间推理过程,用向量数据库大幅提高LLM的推理能力。CoT在各个模型大小上提升了常识推理的能力,甚至理解超过人类;问题越复杂,提升效果越好;模型规模越大,提升越明显。所以在多模态、Plugin、Langchain Agent、无限上下文、Self-instruct、CoT、向量数据库的加持下,通往AGI的七龙珠已经聚齐了,马上就会有一个AI本质的爆发。