导语 | 编写代码、翻译小说、参加考试……2022 年末,人工智能聊天机器人 ChatGPT 风靡全网。自 2016 年 AlphaGo 击败围棋世界冠军李世石后,ChatGPT 再次掀起了人工智能发展应用的高潮。它将会给我们带来哪些影响?人工智能的颠覆性应用是否即将来?ChatGPT 的未来发展潜力及前景如何?我们特邀腾讯云 TVP、PreAngel 合伙人 李卓桓老师,以 ChaBot 领域专家视角,分享他对ChatGPT 发展的独到见解。
作者简介
李卓桓,腾讯云 TVP,PreAngel 合伙人,专注人工智能领域的聊天对话创业机会和早期项目。zixia BBS、优酷网(首席科学家)、叽歪网创始人,水木清华 BBS 站长。清华大学本科,中欧国际工商学院 EMBA。15 年互联网创业经验,多家创业公司和 VC 机构顾问。创业邦、创业家、新浪网等媒体都对他作过创业特别报道。25 年编程经验,曾任 ChinaRen 系统工程师。Microsoft Regional Director,Google 认证机器学习开发者专家(ML GDE, Machine Learning Google Developer Expert)。活跃在 Open Source 社区,创立发布的 Chatbot SDK 开源项目 Wechaty 已在 GitHub 上拥有近万 Stars 数。荣获 2020 年中国优秀开源项目,中国开源先锋等奖项。《Chatbot 从 0 到 1》、《简明的 TensorFlow 2》联合作者。
其它两位联合作者:
Siky Lin,毕业于斯坦福大学数据传媒系,曾就职于硅谷多家著名风投机构与独角兽,现任硅谷独角兽 Moveworks 市场战略高级经理;
ChatGPT by OpenAI: 以下全文由 ChatGPT 辅助撰写。
一、ChatGPT:人工智能技术的重大突破
随着近来 ChatGPT 的爆红,很多程序员都争先恐后去领略它的超高情商和巨大威力,而 ChatGPT 输出的答案或偶尔幽默,或时而深刻,我们甚至很难分清与它对话的究竟是人还是机器。
实际上,人工智能(AI)在过去几年承载了许多希望与失望。一开始很多人认为 AI 可以如电影所设想那样在不远的将来改变世界,甚至比人类更强从而统治主宰人类世界。然而在过去几年我们发现,现有科技能开发出来的 AI 只能替代人类从事一些最基础的生产活动,仅仅停留于一个三岁婴儿般的智力。而开发这样一个“人工智障”,我们需要花费大量的资本支持来突破极限的算力跟最顶级的科学家做最前沿的研究。这与之换来的结果却是投资人寄予厚望的高估值科技公司在过去几年并未能开发出大家期待的 AI 产品。
其实,推出 ChatGPT 的是硅谷一家于 2015 年初创的公司 OpenAI,它在成立后便默默研发其人工智能技术。虽然公司花费了大量投资人的资金,同时也聚集了最顶级的科学家研发,然而外界对 OpenAI 的研发进展却始终所知甚少。
然而,就在两个月前,OpenAI 推出了接近通用人工智能的产品 ChatGPT,这是一款基于聊天界面的 Chatbot,在 2022 年 12 月 2 日开放免费试用网页版后,上线短短 5 天,用户数量已突破百万。这款产品的试用结果铺天盖地,且在社交媒体上大受欢迎,各种技术大牛和行业领军人物纷纷分享他们的使用体验。
(图1,一个 ChatGPT 为博客起标题的例子)
ChatGPT 的推出无疑标志着人工智能技术的重大突破,OpenAI 的研发团队在经过多年的不懈努力和研究之后终于成功打造出一款具有高度自然语言处理能力的人工智能产品。这款产品具有非常高的自然语言理解和生成能力,可以帮助用户在日常对话中进行有效沟通。并且,这款产品还具有非常强大的学习能力,能够不断地学习和改进自己的知识体系。
在 OpenAI 发布这款产品后,人们除了对此感到震惊、兴奋外,甚至还有些恐慌。原因在于这款产品作为人工智能技术领域中罕见的突破之一,它不仅让我们看到了人工智能未来发展的曙光,也让我们窥探到了人类未来在人工智能驱动下将如何发展。ChatGPT 的推出不仅为 OpenAI 公司带来了巨大成功,也为人工智能行业的发展铺平了道路。
二、风靡全网的ChatGPT为何一夜走红?
ChatGPT 是 OpenAI 公司开发的自然语言处理模型,它是 GPT(Generative Pre-trained Transformer)系列的最新版本,具有强大的语言理解能力和自然语言生成能力。
过去两个月时间里,ChatGPT 在科技领域引起巨大的反响的原因,主要在于它具有以下三个显著特点:
- 数据量庞大:ChatGPT 模型训练使用主要来自互联网的文本数据库,包括从书籍、网络文本、维基百科、文章和互联网上的其他文章中获得高达 570GB 的数据。 更准确地说,系统输入了 3000 亿个单词,这使得它能够更好地理解和生成人类语言。
- 预训练技术:ChatGPT 模型采用了预训练技术,能够在训练过程中学习大量的语言知识和经验,使得它在解决实际问题时更加准确和高效。
- 多任务能力强:ChatGPT 模型能够完成多种自然语言处理任务,如文本生成、问答、机器翻译等,其中,它在文本生成的任务上表现最为突出。
值得一提的是,ChatGPT 还开放了免费无门槛试用,任何用户都可以直接体验它的威力并分享试用体验。这相当于,OpenAI 每天都要燃烧超过三百万美金的经费以供大家试用。当然,我们看到的结果也是十分惊人的,它既可以吟诗作赋写广告,又可以根据你提的需求写代码。ChatGPT 展现的语言理解和生成能力,丝毫不亚于任何行业初级人员对专业领域的基础输出。过去,或许只有专业的 AI 研究人员才能体会其进展,但在现在,我们每一个人都能亲自体验。
其实在 ChatGPT 问世之前,美国不少科技初创公司就已经在使用 GPT 模型,成为 OpenAI 的付费用户。在此基础上,OpenAI 巧妙地加了一层可以聊天问答的界面让大家可以方便简易地使用,从而命名为 ChatGPT。GPT 作为一种学习训练了大量数据的基础模型,主要可以为以下几个场景赋能:
- 文本生成:如自动生成新闻报道、自动摘要等,可以有效帮助提高文本内容的生成效率。
- 自动问答:如智能问答系统、聊天机器人等,可以帮助公司提高客户服务质量跟速度。
- 自动写作:如文案创作、文章摘要、邮件自动回复等,可以帮助用户提高内容创作效率。
Jasper.ai 便是 ChatGPT 的场景应用典型代表,估值 15 亿美金的新晋独角兽 Jasper.ai 直接应用了 GPT 模型,并开发了市场营销的大量应用场景,可以让用户用它直接撰写广告标语、博客、社交媒体帖子和电子邮件等。这让市场营销的人员有了一个可以帮他们干活写作的小助手,ChatGPT 的基础版本为每月 40 美金,比雇佣一个实习生还便宜很多。Jasper.ai 目前已经有了超过 10 万付费用户,并且在 2022 年实现了超过 100% 的增长。其实,Jasper 的创始人 Dave Rogenmoser 就出身于市场营销领域,他并不是专攻人工智能开发的专家,但仍可以借力 ChatGPT 来实现成功。同时,Jasper 也需要面临许多竞争对手的同质化问题,如Copy.ai,WriteSonic, Peppertype, Wordtune,Simplified 等这些创初公司,它们也都在逐渐推出类似的产品。
(图2,Jasper.ai 的产品覆盖简介)
我们相信在未来几年,将会有大量基于 GPT 模型的初创公司涌现。因为 GPT 的提升让许多公司可以极大地减少自己开发人工智能的底层模型成本,从而可以集中人力物力研究商业应用场景,使产品的推出与迭代更新得更为迅猛。
而 ChatGPT 的出现,毋庸置疑更是把 GPT 模型具象化了,它能够让各行业人士直接体会到它的魅力。例如,它可以让很多不是专业的 AI 开发人员,但对特定垂直领域有深入洞见的人,可以跳过长期艰难的技术开发,通过直接套用 GPT 模型,结合其它如软件自动化的技术,迅速推出适应于各垂直领域的智能小助手。这就像当年乔布斯推出了苹果智能手机,虽然引发了科技圈的震动,但短时间内大家并不知道这意味着什么。直到又过了几年,我们看到了传统手机厂商如诺基亚怦然倒下,同时也带来了轰轰烈烈的移动互联网时代,大量基于手机应用的初创公司如雨后春笋般涌出,彻底改变了我们的衣食住行。现在的我们难以想象,如果没有智能手机的普及,我们出行无法打车、用餐不能点外卖,购物也难以进行电子支付将会是怎样的生活。
同时,也有不少人开始质疑 ChatGPT 的推出是否会导致大量已有的 Chatbot 公司消亡。然而,现状却是 ChatGPT 把大量现有的 Chatbot 公司带火了。专注做 Chatbot 的科技公司纷纷宣称,ChatGPT 将加快他们的研发进程,不仅不会让他们消亡,反而会让他们更快地迭代产品,更好地服务客户。
三、未来GPT模型时代下,科技公司谁与争锋?
实际上,OpenAI 创始人 Sam Altman 曾在某采访中暗示, “中间层”(middle-layer) 的初创公司将会在未来脱颖而出。
假设存在底层和顶层类别的公司,首先,他认为,“底层”(bottom-layer)试图从零开始构建自己的 LLM (Large Language Model)的公司不太可能成功。因为建造这些模型的成本太高并且没有必要,这些模型已经可以直接获得。在当今世界中,这类似于在 AWS 和 Azure 已经存在的情况下建造自己的数据中心。其次,顶层(top-layer)这一类公司将是短暂存在的 API 调用者,称之为顶层公司。这些公司直接使用现成的 GPT 模型进行应用。简单的直接调用其模型 ,没有其他技术壁垒或者创造超级价值给消费者,这些公司将会有短暂崛起,但终将消亡。除非这些公司能够找到成为中间层公司的方法。
那么,“中间层” 公司是什么,成为它需要什么?在我看来,中间层公司有几个关键成分:
- 独特的垂直领域知识或者数据。
- 强大的机器学习基础设施。
- 垂直领域相关的专业人才。
这种公司将能够采用 GPT 类模型,并提高这些模型在其垂直领域的性能,比如说在医学领域跟计算机编程领域。在不久的将来,这些中间层公司的应用将看到由 GPT 驱动的独特高度差异化的用例。使用 GPT 作为基础模型,并使用专有训练数据或者垂直领域洞见创建新模型,这将是非常强大的。微调模型并不简单。硅谷致力于用 Chatbot 解决企业 IT 问题的独角兽Moveworks 创始人表示,他们已经采用 LLM 并微调它们多年,需要在人员和基础设施上进行数年的重大研发投资才能实现。
(图3,Moveworks 发布的其训练模型演变路径)
ChatGPT 虽然看起来好像上通天文下知地理,但在特定领域,它仍然还是个小孩,特别是与专业商业场景结合和缺少公开网络数据的领域,它容易一本正经胡说八道。自从开放免费测试版以来,大家讨论最多的问题就是 ChatGPT 是否会成为让谷歌过时的智能问答机器人,就像谷歌在过去 10 年颠覆了当年如日中天的雅虎一样,也许谷歌在不久的将来也会被 ChatGPT 颠覆。
与谷歌不同,ChatGPT 不会在网络上抓取时事信息,它的知识仅限于其语言模型在 2021 年之前学到的东西。如果你问 ChatGPT 任何关于未来的预测或者实时信息,它是无法解答的。例如,你问它美国加州最好的餐厅是什么,因为这个答案是会根据时间的变化而改变,所以 ChatGPT 会告诉你它无法回答。OpenAI 也公开承认指出当 LLM 用于特定商业场景的时,比如在商业环境中回答员工 IT 问题或在医疗环境中提供自动化的患者支持时,由于其模型只学过公开数据中的片面知识,很可能会给出一个错误或者片面的答案。
不过,OpenAI 才刚刚给世人展示它多年炼丹的成果。GPT-4,OpenAI 公司大型语言模型的下一个版本很可能会在 2023 年推出。根据《连线》杂志的消息,GPT-4 将拥有 100 万亿个参数,而 ChatGPT 目前训练的参数为 1750 亿个。从这个数字来看,GPT-4 的参数数量约为GPT-3 的五百倍。众所周知,参数数量越多,模型就能够学习到更多的知识和模式,从而提高它的性能,这也意味着 GPT-4 将拥有更强大的学习能力,并能够处理更复杂的任务。
AI 从量变达到质变的时刻正在步步逼近,大量基于 Conversational AI 的应用场景将会在未来五年出现井喷,让我们拭目以待。