3 月,随着 OpenAI 新一代模型 GPT-4 以及百度“文心一言”的正式公布,通用人工智能 AGI 的概念再次点燃全球社交平台。从最初的文字对话到如今的看图写代码,AGI 领域终于迎来了属于自己的“iPhone 时刻”,而对话式 AI 这一充满无限可能的 AI 类型也再次展现出融合未来趋势的美妙图景。
本月初,人工智能聊天机器人公司 Character.ai 获得一笔超 2 亿美元融资,由 a16z 领投,其联合创始人 Mark Andreessen 将加入 Character.ai 董事会。作为一家成立不到一年的公司,Character.ai 在 0 收入的情况下达到 10 亿美元估值,并得到资本巨头青睐,发展不可谓不快,但其业务却非常“简单”——创建人人可用的 AI 聊天机器人。
在 Character.ai,你可以和任何你想到的人物对话,无论是现实中的埃隆·马斯克还是漫威电影里的托尼·史塔克,任何人都可以创建属于自己的虚拟人格并与其对话,对方则会代入对应的身份和语言风格,看似简单的业务背后是真正的千人千面型 AI 未来。打造这一宏大目标的是谷歌早期员工之一,也是 Transformer 作者之一的 Noam Shazeer,从谷歌离开之后,他的对话式 AI 如今成为投资领域关注的焦点。
纵观全球,个性化聊天机器人作为流行趋势已愈发明显。从海外的 Character.ai 到 Replika,各自都在探索“人人享有各自专属 AI 聊天机器人”的未来,而回望国内,该领域的发展也日益受到投资者关注,无论是自微软小冰团队独立的小冰公司,亦或者是由清华大学黄民烈教授创立的聆心智能,近年来都正逐渐成为新一轮革命的先行者。
对话式 AI 价值凸显
近两年,以 OpenAI 为代表,对话式 AI 成为资本领域的香饽饽。今年 1 月,微软确认了对 ChatGPT 母公司 OpenAI 的新一轮数十亿美元投资,而 Character.ai 在 0 收入的情况下也于今年 3 月完成超 2 亿美元融资。根据 PitchBook 统计数据,2022 年投资圈向生成式 AI 的投资总额达到 13.7 亿美元(折合人民币约 93.69 亿元),几乎为过去 5 年的总和。
这其中,对话式 AI 以自然语言处理技术(NLP)为核心,使机器可以理解、反馈人类语言并从交互中学习,最终实现人与机器之间的自然对话,成为众多企业冲击的技术领域。然而,很长一段时间里,对话式 AI 作为和人们日常距离最近的 AI 技术类型,一直被认为“不聪明”“没有条理”。这是由于对话本身是语言处理中最困难的任务,早期聊天机器人的表现都比较刻板和机械,以“关键词 + 模板”为主,将输入语句与预先定义的 FAQ 知识库进行匹配,但在随后,对话式 AI 的发展过程不断提速,共经历四个阶段:
-
规则引擎阶段:这一阶段主要是基于规则的对话系统,即设定一系列规则和模板,用于响应用户的指令和问题,但是由于规则的限制和模板的创新难度,导致该阶段的对话系统具有很大的局限性。
-
统计学习阶段:随着机器学习和自然语言处理技术的发展,人们开始尝试使用统计学习方法来构建对话系统,主要是基于概率模型的统计语言模型,如隐马尔可夫模型和条件随机场等,但是由于数据和算法的限制,该阶段的对话系统仍然存在很多问题。
-
深度学习阶段:随着深度学习技术的发展,人们开始使用神经网络模型来构建对话系统,主要是基于序列到序列模型和变形自编码器模型,如 Google 的 Seq2Seq 和 Facebook 的 FastText 等。这一阶段的对话系统在理解上下文和语义的能力方面取得了很大的进步,但是在生成多样性和流畅度方面仍然存在一定的问题。
-
GPT 模型阶段:近年来,以 OpenAI 的 GPT 模型为代表的大型预训练模型的出现,使得对话式 AI 的生成能力和智能水平得到了飞跃式的提升。目前,GPT-3 和 GPT-4 已经可以实现高度流畅的对话和知识问答,并逐渐应用于多个领域。
对话式 AI 的发展经历了从规则引擎到统计学习,再到深度学习和 GPT 模型的阶段,随着技术的飞跃,其应用场景和智能水平也不断扩展和提高。
根据《AI 对话系统分级定义》,过去,只能够完成单一场景下的对话在 L1 和 L2 之间。当问题数量多、语义复杂时,拦截率较低,难以快速实现响应,客户满意度低,且维护成本较高。
如今,随着大模型的发展,从数据、算法、算力等方面使对话式 AI 产生巨大变化,ChatGPT 为代表的的 L4 级别对话式 AI 无疑是工程、技术、数据等方面的综合成功,并朝着 L5 级别进一步迈进。
如今,对话式 AI 在行业垂直类应用上已展现出其价值。以 Character.ai 为例,通过搭建端到端的工程栈,覆盖模型的研发与训练、数据、应用整条价值链。用户不仅能够随意与平台上训练好的海量对话式 AI 角色进行对话互动,还能够训练自己需要的任何虚拟角色,并保持角色的属性一致性。这些产品特性不仅将 Character.ai 自身的能力无限延伸,也保持了较高的用户黏性。在外界看来,Character.AI 拥有较大的商业发展空间,不仅能够面向 C 端以订阅式服务打造千人千面的 Ai 陪伴式应用,也能够面向 B 端用户打造符合其定制特性的个性化 AI 形象。
无论智能客服、IoT 语音助手、医疗诊断还是金融风险评估等领域,其商业价值快速提升,投资潮也随之爆发。而对千人千面的 AI 聊天机器人来说,其价值不仅在于简单的问答,还能够根据用户的口吻、情感等进行情感分析和智能回复,提升用户体验的同时,进一步融入更多领域。
国内对话式 AI 争先冒头
放眼国内,对话式 AI 的市场潜力也不可小觑。根据利文联合头豹研究院发布的《人工智能系列报告:2021 年中国对话式 AI 市场报告》数据,2021 年,中国对话式 AI 市场规模为 82.7 亿元,到 2026 年,这一数字有望增长至 265.8 亿元,年复合增长率高达 26.3%。
与此同时,国内巨头“跑步入场”对话式 AI 领域,百度、阿里、字节、京东等大厂接连入局,各大 AI 创企也不甘落后。今年以来,以百度“文心一言”、复旦团队的“MOSS”为代表的功能型语言大模型路线,和以小冰公司“小冰岛”、聆心智能团队“AI 乌托邦”等代表的拟人型语言大模型路线受到了广泛关注。随着众多玩家广泛深入,创新项目不断涌现,但无论是大型企业还是创业公司,在人才建设、技术突破、商业模式等方面都处于早期阶段,更需要长期坚持、投入和创新。
国内,早在 2021 年小冰公司发布了全球首个 AI 社交平台“小冰岛”。在该平台中,人类用户可以创造各种人工智能个体,并形成一个共同生活的社交网络。在大模型领域,小冰公司发布了“小冰链”。小冰 CEO 李笛指出,小冰链采用自然语言处理技术,能够理解用户的问题,并给出相应的答案。此外,小冰公司在检索模型、生成模型、大模型和 X-CoTA 等方面也实现突破,于 2022 年宣布完成了总额 10 亿元人民币的新融资。
北京彩彻区明科技在 2021 年推出的“彩云小梦”,基于常识和小说语料训练的中国本土语言模型在续写生成方面相比 ChatGPT 也有着不错的表现。其核心逻辑是用户输入一段文本,就可以用 AI 续写一段文字,用户还可以任意的增删改。2022 年“彩云小梦”推出了 2.0 版本,用 NLP 技术驱动对话场景,在情节续写的基础上实现用户与 AI 虚拟人物的对话,提供更多互动性和情感陪伴。
相较于前两者,2022 年 11 月上线的 Glow 属于“新玩家”,但吸引了部分 Z 时代年轻用户。该产品和 ChatGPT 百科全书一样的回答不同,其定位为 AI 虚拟聊天社交软件,主打聊天、陪伴等情感功能。GLOW 背后的公司 MiniMax 成立于 2021 年 12 月,以实现 AGI 为目标,由前商汤副总裁闫俊杰创立。在 2022 年上半年由明势资本领投了天使轮融资,此前米哈游参与了对 MiniMax 的两轮投资,目前正在谋划与红杉资本共同发起新一轮投资。
2022 年 12 月上线的“AI 乌托邦”则对标 Character.AI,由清华大学黄民烈教授创立的聆心智能团队推出,通过小程序和网页端向公众开放,也引发了 Z 世代用户群体的广泛关注。该产品基于聆心智能团队自研的超拟人大模型,根据大模型可控、可配置、可信的核心技术优势,优势在于允许用户快速定制 AI 角色,提供千人千面的 AI 形象,不仅能够满足用户聊天、陪伴的情感需求,还能够提供与 ChatGPT 相似的助理、百科功能。
对话式 AI 成为泡沫还是希望?
2023 年作为经济全面复苏和发展的重要一年,数字化转型成为当前中国经济发展的“主旋律”, 其中人工智能技术在数字经济建设中发挥着重要作用。
我国曾提出《新一代人工智能发展规划》,明确“三步走”战略:2020 年实现我国人工智能总体技术和应用与世界先进水平同步;2025 年实现我国人工智能基础理论重大突破,部分技术与应用达到世界领先水平;2030 年实现我国人工智能理论、技术与应用总体达到世界领先水平。2022 年,科技部等六部门联合印发的《关于加快场景创新 以人工智能高水平应用促进经济高质量发展的指导意见》,围绕构建全链条、全过程的人工智能行业应用生态建设十大示范场景,为加快推动人工智能应用。在这样的政策背景下,人工智能技术在助力稳定经济当年发挥积极作用,同时为培育新的经济增长点保驾护航。
从市场前景来看,据 IDC 研究预计在未来 5 年内,对话式人工智能在金融、零售、制造、医疗、政府和教育等六大行业至少会带来 30%-64% 的价值提升。随着技术的不断发展和普及,对话式 AI 已经在许多领域展现出了它的巨大潜力,如客户服务、医疗诊断、教育培训等。对话式 AI 不仅可以为用户提供更加智能化、个性化的服务,还可以帮助企业降低成本、提高效率,对于推动产业升级和经济发展具有重要的作用。
与任何新兴技术的出现一样,对话式 AI 仍存在一定的挑战。
从技术方面来看,目前的对话式 AI 还难以完全替代人类的智能,特别是在情感理解、判断和创造性方面。其次,对话式 AI 的普及和应用还存在一些法律和道德问题,如数据隐私、安全性、责任和权益等方面。这些问题需要得到社会和政府的关注和解决。
从应用层面来看,一是语言输入的问题,目前的对话式 AI 产品,仅支持正式的文本或语音,这提高了用户的使用门槛,一些方言、口音等语言会影响 AI 对原始输入的理解,进而产生错误或者无效的回答。二是 AI 的输出问题,无论是 ChatGPT 还是其它大语言模型,都可能面临着胡编乱造、不安全可信的问题,这不仅需要平台在模型层面做好控制,也需要做好相关政策的治理,避免产生“有害的应用”。
以 Character.AI 为代表的对话式 AI 的出现预示着无缝人机交互时代的来临,也加速了国内外对话式 AI 领域的成长态势,但要打开市场,需要的不仅仅是模型的技术,还有场景化的应用开发。
如今,海外企业在人工智能方向的投资和热情已经从技术本身走向了如何应用落地,也为国内行业探索带来启示。清华大学计算机科学与技术系长聘副教授、聆心智能创始人黄民烈指出:“行业发展需要推动大模型整个生态的发展,不仅需要底层大模型,也需要业务、垂直场景大模型、工具层,以及直接应用型的公司。”在他看来,教育、金融、数字产业将成为大模型应用生态的重要领域。
随着高性能大模型的成本正在快速降低,未来对话式 AI 应用层的颠覆式创新或许不在技术,而在于产品设计的绝妙想法。那些更具有创业精神、产品基因的年轻团队,或许更能抓住这一次浪潮。
目前来看,行业先行者们已经初步形成以数据为核心的飞轮效应,伴随用户与平台上的虚拟角色产生互动,海量的数据成为完善其基础模型的最佳基石,正如从量变引发质变的 GPT-3 一样,在虚拟人格方面的行业进展将大大超过人们想象。
未来,随着对话服务场景的智能化和线上化,AI 对话引擎与产业深度融合将成为未来社会释放数字化叠加倍增效应、构筑综合竞争优势的必然选择,并有极大可能改变人类的生活和生产方式。而如何积极拥抱这门新的技术并通过 AI 实现更高的人生目标与价值、实现更广泛的应用并产出更高的业务价值,是个人与企业共同需要关注的命题。