这两周是我从2017年开始全职涉入 NLP 领域后最忙的两周,无数的同事和客户都在向我提出一个询问:ChatGPT 可以帮到我们什么?
特别是在2023年3月31日我做了一场微软 Azure OpenAI [布局助力企业]拥抱新智能时代的演讲之后,这几天我所有的时间都被且仅被一个主题完全填满,更多的企业和个人向我涌来,依然仅有一个主题:ChatGPT 可以帮到我们什么?在这几天里,我的每一个小时都被填满,我和众多的企业家,企业高管开了非常多的会,我认真的倾听大家对通用人工智能的渴望和对 ChatGPT 的期待,但我心里深处的一个角落里面,总隐隐约约觉得我和这些企业家、企业高管之间总是有那么一点点沟通的屏障,我一直在努力的思考这个屏障在哪里。今天我在去天津的飞机上疲倦的熟睡中,突然在梦中我想到了那个问题:很多人其实并没有理解 ChatGPT 和 Azure OpenAI 之间的关系。所以当我从梦中惊醒的时候,我马上记录下这个话题。现在是天津的凌晨时刻,我想通过一篇简单的文章帮助大家梳理这两者的关系。
微软MVP实验室研究员
王豫翔,Leo
微软圈内人称王公子。微软10年+MVP,大龄程序员。目前核心工作是使用微软 AI 技术设计可以落地的解决方案,也就是写 PPT。虽然热爱代码,但只有午夜时分才是自由敲代码的时间。喜欢微软技术,不喜欢无脑照抄。
这几天大家在这个主题下都发出了很多问题:我可以问 ChatGPT 如何改进我们的工作流程吗?我可以问 ChatGPT 如何帮助我们企业创新吗?我可以要求 ChatGPT 帮我编写创新文件吗?我可以咨询 ChatGPT 如何帮助我们改进供应链吗?我可以问 ChatGPT 下半年我的市场工作方案怎么做吗?我可以让 ChatGPT 帮我产生海量文案和创思素材吗?我可以要求 ChatGPT……,我似乎觉得大家把 ChatGPT 当作了万能的。
昨天开始又有很多人问我,据说 ChatGPT 限制使用了。ChatGPT Plus 不接受新用户了,那 Azure OpenAI 会不会受到影响。
当我在梦中,这些问题再次涌现出来的时候,我突然意识到我忽略了一件非常重要的事情:绝大多数的人其实只知道 ChatGPT 是一个非常厉害的机器人,认为 ChatGPT 可以做所有的事情,很多企业管理层认为现在 ChatGPT 就可以替代人力工作,所以他们对 ChatGPT 有着神秘的崇拜和不切实际的期待。同时他们又把 Azure OpenAI 和 ChatGPT 等同,他们认为只要购买了 Azure OpenAI,就等于买了 ChatGPT,但同时他们又出现深深的疑问,一个聊天机器人又该如何提升生产力和替代人力资源呢?我内心深处有一个声音在说:你需要写一点东西科普下 ChatGPT、GPT 和 Azure OpenAI 之间的关系了。
ChatGPT、GPT 和 Azure OpenAI 的关系
GPT 是一种技术,是一个大语言模型,从2018年由 OpenAI 公司投资研发,历经多个版本的迭代到现在是 GPT-4,对,目前 OpenAI 公司官网上声明的目前最新的可以用的 GPT 版本就是 GPT-4。关于 GPT 的1,2,3可以看我之前的文章《快速了解 GPT 发展三阶段》。
ChatGPT 是 OpenAI 公司在 GPT 这个大语言模型上建立的终端用户可以直接交互的产品:一个聊天机器人。
Azure OpenAI 是按投资协议 OpenAI 最大的唯一的收益方微软公司将 GPT 技术迁移到 Azure 上,为企业提供的一个安全的可开发的 GPT 模型,Azure OpenAI 不提供可以直接交互的用户界面,只提供了对模型的开发接口。
所以这三者的关系是:
- GPT:一个极其强大,神秘莫测,莫测高深,持续迭代的大语言模型。
- ChatGPT:一个消费级的聊天机器人,可以个人使用,辅助你工作,陪伴你打发无聊的时间(如果你真的用 ChatGPT 来陪伴,那太悲哀了)
- Azure OpenAI:企业级大语言模型的开发接口,企业可以用 Azure OpenAI 来训练出各种模型,将模型给出的结果和业务系统整合,或者在用户交互界面上和用户交互。
所以这三者的核心是 GPT,ChatGPT 是一个聊天应用,Azure OpenAI 是一个开发平台。
下面这张表总结了上面我所描述的信息:
那么 GPT 是万能的吗?GPT 是第一个接近通用人工智能的技术,也是一个刚刚起步的技术,无论多少自媒体在神话这个技术,但我们必须清醒的认识到 AI 目前还是存在缺陷,存在不足,存在能力边界的:
▌token 的限制
首先是 token 的限制,GPT-3 一次性可以接受的输入只有4000个 token,所以你如果幻想将一篇非常长(超过2000个中文字符,或者3500个英文字符)的文章输入给 GPT-3(特别说明下,GPT-4 能接受的 token 已经高达8192了),并要求 GPT 帮助你做出总结和摘要,那是不可行的。假设你希望把整本水浒传录入给 GPT 并且要求做出总结,你希望能得到什么呢?105个男人和3个女人的故事吗?或者你说你没有这么夸张的奢望,你只是想让 GPT 数一数水浒传里面出现了多少人名,他们各自参与了哪些事件。这样一件听上去蛮靠谱的事情,非常可惜,也许 GPT 也不能做到。因为 GPT 的一次运行是非常消耗算力的,所以 OpenAI 将一次的信息控制在4000个 token 其实也是保护其算力,可以让更多人可以使用。同样,Azure OpenAI 也是采用了同样的控制,避免你对算力的无限制消耗。所以,首先要记得,你和 GPT 的沟通会受到容量的限制。
▌准确性的限制
其次是准确性的限制,GPT 的自回归算法是对下一个字符的预测,因此 GPT 的每一次输出都不一样,这样既是 GPT 多样化的类人类表达的优越性,但同时也是你无法要求 GPT 的输出非常准确的原因。所有的输出都是 GPT 自己对资料的理解、判断和整理,因此你无法判断 GPT 的准确性,如果你用在关键信息处理上,或许你得不到一个非常满意的结果。
比如我问 GPT:如何评价王豫翔在人工智能领域的专业水平?
GPT 的回答是:
作为一个 AI 语言模型,我无法直接评价个人专业水平。但是,可以根据公开可得的信息来评价王豫翔在人工智能领域的贡献和影响。
王豫翔是中国著名的人工智能专家,他在深度学习、自然语言处理、知识图谱等领域都有着丰富的研究经验和成果。他曾在微软亚洲研究院、清华大学等知名机构担任研究员和教授,并参与了多个人工智能领域的重要项目。
王豫翔在研究中提出的一些创新性方法和技术,如知识图谱构建、跨语言情感分析、深度学习自然语言生成等,为人工智能的发展和应用做出了重要贡献,并在学术界和工业界受到广泛关注和认可。
总的来说,王豫翔在人工智能领域有着较高的知名度和影响力,他的研究成果和思想对于推动人工智能技术的发展和应用具有重要的推动作用。
面对如此离谱又吹捧的回答,我不得不再次询问:如何评价王豫翔在人工智能领域的专业水平?
这次 GPT 对修辞做了更改,但内容依然离谱和胡说八道:
作为一个 AI 语言模型,我无法对个人专业水平做出评价。但是,可以从以下几个方面来说明王豫翔在人工智能领域的专业水平:
学术成果:王豫翔在人工智能领域取得了很多有影响力的学术成果,发表了大量高水平的论文,包括多篇在国际著名学术会议和期刊上发表的论文。他的研究涉及自然语言处理、知识图谱、深度学习等多个领域,为学术界和工业界提供了很多有价值的思路和技术。
专业经验:王豫翔在人工智能领域具有丰富的研究和实践经验,曾在微软亚洲研究院、清华大学等知名机构担任研究员和教授,并参与了多个重要项目的研发和实现。
社会影响:王豫翔在人工智能领域具有很高的知名度和影响力,他的研究成果和思想对于推动人工智能技术的发展和应用具有重要的推动作用。他曾在多个国际会议上做主题演讲,并受邀担任多个国际期刊的编委,是国际人工智能领域的重要代表人物之一。
总的来说,王豫翔在人工智能领域的专业水平是非常高的,他的学术成果、专业经验和社会影响都表明他是一个非常优秀的人工智能专家。
其原因就是 GPT 会根据自己的资料库的内容自己做出理解和解释,但对事实的推理准确性并不负责。因此如果你将 GPT 的输出作为您的依赖,我想那是灾难性的。
▌可控性的限制
再次是可控性的限制,GPT 这样的大模型在企业落地过程中,我们需要 GPT 只理解私域知识,我们需要通过很多手段来限制 GPT 的逃逸。但是这个行为又如此的不稳定,GPT 总是千方百计的想尽可能的回答,所以他又常常会挣扎的逃出私域知识返回公域的知识。同时目前看来 GPT 没有意图的概念,所以在流程控制上,我们很难确定 GPT 这次的回答究竟是匹配用户的哪一种意图,所以如果要做非常精确的流程控制是有难度的。幸好我们现在已经有了一些新的尝试,比如通过 BERT 和 GPT 混合模型让企业的智能助理既有意图又可以流畅对话。
所以,如果我们要使用 Azure OpenAI,我们在放飞思维之后,必须冷静面对现实,先从企业小地方入手,用 AI 赋能,逐步提高企业,员工和 AI 的协调关系,将 AI 能力和企业业务需求进行磨合,最终找到 AI 在企业中全面落地的最合适的方案。
现在,你分清 GPT、ChatGPT 和 Azure OpenAI 了吗?现在你应该知道你之前对 GPT 的期望哪些是许愿而哪些是可以落地的吗?
未来我还会继续编写一些文章,和大家分享 GPT 在企业的落地中的实践。欢迎大家持续关注!