距离现在差不多一年前的光景,一款叫做BB1.0(BlenderBot 1.0,后文简称BB1.0)的人工智能机器人被Facebook创造了出来。
点击下方链接,自测是否符合美国百年理工强校在线计算机硕士入学申请资格,和线下一样的师资教育,毕业后拿全日制硕士学位证书!还有更多IT大咖的热情分享,包括人工智能就业,IT互联网广告等干货知识!欢迎大家点击了解!
美国百年理工强校计算机硕士
彼时脸书公司志得意满,满口称赞这款新型机器人乃是行业之最,AI业内也是一片赞誉满堂。但旋即一年内的测试效果,让这款BB1.0与同期的GPT-3共同戴上了“人工智障”的闪耀桂冠。
时隔一年,脸书再次强推BB2.0。作为前车之鉴的续品,是一扫阴霾的力作?还是装上新瓶的旧酒?
首先,它俩为啥是人工智障
一个BB1.0,一个GPT-3;前面那个不知道全球顶流川普已经不再是美国总统,后面那个经常建议患者自杀“一劳永逸”,两个小傻“机”,在一起很欢乐。
OpenAI的GPT-3与BB1.0拥有着强大的语言系统——这使得他们可以清晰地表达自我,阐述东西道理,南北哲学。但在脸书的测试记录中,研究人员极其头疼每次与它们沟通都需要考虑短期记忆与长期记忆的构筑。由于缺乏有效的记录神经,你在2021年8月3日告诉GPT-3或BB1.0的信息,它们在2021年8月4日就会忘得一干二净。
木桶效应告诉我们,决定一个产品质量的,往往是最短的那一块木板。
由于算法的缺陷与解析的不正确,GPT-3与BB1.0往往会语出惊人。
GPT-3建议患者自杀
通过自信的陈述来表达完全不正确的信息,是这两个小家伙的拿手好戏。
由于无法获取额外的知识储量,GPT-3与BB1.0还难以与人类进行实时高效的沟通,你问它们最新热点吴姓艺人事件发展到那步了,它只会给你罗列一堆EXO的早年报道;你问他郑州洪水是否得到了有效控制,它仅能吐露出郑州几年前办的美食展有哪些菜肴。
当然,在国外人们大部分问询的都是足球明星与社会事件的新闻。
同样,GPT-3与BB1.0非常稳定的回答了一大堆时过境迁的旧往。
GPT-3与BB1.0
完全不知道一位足球明星在2021年的转会消息
当张冠李戴的发言越来越多,世人也开始确信这两个小傻“机”还是存在着很多缺陷,于是给它俩安上了“人工智障”的外号。
“人工智障”进化——人工智能?
BB1.0在脸书的不抛弃、不放弃政策上得到了资源的倾注与长期的研发。
BB1.0自然得到了成功进化——脸书公司7月份公布了BB1.0的续作:BlenderBot 2.0。
脸书嘛,大公司,有宣发团队。
高科技,不差钱,全是新突破。
一度引来了行业里的围观。
让我康康,让我康康
其产品简介是——通过大数据了解消费者行为并提供个性化推荐的人工智能产品(好长)。
BB2.0可以通过任何搜索引擎在互联网上查询电影、电视节目等相关信息,并将其读取和写入其长期本地内存存储。并通过持续学习,记忆之前讨论和输入的信息。
持续学习最早由人工智能和神经科学研究人员组成的continualAI开启研究,解决了人工智能的一大挑战问题。之前最先进的人工智能系统即使十分强大,仍然受到统计性限制,算法在数据集上只训练一次,很少再次训练,这使得其很难学习获取新信息,也是前文提到BB1.0对于信息严重滞后性的根因。
搭建持续学习技术的BB2.0沟通更为顺畅,当你在一次聊天谈到漫威电影时,下一次的对话中BB2.0便会主动提起钢铁侠等电影主要人物。
“因为它知道这和你想要聊的话题有关。”
而“进化”后更为智能的BB2.0在深层会话能力上也更进一步。
BB2.0使用基于检索增强生成的AI模型,这种方法可以生成响应并整合对话中包含的知识之外的更多延展知识。
在人类与BB2.0的对话期间,这种AI模型将信息检索组件与文本生成器相结合,在其长期记忆中以及通过搜索互联网文档找到密切相关的数据。
在BB2.0利用神经网络模块给定对话上下文的语境后,聊天机器人便将这部分检索到的数据添加到对话历史中,并由算法决定什么时候考虑引用这些知识。
这样一来便显得BB2.0无所不知,无所不晓;并且可以灵活问答,举一反三。更倾向于普罗大众认为的“人工智能”水准。
安全保障的加码
在安全保障方面,脸书也对BB2.0进行了改进与升级。
以往的人工智能模型总是会犯相同的错误,不仅BB1.0与GPT-3,大部分AI在搜集海量数据集时,都会受到大数据的影响产生一些不友好、不正确的倾向。
例如将一些“厨房”放在“女性代词”附近,将“Islam”放在“恐怖主义”附近;这些属于世俗的偏见,并且严重背离我们的价值观。
斯坦福大学的一篇研究论文显示,AI模型还会将“犹太人”与“金钱”联系在一起,“黑猩猩”与“黑人”并列在一起;这属于不可接受的种族歧视。
为了遏制与避免这种情况,脸书公司对BB2.0施加了安全配方。
这种安全配方是利用自动分类器测量,检测关键词汇与敏感文本信息,使聊天机器人做出“不正当”回应的可能性降低了90%,在避免出现不符合价值观发言的公关危机上,BB2.0的安全性提高了74.5%。
脸书研究科学家Jason Weston和研究工程师Kurt Shuster在博客中写道:“BlenderBot 2.0利用互联网和长期记忆来响应对话的方式开启了一个新的处理方式,这将更好地应对安全问题。”
写在最后
让我们回到开篇提到的问题:
BlenderBot 2.0,作为前车之鉴的续品,是一扫阴霾的力作?还是装上新瓶的旧酒?
我们可以确定的是,BB2.0采用了持续学习,突破了之前AI模型的短板,这是一个明确的进步。在后续的会话分析强化,以及安全措施的加码,也是一种不可否认的增幅。
每个人对于新AI产品的衡量标准都不一样,石破天惊还是小有突破都是一种评价标准。但正如Jason 和Kurt所言,我们的每一小进步,都是在往人工智能的最终方向前进,让智能体最终可以像人类一样理解交流与透彻对话。
所以,BlenderBot 2.0,或许也是一个实在的进步。你的看法呢?