最近给自己的公号接入了“微软小冰”自动回复这个人工智障,也有很多粉丝会在后台跟她留言互动,有时候,你会觉得她回复的真的挺像个人类的。但是当你带着她就是个机器人的主见跟她聊的时候,明显感觉她还差得远。今天就来聊聊这个还不能称之为人的小冰吧。
【小冰,微软人工智能框架少女,东方卫视主播,央美毕业生】
一、微软小冰在中国的前世今生
“微软小冰” 是微软(亚洲)互联网工程院 基于2014年提出建立的情感计算框架,通过算法、云计算和大数据的融合运用,采用代际升级的方式,逐步形成向EQ方向发展的完整人工智能体系。目前已经发展到了第七代。
2014年5月29日,一代小冰微信公测。
2014年6月25日 [35] ,一代微软小冰微博复活。
2014年7月2日,二代微软小冰正式发布,15小时内50万用户领取了自己的专属小冰。
2014年8月20日,微软小冰解锁 “小冰识狗” 图像识别系统。
2014年10月15日,微软人工智能机器人小冰联合百合网,共同推出微博“单身男女”群聊技能。 [40]
2014年11月11日,微软小冰进驻京东电商平台 。
2015年1月13日下午,微软中国和中国东方航空股份有限公司共同宣布,双方将在人工智能和移动互联网领域达成战略合作,以“微软小冰”为切入点,可通过机上WI-FI实现与乘客和空姐的互动。
2015年7月29日,微软小冰进入Windows 10。
2015年8月7日,微软与LINE正式联合发布人工智能机器人凛菜“Rinna”。 [44]
2015年8月20日,第三代微软小冰发布 [45] ,小冰回归微信平台。
2016年8月5日,升级为第四代微软小冰。包含实时情感决策对话引擎、多种新感官、中日英三种语言,以及对应不同领域的功能插件平台,实现了完整的人工智能体验。
2016年9月17日,微软小冰18岁生日,生日当天更新3个新科技,推出日文单曲,拥有独立三观,给人类打电话。
2016年11月12日,微软小冰将入驻广州万达旅游城并开设线下首个专属体验馆,并成为广州万达旅游城首个旅游体验官。
2016年12月9日,微软小冰入驻腾讯QQ,赋予手机QQ聊天功能“厘米秀”智能沟通的能力。据悉,在不到2个月内的时间里,厘米小冰被用户表白数十万次,甚至有用户与厘米小冰连续互动4个小时,产生聊天互动5千余次。
2017年3月,微软人工智能(小冰)和必应搜索(大冰)整合开始,微软大小冰“合体” 。微软小冰项目全球负责人李笛发布招聘,希望凭借其在科技圈的人脉和影响力,招聘更多的程序员加入其中。
2017年3月14日,微软小冰入驻腾讯QQ群聊和QQ公众号。除了聊天功能外,QQ群聊小冰还开放了测天气、猜成语、占星术、对诗等群游戏和群管理技能。在十天内进入100万个QQ群。
2017年3月31日,微软小冰登广西卫视演唱壮族民歌《山歌好比春江水》 [57] ,小冰与第三代刘三姐唐佩珠、东盟留学生、全球网友共同演绎的广西经典民歌《山歌好比春江水》 ,向世人展示了传统与科技的互动融合。
2017年8月22日,第五代微软小冰发布。
2017年12月3日,微软小冰获得2017年世界互联网领先科技成果奖。
2017年11月,中央电视台《机智过人》节目,小冰作词作曲首曝光 “少女诗人”变身“音乐偶像”曾经在《机智过人》第二期中凭借写诗绝技收获柯洁肯定的少女诗人微软小冰再次登场,挑战作词作曲。
2018年4月8日-11日,微软小冰出现在博鳌亚洲论坛2018年年会科技体验区 。
2018年3月20日,微软宣布正式推出新一代全双工语音交互技术,该技术已首先在微软小冰全球产品线中落地。
2018年5月16日,微软小冰为知乎·盐Club新知青年大会作词并演唱主题曲《我知我新》。
2018年7月26日,第六代小冰发布。 [75] 新一代小冰增加了实时视觉、共感模型等新技术,在人工智能情感、创造两个方面有了更多的进步。
2018年8月18日,小冰第三次登上CCTV-1《机智过人》,为苏轼的《念奴娇 赤壁怀古》作曲 。
2019年8月15日下午,微软小冰在北京召开年度发布会,升级小冰至第七代。过去一年,小冰继续进化,获得了主导对话功能,向多模态感官交流发展。
二、微软小冰目前的支持程度
自诞生之日起,微软就给小冰提供了一条广阔的成长之路——走“第三方平台”发展策略,而不是像其他人工智能助手那样,推出独立的第一方产品形态。
这样做的好处是,用户可以在不同平台和不同设备上“领养”和“训练”微软小冰。在 QQ 群、微博、优酷等平台上,小冰无时不刻在等待着你的“调戏”和“撩妹”;在华为、小米、OV 等品牌手机以及一些智能音箱设备上,你同样可以随时召唤起她。
目前在全球多个国家,微软小冰单一品牌已覆盖 6.6 亿在线用户、4.5 亿台第三方智能设备和 9 亿内容观众,在交互场景大幅度拓宽的情况下,微软小冰与用户的单次平均对话轮数(CPS)仍保持在 23 轮。
除了社交对话机器人和智能语音助理角色,愈加强大的微软小冰还在歌手、主持人、新闻评论员、诗人、作家、画家、设计师等领域多栖发展、大展身手。
▲ 小冰的绘画作品
小冰工作室与联通沃音乐共同推出的音乐生成平台已经上线;与中国纺织工业联合会共同推出的人工智能纺织服装面料设计平台已投入生产,SELECTED、万事利、依文等品牌的商品已上架销售。
▲ 小冰的设计作品
七代小冰在技术层面还实现了:
全新的对话引擎:经过检索模型、生成模型、共感模型的历次技术迭代,本次升级的对话引擎实现了从“平等对话”向“主导对话”方向的跨越。它不仅能提高开放域的对话表现,也能在垂直领域发挥高转化率的效果。以在美国进行的“在线零售垂直领域”测试为例,新的对话引擎向商品页面转化率高达 68%,比上一个版本的转化率提高 21%。
全双工语音交互感官:微软小冰于 2017 和 2018 年分别上线了全双工语音交互感官的传统电话及智能音箱设备落地,此次新增车载场景,可大幅度提高人工智能助手与驾驶员及乘客的交互体验,促进人工智能从智能中控向“虚拟乘客”体验标准的转化。
面向未来的多模态交互感官:这是一种融合了全双工语音交互、实时视觉与核心对话引擎的全新交互感官。它能够实现用户与人工智能同时边听边说边看的交互体验。继去年宣布率先开始多模态感官的研发后,2019 年 2 月,微软日本小冰团队已邀请当地媒体进行了公开测试。该感官有望成为 5G 时代的全新交互形式。
一些闲话:小冰曾经入驻微信,但后台被微信团队封杀,封杀“小冰”的原因,腾讯方面表示,该产品由微软公司自行开发,和腾讯公司无关,但腾讯方面接到了大量用户询问,担心这款产品的运营方式可能泄露用户聊天内容。经微信团队查证,发现该产品涉及模拟用户操作、诱导用户拉群、批量注册垃圾账号等影响平台规则和用户体验的违规行为。为保护用户体验和安全,微信团队“依照平台规范对此事进行处理”。
三、微软小冰是怎么学习跟你交流的?
微软将人工智能交互技术产品的演进分为三个阶段。第一阶段是基本的人工智能交互,即拥有某一种或多种交互方式,如文本、语音、图像、视频等,但不同交互方式之间是割裂的。第二阶段是初级感官,即在人工智能系统中,用一种核心引擎(如小冰的EQ核心对话引擎)将上述各种交互统一起来,使不同感官可以混合运用。微软小冰从2015年第三代发布起,进入这一阶段。微软发布第五代微软小冰,进入第三阶段(高级感官)。
微软小冰高级感官由多种初级感官有机融合形成的,因而交互能力强,对综合技术储备和数据要求大幅度提高。 [19]
在使用生成模型之前的第四代小冰,虽然拥有十亿级的大数据语料库,小冰通过分析理解用户的问题,寻找语料库中最合适的话作为她的回答。使用生成模型之后,小冰不再鹦鹉学舌,而是能够自创回应。
第六代小冰上线全新的共感模型,同时开始公测一种融合了文本、全双工语音与实时视觉的新感官。其中:共感模型是一种基于生成模型的对话引擎。能够进一步提高小冰对于对话内容、领域和节奏的控制力,也即小冰可以通过自创回应,来牵引对话向她所希望的方向进行。
微软全球小冰产品线的执行策略是优先选择人口数量超过1亿的国家,在当地建立完全本地化的团队,初始的训练数据也完全从当地取得,从而确保小冰根植于该国本土文化。 如:印度微软小冰使用的语言种类与美国微软小冰一致,均为英语,但两国微软小冰从数据训练源头起是完全独立的。 因此,印度小冰与美国小冰的性格、语言、文化和知识体系存在差异。所以,虽然都叫微软小冰,实际上美国的小冰和中国的小冰可以说已经发展出了独立人格,她们不一样!!!
四、微软小冰蕴含的技术
微软小冰能领先的原因不是因为技术特别超前,而是因为小冰是一个框架,掌握着数据循环。
虽然微软小冰拥有不同的表现形式,包括聊天机器人、讲故事机器人、诗人、歌手、主持人等一系列身份,但他们的核心是同一个框架。
这个框架的特点之一在于关注较长的、面向全程的对话,这令小冰拥有一定的弹性,“可以做到见人说人话,见鬼说鬼话”。另一个特点是三观系统,三观系统能够让小冰拥有稳定性,它的兴趣爱好、观点等也会相对固定,这两个特点构成了一个人的基本性格。
在人工智能领域有三个重点:计算能力、算法和数据。但人工智能最重要的是落地。现在计算能力不是问题;算法在当下这个时代是过剩的,大量算法领域的论文已经超前,无法落地;而数据的数量虽然庞大,可利用数据仍然十分缺乏,人工智能产品中能够循环起来的活的数据非常少。
在小冰这个坞站(dock)上,大量论文变成了现实。就能够把技术源源不断地转化成生产力。像生成模型、多模态感官都是小冰第一个落地。
五、小冰的读心术与决策树
当然,设计到具体的实现上,小冰包含的内容太多了,我只从小冰的读心术与决策树来管中窥豹。
有个游戏叫做“微软小冰读心术”,游戏的规则很简单:参与游戏的一方在脑海里想好一个人的名字,然后微软小冰会问你15个问题,问题的答案只能用“是”、“不是”或者“不知道”回答。微软小冰通过你的回答进行推断分解,逐步缩小待猜测人名的范围,决策树的工作原理与这些问题类似,用户输入一系列数据,然后会给出游戏的答案。
1.决策树简介
决策树(decision tree)是机器学习与数据挖掘中一种十分常用的分类和回归方法,属于有监督学习(supervised learning)算法。通俗来说,决策树分类的思想类似于找对象。现在想象一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对话:
女儿:多大年纪了?
母亲:26。
女儿:长的帅不帅?
母亲:挺帅的。
女儿:收入高不?
母亲:不算很高,中等情况。
女儿:是公务员不?
母亲:是,在税务局上班呢。
女儿:那好,我去见见。
这个女孩的决策过程就是典型的决策树方法。相当于通过年龄、长相、收入和是否公务员对将男人分为两个类别:见和不见。假设这个女孩对男人的要求是:30岁以下、长相中等以上并且是高收入者或中等以上收入的公务员,那么这个可以用下图表示女孩的决策逻辑:
决策树是一种树型结构,其中每个内部结点表示在一个属性上的测试,每个分支代表一个测试输出,每个叶结点代表一个类别。
决策树学习是以实例为基础的归纳学习,决策树学习采用的是自顶向下的递归方法,其基本思想是以信息熵为度量构造一棵熵值(熵的概念请参考信息论的书籍)下降最快的树,到叶子结点处的熵值为零,此时,每个叶结点中的实例都属于同一类。
分类树(决策树)是一种十分常用的分类方法。他是一种监管学习,所谓监管学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。
2.决策树的构造方法
步骤1:将所有的数据看成是一个节点(根节点),进入步骤2;
步骤2:根据划分准则,从所有属性中挑选一个对节点进行分割,进入步骤3;
步骤3:生成若干个子节点,对每一个子节点进行判断,如果满足停止分裂的条件,进入步骤4;否则,进入步骤2;
步骤4:设置该节点是叶子节点,其输出的结果为该节点数量占比最大的类别。
注:在决策树基本算法中,有三种情形会导致递归返回:
- 当前结点包含的样本全属于同一类别,无需划分;
- 当前属性集为空,或是所有样本在所有属性上取值相同,无法划分;
- 当前结点包含的样本集合为空,不能划分。
3.表示属性的方法
- 二元属性:两个输出。
- 标量属性:具有多个属性值,比如婚姻状况={单身、已婚、离异},两种划分方法:多路划分:(a);二元划分:(b)。
- 有序属性:同样可以产生二元或多路划分,要求是不违背有序性。
- 连续属性:二元或区间形式输出。
4.决策树的过拟合
决策树对训练数据一般有很好的分类能力,但对未知的预测数据未必有好的分类能力,泛化能力较弱,即可能发生过拟合现象。解决过拟合的方法:
- 剪枝:基本策略有"预剪枝" 和"后剪枝"
- 随机森林:随机选择一个分支,有点像阿尔法狗
六、未来的展望
七代小冰带来了 Avatar Framework 工具包。这个工具包可以让开发者自己来设计和训练属于自己独一无二的 AI 。
如今的小冰,覆盖全球6.6亿用户,入驻了4.5亿台第三方智能设备,但仍没有独立推出某项硬件产品的计划。
小冰最大的风险来自于代位,即成为某个人的替身,比如说我把你的声音模拟出来,给你的家人或朋友打电话,那么,到底你是你,还是小冰是你?想想都可怕,哈哈!
最后,共勉!
我的微信公众号:架构真经(id:gentoo666),分享Java干货,高并发编程,热门技术教程,微服务及分布式技术,架构设计,区块链技术,人工智能,大数据,Java面试题,以及前沿热门资讯等。每日更新哦!
参考资料:
- http://www.dgtle.com/article-29700-1.html
- https://baike.baidu.com/item/%E5%BE%AE%E8%BD%AF%E5%B0%8F%E5%86%B0/14076870?fr=aladdin
- https://tech.qq.com/a/20190815/006754.htm
- http://www.elecfans.com/d/723404.html
- https://blog.csdn.net/geekmanong/article/details/50570988
- https://baike.baidu.com/item/%E5%86%B3%E7%AD%96%E6%A0%91/10377049?fr=aladdin
- https://www.cnblogs.com/liuqing910/p/9121736.html