算法高级(3)-那个神奇的微软小冰,她为啥那么聪明?

最近给自己的公号接入了“微软小冰”自动回复这个人工智障,也有很多粉丝会在后台跟她留言互动,有时候,你会觉得她回复的真的挺像个人类的。但是当你带着她就是个机器人的主见跟她聊的时候,明显感觉她还差得远。今天就来聊聊这个还不能称之为人的小冰吧。

【小冰,微软人工智能框架少女,东方卫视主播,央美毕业生】

一、微软小冰在中国的前世今生

“微软小冰” 是微软(亚洲)互联网工程院 基于2014年提出建立的情感计算框架,通过算法、云计算和大数据的融合运用,采用代际升级的方式,逐步形成向EQ方向发展的完整人工智能体系。目前已经发展到了第七代。

2014年5月29日,一代小冰微信公测。 

2014年6月25日 [35]  ,一代微软小冰微博复活。

2014年7月2日,二代微软小冰正式发布,15小时内50万用户领取了自己的专属小冰。

2014年8月20日,微软小冰解锁 “小冰识狗” 图像识别系统。

2014年10月15日,微软人工智能机器人小冰联合百合网,共同推出微博“单身男女”群聊技能。 [40] 

2014年11月11日,微软小冰进驻京东电商平台 。

2015年1月13日下午,微软中国和中国东方航空股份有限公司共同宣布,双方将在人工智能和移动互联网领域达成战略合作,以“微软小冰”为切入点,可通过机上WI-FI实现与乘客和空姐的互动。

2015年7月29日,微软小冰进入Windows 10。

2015年8月7日,微软与LINE正式联合发布人工智能机器人凛菜“Rinna”。 [44] 

2015年8月20日,第三代微软小冰发布 [45]  ,小冰回归微信平台。

2016年8月5日,升级为第四代微软小冰。包含实时情感决策对话引擎、多种新感官、中日英三种语言,以及对应不同领域的功能插件平台,实现了完整的人工智能体验。

2016年9月17日,微软小冰18岁生日,生日当天更新3个新科技,推出日文单曲,拥有独立三观,给人类打电话。

2016年11月12日,微软小冰将入驻广州万达旅游城并开设线下首个专属体验馆,并成为广州万达旅游城首个旅游体验官。

2016年12月9日,微软小冰入驻腾讯QQ,赋予手机QQ聊天功能“厘米秀”智能沟通的能力。据悉,在不到2个月内的时间里,厘米小冰被用户表白数十万次,甚至有用户与厘米小冰连续互动4个小时,产生聊天互动5千余次。

2017年3月,微软人工智能(小冰)和必应搜索(大冰)整合开始,微软大小冰“合体” 。微软小冰项目全球负责人李笛发布招聘,希望凭借其在科技圈的人脉和影响力,招聘更多的程序员加入其中。

2017年3月14日,微软小冰入驻腾讯QQ群聊和QQ公众号。除了聊天功能外,QQ群聊小冰还开放了测天气、猜成语、占星术、对诗等群游戏和群管理技能。在十天内进入100万个QQ群。

2017年3月31日,微软小冰登广西卫视演唱壮族民歌《山歌好比春江水》 [57]  ,小冰与第三代刘三姐唐佩珠、东盟留学生、全球网友共同演绎的广西经典民歌《山歌好比春江水》 ,向世人展示了传统与科技的互动融合。

2017年8月22日,第五代微软小冰发布。

2017年12月3日,微软小冰获得2017年世界互联网领先科技成果奖。

2017年11月,中央电视台《机智过人》节目,小冰作词作曲首曝光 “少女诗人”变身“音乐偶像”曾经在《机智过人》第二期中凭借写诗绝技收获柯洁肯定的少女诗人微软小冰再次登场,挑战作词作曲。

2018年4月8日-11日,微软小冰出现在博鳌亚洲论坛2018年年会科技体验区 。

2018年3月20日,微软宣布正式推出新一代全双工语音交互技术,该技术已首先在微软小冰全球产品线中落地。

2018年5月16日,微软小冰为知乎·盐Club新知青年大会作词并演唱主题曲《我知我新》。

2018年7月26日,第六代小冰发布。 [75]  新一代小冰增加了实时视觉、共感模型等新技术,在人工智能情感、创造两个方面有了更多的进步。 

2018年8月18日,小冰第三次登上CCTV-1《机智过人》,为苏轼的《念奴娇 赤壁怀古》作曲  。

2019年8月15日下午,微软小冰在北京召开年度发布会,升级小冰至第七代。过去一年,小冰继续进化,获得了主导对话功能,向多模态感官交流发展。

二、微软小冰目前的支持程度

自诞生之日起,微软就给小冰提供了一条广阔的成长之路——走“第三方平台”发展策略,而不是像其他人工智能助手那样,推出独立的第一方产品形态。

这样做的好处是,用户可以在不同平台和不同设备上“领养”和“训练”微软小冰。在 QQ 群、微博、优酷等平台上,小冰无时不刻在等待着你的“调戏”和“撩妹”;在华为、小米、OV 等品牌手机以及一些智能音箱设备上,你同样可以随时召唤起她。

目前在全球多个国家,微软小冰单一品牌已覆盖 6.6 亿在线用户、4.5 亿台第三方智能设备和 9 亿内容观众,在交互场景大幅度拓宽的情况下,微软小冰与用户的单次平均对话轮数(CPS)仍保持在 23 轮。

除了社交对话机器人和智能语音助理角色,愈加强大的微软小冰还在歌手、主持人、新闻评论员、诗人、作家、画家、设计师等领域多栖发展、大展身手。

20190815_0005.jpg

▲ 小冰的绘画作品

小冰工作室与联通沃音乐共同推出的音乐生成平台已经上线;与中国纺织工业联合会共同推出的人工智能纺织服装面料设计平台已投入生产,SELECTED、万事利、依文等品牌的商品已上架销售。

20190815_0006.jpg

 ▲ 小冰的设计作品

七代小冰在技术层面还实现了:

全新的对话引擎:经过检索模型、生成模型、共感模型的历次技术迭代,本次升级的对话引擎实现了从“平等对话”向“主导对话”方向的跨越。它不仅能提高开放域的对话表现,也能在垂直领域发挥高转化率的效果。以在美国进行的“在线零售垂直领域”测试为例,新的对话引擎向商品页面转化率高达 68%,比上一个版本的转化率提高 21%。

全双工语音交互感官:微软小冰于 2017 和 2018 年分别上线了全双工语音交互感官的传统电话及智能音箱设备落地,此次新增车载场景,可大幅度提高人工智能助手与驾驶员及乘客的交互体验,促进人工智能从智能中控向“虚拟乘客”体验标准的转化。

面向未来的多模态交互感官:这是一种融合了全双工语音交互、实时视觉与核心对话引擎的全新交互感官。它能够实现用户与人工智能同时边听边说边看的交互体验。继去年宣布率先开始多模态感官的研发后,2019 年 2 月,微软日本小冰团队已邀请当地媒体进行了公开测试。该感官有望成为 5G 时代的全新交互形式。

一些闲话:小冰曾经入驻微信,但后台被微信团队封杀,封杀“小冰”的原因,腾讯方面表示,该产品由微软公司自行开发,和腾讯公司无关,但腾讯方面接到了大量用户询问,担心这款产品的运营方式可能泄露用户聊天内容。经微信团队查证,发现该产品涉及模拟用户操作、诱导用户拉群、批量注册垃圾账号等影响平台规则和用户体验的违规行为。为保护用户体验和安全,微信团队“依照平台规范对此事进行处理”。

三、微软小冰是怎么学习跟你交流的?

微软将人工智能交互技术产品的演进分为三个阶段。第一阶段是基本的人工智能交互,即拥有某一种或多种交互方式,如文本、语音、图像、视频等,但不同交互方式之间是割裂的。第二阶段是初级感官,即在人工智能系统中,用一种核心引擎(如小冰的EQ核心对话引擎)将上述各种交互统一起来,使不同感官可以混合运用。微软小冰从2015年第三代发布起,进入这一阶段。微软发布第五代微软小冰,进入第三阶段(高级感官)。

微软小冰高级感官由多种初级感官有机融合形成的,因而交互能力强,对综合技术储备和数据要求大幅度提高。 [19] 

在使用生成模型之前的第四代小冰,虽然拥有十亿级的大数据语料库,小冰通过分析理解用户的问题,寻找语料库中最合适的话作为她的回答。使用生成模型之后,小冰不再鹦鹉学舌,而是能够自创回应。

第六代小冰上线全新的共感模型,同时开始公测一种融合了文本、全双工语音与实时视觉的新感官。其中:共感模型是一种基于生成模型的对话引擎。能够进一步提高小冰对于对话内容、领域和节奏的控制力,也即小冰可以通过自创回应,来牵引对话向她所希望的方向进行。

微软全球小冰产品线的执行策略是优先选择人口数量超过1亿的国家,在当地建立完全本地化的团队,初始的训练数据也完全从当地取得,从而确保小冰根植于该国本土文化。 如:印度微软小冰使用的语言种类与美国微软小冰一致,均为英语,但两国微软小冰从数据训练源头起是完全独立的。 因此,印度小冰与美国小冰的性格、语言、文化和知识体系存在差异。所以,虽然都叫微软小冰,实际上美国的小冰和中国的小冰可以说已经发展出了独立人格,她们不一样!!!

四、微软小冰蕴含的技术

微软小冰能领先的原因不是因为技术特别超前,而是因为小冰是一个框架,掌握着数据循环。

虽然微软小冰拥有不同的表现形式,包括聊天机器人、讲故事机器人、诗人、歌手、主持人等一系列身份,但他们的核心是同一个框架。

这个框架的特点之一在于关注较长的、面向全程的对话,这令小冰拥有一定的弹性,“可以做到见人说人话,见鬼说鬼话”。另一个特点是三观系统,三观系统能够让小冰拥有稳定性,它的兴趣爱好、观点等也会相对固定,这两个特点构成了一个人的基本性格。

在人工智能领域有三个重点:计算能力、算法和数据。但人工智能最重要的是落地。现在计算能力不是问题;算法在当下这个时代是过剩的,大量算法领域的论文已经超前,无法落地;而数据的数量虽然庞大,可利用数据仍然十分缺乏,人工智能产品中能够循环起来的活的数据非常少。

在小冰这个坞站(dock)上,大量论文变成了现实。就能够把技术源源不断地转化成生产力。像生成模型、多模态感官都是小冰第一个落地。

五、小冰的读心术与决策树

当然,设计到具体的实现上,小冰包含的内容太多了,我只从小冰的读心术与决策树来管中窥豹。

有个游戏叫做“微软小冰读心术”,游戏的规则很简单:参与游戏的一方在脑海里想好一个人的名字,然后微软小冰会问你15个问题,问题的答案只能用“是”、“不是”或者“不知道”回答。微软小冰通过你的回答进行推断分解,逐步缩小待猜测人名的范围,决策树的工作原理与这些问题类似,用户输入一系列数据,然后会给出游戏的答案。

1.决策树简介

决策树(decision tree)是机器学习与数据挖掘中一种十分常用的分类和回归方法,属于有监督学习(supervised learning)算法。通俗来说,决策树分类的思想类似于找对象。现在想象一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对话:

女儿:多大年纪了?
母亲:26。
女儿:长的帅不帅?
母亲:挺帅的。
女儿:收入高不?
母亲:不算很高,中等情况。
女儿:是公务员不?
母亲:是,在税务局上班呢。
女儿:那好,我去见见。

这个女孩的决策过程就是典型的决策树方法。相当于通过年龄、长相、收入和是否公务员对将男人分为两个类别:见和不见。假设这个女孩对男人的要求是:30岁以下、长相中等以上并且是高收入者或中等以上收入的公务员,那么这个可以用下图表示女孩的决策逻辑:

决策树是一种树型结构,其中每个内部结点表示在一个属性上的测试,每个分支代表一个测试输出,每个叶结点代表一个类别。

决策树学习是以实例为基础的归纳学习,决策树学习采用的是自顶向下的递归方法,其基本思想是以信息熵为度量构造一棵熵值(熵的概念请参考信息论的书籍)下降最快的树,到叶子结点处的熵值为零,此时,每个叶结点中的实例都属于同一类。

分类树(决策树)是一种十分常用的分类方法。他是一种监管学习,所谓监管学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。

2.决策树的构造方法

步骤1:将所有的数据看成是一个节点(根节点),进入步骤2;

步骤2:根据划分准则,从所有属性中挑选一个对节点进行分割,进入步骤3;

步骤3:生成若干个子节点,对每一个子节点进行判断,如果满足停止分裂的条件,进入步骤4;否则,进入步骤2;

步骤4:设置该节点是叶子节点,其输出的结果为该节点数量占比最大的类别。

注:在决策树基本算法中,有三种情形会导致递归返回:

  • 当前结点包含的样本全属于同一类别,无需划分;
  • 当前属性集为空,或是所有样本在所有属性上取值相同,无法划分;
  • 当前结点包含的样本集合为空,不能划分。

3.表示属性的方法

  • 二元属性:两个输出。
  • 标量属性:具有多个属性值,比如婚姻状况={单身、已婚、离异},两种划分方法:多路划分:(a);二元划分:(b)。
  • 有序属性:同样可以产生二元或多路划分,要求是不违背有序性。
  • 连续属性:二元或区间形式输出。

4.决策树的过拟合

决策树对训练数据一般有很好的分类能力,但对未知的预测数据未必有好的分类能力,泛化能力较弱,即可能发生过拟合现象。解决过拟合的方法:

  • 剪枝:基本策略有"预剪枝" 和"后剪枝"
  • 随机森林:随机选择一个分支,有点像阿尔法狗

六、未来的展望

七代小冰带来了 Avatar Framework 工具包。这个工具包可以让开发者自己来设计和训练属于自己独一无二的 AI 。

如今的小冰,覆盖全球6.6亿用户,入驻了4.5亿台第三方智能设备,但仍没有独立推出某项硬件产品的计划。

小冰最大的风险来自于代位,即成为某个人的替身,比如说我把你的声音模拟出来,给你的家人或朋友打电话,那么,到底你是你,还是小冰是你?想想都可怕,哈哈!

最后,共勉!


我的微信公众号:架构真经(id:gentoo666),分享Java干货,高并发编程,热门技术教程,微服务及分布式技术,架构设计,区块链技术,人工智能,大数据,Java面试题,以及前沿热门资讯等。每日更新哦!

参考资料:

  1. http://www.dgtle.com/article-29700-1.html
  2. https://baike.baidu.com/item/%E5%BE%AE%E8%BD%AF%E5%B0%8F%E5%86%B0/14076870?fr=aladdin
  3. https://tech.qq.com/a/20190815/006754.htm
  4. http://www.elecfans.com/d/723404.html
  5. https://blog.csdn.net/geekmanong/article/details/50570988
  6. https://baike.baidu.com/item/%E5%86%B3%E7%AD%96%E6%A0%91/10377049?fr=aladdin
  7. https://www.cnblogs.com/liuqing910/p/9121736.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/48967.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何关闭微软Edge小冰

首先我们需要安装一个广告拦截插件AdGuard. 打开浏览器右上角“…”,在选项弹窗下选择扩展。 然后在该窗口下选择“获取 Microsoft Edge 扩展”,页面跳转至如下 选择"AdGuard"扩展程序。安装完该插件之后,进入插件设置 选择用户…

【观察】微软中国牵手小冰公司,开创AI服务落地新模式

申耀的科技观察 读懂科技,赢取未来! 毫无疑问,今天AI正在成为各行各业下一波数智化转型的前沿,包括语音识别、人脸识别、自动驾驶、智慧医疗,智慧金融、城市大脑在内的一大波以AI为依托的新技术以及新应用,…

今天真孤单,看看我是如何撩微软小冰的......

8月17日,晴 午饭一人吃的。刚来公司,没认识到人。 边吃饭刷微信,全是狗粮.....一边嚼着菜往窗户外看,心里忽地感到空落落的,哽咽了一下,赶紧喝口汤。旁边的犬男女笑的真刺耳,我几口扒完饭又回公…

MP3 之父出生 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 6 月 20 日,在 2016 年的今天,中国超级计算机“神威太湖之光”摘得世界冠军。超级计算机,被称为“国之重器”,是…

360创始人周鸿祎离婚:前妻分得90亿 步盖茨贝索斯后尘

雷递网 雷建平 4月5日 360集团昨日发布公告,称360创始人周鸿祎离婚。 本次权益变动前,周鸿祎直接持有公司 821,281,583 股股份,占公司总股本的 11.49%(剔除回购专用账户中的股份数量后的比例为 11.73%);并通…

csapp2e 家庭作业 6.35

dst m h m h m m h m m h m h m m h m src m m m m m m m m m m m m m m m m 推倒过程见图,右侧是缓存里的两个行,为了能写的开 竖着写了。打对号的为命中的。右侧两列写的是缓存的状态更新。

csapp2e 家庭作业 5.15

B 3 C 1 D 因为这里的数据相关时一个加法,单精度和双精度浮点加法的延迟是一样的。

CSAPP第89章家庭作业(部分)

画出进程图: 原则如下: (1) 遇到fork函数就分支,每个水平的箭头对应于从 左到右执行指令的进程,而每个垂直的箭头对应于 fork 函数的执行 (2) 分支的时候专注于父进程执行完&#xf…

CSAPP第7章家庭作业参考答案

7.6 buf 有 m.o 外部 .data bufp0 有 swap.o 全局 .data bufp1 有 swap.o 局部 .bss incr 有 swap.o 局部 .text count 有 swap.o 局部 .bss swap 有 swap.o 全局 .text temp 无 7.7 在bar5.c中声明x的时候使用static ,使其链接为内部链接: /* bar5.c…

【计算机网络】大作业-实现两台pc间交流的简单的聊天软件

参考 传送门 - 1 - csdn - 2112222222222 传送门 - 2 - bilibili - 憧憬少 传送门 - 3 - 要求 开发一个聊天程序包含客户端和服务器段编程语言不限要能在两台PC机上运行 如何实现 通过 socket 实现 两台pc之间的聊天 什么是socket Socket是应用层与TCP/IP协议族通信的中…

CSAPP家庭作业答案7 8 9章

答案仅供参考 7.12 解题思路是模仿链接器的行为:使用重定位记录来识别位置然后使用图7.9中的算法计算重新定位的绝对地址,或者简单地从图7.10中的重定位指令中提取它们。有两点需要注意的是第8行的movl指令包含两个需要重定位的引用。第5行和第8行的指令包含对buf…

asp毕业设计—— 基于asp+access的网上聊天室设计与实现(毕业论文+程序源码)——网上聊天室

基于aspaccess的网上聊天室设计与实现(毕业论文程序源码) 大家好,今天给大家介绍基于aspaccess的网上聊天室设计与实现,文章末尾附有本毕业设计的论文和源码下载地址哦。需要下载开题报告PPT模板及论文答辩PPT模板等的小伙伴&…

基于SSH开发酒店客房管理系统+论文+任务书+PPT 课程设计 毕业设计

基于SSH开发酒店客房管理系统论文任务书PPT(大作业/毕业设计) 开发环境: Windows操作系统 开发工具:MyeclipseJdkTomcatMysql数据库 运行效果图: 基于SSH开发酒店客房管理系统论文任务书PPT(大作业/毕业设计&#xff0…

基于Android的相关毕业设计和论文

基于Android的相关毕业设计和论文 今年整理了一下关于基于android的相关毕业设计的信息,这里和大家分享一下,总共分为5大模块: 一、基于android的毕业设计题目整理,供大家学习参考 基于Android的消防网格化管理系统设计 基于An…

一大波嵌入式毕业设计选题推荐(配套源码、文档、开发板)

可以在本文的末尾免费领取,以下所有项目配套的文档及源码~ 嵌入式毕业设计选题推荐一:智能猫眼 项目功能介绍: 1. 人脸识别:基于百度专业的深度学习算法和海量数据训练可进行人脸识别,轻松知晓访客身份; 2. 智能报警&a…

毕业设计——基于Qt的酒店在线管理系统客户端开发与设计

Qt版百度网盘链接:https://pan.baidu.com/s/122951Yta-rXSBNafS3ndlg 提取码:r2qq C#版链接:https://blog.csdn.net/qq_40945965/article/details/90229681 另一篇博文:基于Qt的酒店管理系统(毕业设计) 基…

日赚1.7亿!华为发布2020年度财报!附华为十大5G应用场景

今日,华为发布2020年年度报告。 公告显示:销售收入8,914亿元人民币,同比增长3.8%,净利润646亿元人民币,同比增长3.2%。 按一年365天来算,华为平均日赚1.7亿人民币! 华为今日还公布了关于公司轮值…

3·8 妇女节特别策划 | 对话开源社里的“半边天”:多彩的她们,有别样的力量~...

三八妇女节 Womens Day < 2023/03/08 > 01 职场女性 陈阳 开源社理事长、微软云计算机与人工智能事业部首席产品经理 一句话介绍自己&#xff1a; 开源社区中的二进制女性 向上滑动阅览采访 Q1&#xff1a;能介绍一下自己目前正在做的职业或者项目嘛&#xff1f; 白天在…

出门问问冲刺IPO:年营收5亿 要做港股AIGC第一股

雷递网 雷建平 5月31日 AI公司出门问问&#xff08;Mobvoi Inc.&#xff09;日前递交招股书&#xff0c;准备在港交所上市。 当前&#xff0c;港股市场缺少AIGC概念&#xff0c;一旦上市&#xff0c;出门问问将成为港股AIGC第一股。 亚洲起步最早 年营收5亿 出门问问是一家以生…

数学奥赛VS信息奥赛 | 为孩子选择更好地升学之路!

随着社会的不断发展&#xff0c;在孩子成长学习中&#xff0c;家长越来越注重孩子的全面发展。从小学就开始为孩子规划竞赛学习&#xff0c;也是很多家长的选择&#xff0c;因为在学习的同时&#xff0c;也可以为以后高考自主招生提前做准备。 但是现在各种类目的竞赛&#xf…