当你和天猫精灵对话时,它在想什么?阿里智能对话技术深度解读

摘要: 术语对齐 TaskBot引擎: 核心处理对象是“技能”,我们把技能定义成结构化(query+content)、垂直场景化的任务,比如实时场景查询、工具类、控制类等QABot引擎:包括KG-QA引擎、QAPair引擎、DeepQA引擎。

术语对齐

TaskBot引擎: 核心处理对象是“技能”,我们把技能定义成结构化(query+content)、垂直场景化的任务,比如实时场景查询、工具类、控制类等

QABot引擎:包括KG-QA引擎、QAPair引擎、DeepQA引擎。KG-QA主要是百科和围绕全网知识图谱的精准问答;QAPair引擎以问答对生产消费为主;DeepQA引擎基于url索引、分类聚类、焦点词、摘要的多级系统

ChatBot引擎:包括基于检索和生成的闲聊引擎

内容体系


网页搜索与智能对话是信息服务的不同承载方式,在数据、算法、架构上一脉相承。也正因此积累,谷歌等搜索引擎公司可以快速推出其AI平台&产品,以信息服务为基础To B/C。

  • 行业技能库
第一阶段:团队用了半年的时间将大搜索100+的垂直行业进行结构化升级,涉及行业大到大娱乐、大出行、新闻资讯,中到汽车、体育、旅游,小到股票、翻译、古诗词等等
第二阶段:进一步进行技能的结构化升级,精细的Query结构化、多轮对话建设,并输出到天猫精灵音箱
  • 全网知识图谱
阿里唯一全网知识图谱,以知识卡片、实体推荐、精准问答等产品输出;
  • 问答库
社区问答库:基于UGC问答社区的问答库,1B doc的量级;
UPGC生产:神马"骑士团"建立的校园生产体系,骑士团是该项目的code name,充分利用校园对存量知识进行整理、加工、审核,提升问答的生产效率和质量;目前参与学生人数万级别;
高质量库:社区问答库覆盖高但质量参差不齐,社会化生产质量高但数量相对较少,通过机器对社区问答库的清洗和对社会化生产库的扩展,最终沉淀成高质量库;
蛋清库:蛋清是产品策略。用户与bot对话时最希望得到直接的答案即"蛋黄",但是有时候机器能get(或部分get)到用户的问题但是无法给与完美的答案,这个时候给用户"蛋清"也是一种优雅的手段表示我理解你;目前已完成第一版蛋清上线,主要覆盖“描述/方式”问题类型;
  • 核心库
为了净化互联网环境、提升内容质量,我们以运营+挖掘的方式运转了一套核心库的流程;

技能库+知识库+问答库+闲聊库,构成了信息服务场景下智能对话的基础设施,举几个例子说明下不同库对不同query(询问)的满足,小马同学正在看一场NBA比赛,他说:

"现在火箭领先多少分了?" -> 技能库
"篮球是谁发明的?" -> 知识库
"哈登能进名人堂吗?" -> 问答库
"咱们聊聊NBA吧?" -> 闲聊库

通用信息服务始终在追求问答的覆盖和质量,这也是业界的难点,包括半结构化/非结构化数据的处理、内容生产模式、内容敏感问题、用户满足等等;神马搜索在一年的探索中积累出的多级QA系统、MOPU(Machine/OGC/PGC/UGC)多元化生产、流程化规模化可持续的生产体系走在了业界的前沿;在最近一次天猫精灵理想query集合评测上,触发率达到73%,准确率达到了91%;这个数据是什么概念,可以参考业界代表性产品的指标:

根据Stone Temple最近的调查,谷歌虚拟助理可以回答68%的用户问题,其中90.6%的答案是正确的,而微软Cortana能够回答的用户问题比例为56.5%,准确率为81.9%;而苹果Siri回答的用户问题比例为21.7%,准确率为62.2%,亚马逊Alexa回答的用户问题比例为20.7%,准确率为87%

架构体系


上图为架构体系整体大图。"引擎"负责数据的构建和计算的承载,"平台"负责以引擎为核心构建的闭环解决方案(生产、多租户消费、运营、需求管理等)。系统的落地,得以于搜索多年的积累沉淀。该系统完全与搜索业务解耦,承载了天猫精灵等业务方的流量(以及双十一晚会直播问答)。下面会分别介绍神降临平台、TaskBot引擎、QABot引擎。

神降临平台


神降临平台是TaskBot引擎的平台化延展,解决技能生产、消费、运营等问题。对于外部开发者它是BotFramework;对于外部调用者它是神马整个智能对话的出入口;对于内部RD它是生产和运营平台。目前该平台主要服务集团内部业务。神降临由技能开放平台、技能生产平台、统计分析平台、运营管理平台组成。


  • 技能开放平台
开放有两个层面:内容开放+能力开放。对应的技能开放平台也承担两个角色:
1.能力开放(BotFramework):对标类api.ai的技能构建平台,外部开发者构建自己的技能;
2.内容消费(OpenAPI):通过创建应用、选择技能/问答,直接通过API进行智能对话;
目前我们尚未对外主推BotFramework:虽然开放平台产品众多,但目前的模式很难满足开发者需求,一个技能从产品规划到生产可用需要大量和较长链路的工作,不是提交点语料配置点上下文和输出就可以搞定的(简单控制类勉强可以)。在我们技能一期专项完成的20+技能下大约有300+种不同意图,建立了语料收集、标注、审核、建模、测试的完善流程。所以我们的精力主要放在打磨真正可用的内置技能,产生实际的价值。
  • 技能生产平台

技能生产平台用于生产内置技能。它与技能开放平台的角色一致最终都是将物料投递给TaskBot引擎,但用户是内部RD,涵盖了从产品PRD到技能上线的全链路流程,涉及在线编写结构化PRD、需求管理、语料管理、实体管理、技能构建、技能训练、技能验证、技能发布。

为了技能的普适性,每个技能我们都以技能组的方式支持多场景:标准无屏、手机屏、大屏,标准无屏针对天猫精灵音箱类似场景,手机针对神马的个人助理场景,他们在多轮需求、结构化展现、排序策略上都不尽相同;另外内置技能的物料除了实体、语料、剧本之外,支持投递c++动态库以支持不同的排序策略、NLG策略等。

通过该平台将技能建设在线化、PD/RD/QA/运营分工明确pipeline生产。

  • 统计分析平台
多维度的打点统计、报表、指标分析。涉及问题包括生产消费效率(通过统计引导内容生产的方向领域)、内容控制反馈、整体和独立技能的准召。
  • 运营管理平台
运营管理平台分两块:内容运营、应用运营。
内容运营:关键域和模块的实时干预;
应用运营:应用/技能等增删改查以及训练;


注1:中间橙色为TaskBot引擎,下文展开介绍
注2:大图中TaskBot引擎、QABot引擎、ChatBot引擎为逻辑架构;物理架构上QABot和ChatBot级联到TaskBot中,有多个模块进行多路召回和pk判定


TaskBot引擎

TaskBot引擎是技能构建和消费的内核。它涉及离线计算、内容管理、调度、在线服务。

  • 离线计算 将外部平台的物料一一构建成对应的内部数据;包括实体词典、分类模型、意图识别&抽槽插件/pattern/模型、NLG策略和模板、DM剧本插件、US排序插件、webHook逻辑插件等等。
  • 内容管理 按应用/技能分版本的管理上述数据。内容管理要做到无状态,可快速移植、回滚、分发。
  • 调度 分为数据调度、环境管理、服务管理。数据调度负责离线到在线的数据分发,一套SDS引擎包含多个Role,每个Role都会加载对应的数据;环境管理负责迭代、验证、预发、生产环境的自动化管理;服务管理负责运维方面工作包括分行分列(按照应用流量分行,按照技能消耗分列),扩缩容上下线等;
  • 在线引擎:SDS引擎,见下图

SDS引擎是任务式对话的核心。它接受用户的query,以DM为控制中枢、以NLU为理解中枢、通过US做召回和rank、以NLG包装后输出。目前资讯播报、时区、限行、历史上的今天、单位换算、油价、日历、nba、lbs等技能天猫精灵上线技能触发率97-98%,准确率95%+;

  • DM(Dialog Manager):即对话管理,是对话系统的关键部分,负责维护对话上下文,管理对话流程,保持对话过程的流畅。用户的输入通过NLU处理后产生意图、槽位等信息,DM根据这些数据以及当前对话的上下文做出对应的决策和行为,包括调用NLG模块生成自然语言、通过外部服务接口获取对话过程中所需要的额外信息。DM以任务树的方式管理对话,树的每个节点都是一个Agent(询问、执行、回应);考虑到对话系统的通用性和可扩展性,我们在对话管理模块的设计上,将对话引擎部分和领域相关部分做了明确的隔离,包括可重用的对话Agent组件、可编辑的对话控制选项、通用的外部调用机制等,可方便地自定义不同功能的Agent,实现不同的对话场景。

对话引擎在流程控制上有两个重要的组成部分:

  • 对话执行栈: 通过栈的形式维护Agent的执行状态,根据上下文对对话流程进行控制。对话栈将Agent放入栈中,由栈顶的Agent执行并选择出合适的子Agent继续入栈执行。对话栈存储对话的上下文信息,对应着一个具体的对话场景。对话栈顶的Agent可形象的理解为对话焦点,对话栈结合Agent关系树和话题议程表可实现对话焦点的跟踪和管理,可灵活的保持、切换、回溯对话主题。
  • 话题议程表: 负责维护和管理对话过程的参数信息,用于收集系统期望得到的用户输入。议程分为多个层次,每个级别对应于对话框堆栈中的一个Agent,因此对于不同的运行栈信息,议程表代表了在这个对话场景下所期望的输入。当用户保持或转移话题时,能找到相应的期望参数并更新。
DM的执行单元是"剧本",用户在开放平台或生产平台通过拖拽方式构建的剧本树最终会被构建成c++的so被加载执行。目前通过DM与NLU的结合已在多个技能上完成了省略替换、指代消解、话题转移、错误处理等多轮对话。

NLU:NLU有两种不同的设计理念:

  • 围绕BotFramework的NLU:将用户query结构化为Domain/Intent/Slot后返回给开发者(带上置信度),有些BotFramework产品需要用户自己判断是否接受这个结果,在技能较多的情况下会更麻烦,因为这种设计下核心帮助用户解决的是语义理解的问题
  • 围绕对话产品的NLU:结合NLU的分类和召回的结果做多维NBest策略,这在信息服务场景尤为重要,比如用户说了个李白,它可能是诗人李白、可能是撒贝宁的妻子李白、也可能是李荣浩的《李白》,这里有不同的处理方式,比如借助大搜索用户点击、借助用户的历史行为、甚至可以DM上直接反问哪个李白
上述2自然涵盖1,神马的NLU是2的模式。今年NLU系统经历了两次大的升级,一次是整个SDS的NBest升级,一次是子NLU化,子NLU可以让不同的Domain根据自身特别内部个性化定制意图识别和抽槽策略、并提升RD并行度。

NLG/US/Skill-Gateway 不再展开。

QABot引擎


业界对问答有不同的划分维度,按照内容维度可划分为结构化数据问答、非结构化数据问答、以及基于问答对的问答。而从技术角度看,业界一般分为基于检索式的问答系统和基于生成式的问答系统。前者是将信息检索系统构建于大规模对话数据集之上,通过建立有效的问句匹配和问答相关度量化模型实现对用户问题的合理回复;后者则试图通过构建端到端(End-to-End)的深度学习模型,从海量对话数据中自动学习query和response之间的语义关联,从而达到对于任何用户问题都能够自动生成回复的目的。

我们当前主要专注于基于海量数据的检索式QA系统,而在系统层面划分为:KG-QA、Baike-QA、DeepQA、PairQA,它们都是对既有知识的搬运整理,但是在数据来源/要求、加工方式、匹配方式、覆盖场景又不尽相同。笔者认为世界的理想终局是结构化的(知识库),但是这个永远无法真正实现,比如信息的持续产生和更新以及自然语义处理的难度,所以需要两个方向同时并行前进。

KG-QA和Baike-QA准确高但是覆盖有限,基于非结构化的Deep-QA覆盖高但是污染大,Pair-QA的社会化生产大幅提升生产力但是需要好的场景和问题,诸多的挑战决定了问答的难度和壁垒。

这里主要介绍PairQA和DeepQA系统如下图所示:



  • 问题理解
     问题理解是问答系统理解用户意图的关键一环,特别是DeepQA。这里我们复用了大搜索基础NLP的能力(语义扩展,权重分析,实体识别,改写纠错等);问题分类结合机器学习分类算法和人工的方式,来实现提问的分类,比如:无意义、闲聊、人物、组织、时间等;焦点词识别,主要完成信息需求的精准定位,指问句的主要背景或者对象、有关主题的内容,能够体现对话题的描述性作用,比如实体、属性、动作、实例等。
  • 信息检索
信息检索负责从全局语料中检索相关/候选信息,传递给最终的答案生成模块。信息语料的不同,以及业务场景的不同,检索的方法也有多种形式,目前我们主要使用的是基于倒排的文本检索和基于向量的语义检索。前者是传统的全文搜索引擎采用的方式,优点是实现简单、准确率高,但对建库语料依赖大,后者则是语义搜索引擎一种较好的实现方式,优点是泛化能力强,但有一定误触发率。两套索引机制各有优缺点,结合不同的语料和业务场景,使用不同索引机制,同时也会相互结合使用,发挥各自的优势。
  • 答案生成
基于检索端的候选答案,需要通过进一步的精排、答案抽取、置信度计算,最终得到准确、简洁的答案。PairQA,更多的是通过CNN、DSSM、GBDT等机器学习模型和方法做严格的排序 + 置信度计算;DeepQA,面向的是非结构化的文档/社区语料,则需要做更深层次的处理,包括结合Bi-LSTM RNN模型的简洁摘要抽取、同义问题答案间交叉验证、答案相关性验证等。
  • 语料建设
语料库的建设是QABot的基础,不管是面向特定领域的问答(比如:母婴、三国、街舞),还是面向开放域的问答(比如闲聊),都离不开高质量语料的支持。针对天猫精灵场景,我们实现了一整套面向口语化问答的数据挖掘和运营生产流程,包含开放问题挖掘、场景问题挖掘、社会化答案生产、高质量答案自动抽取。


图谱引擎

知识图谱是神马搜索的核心基础设施,借助搜索大数据和自然语言处理、深度学习技术打造,也是历史最悠久的数据产品,在搜索知识化、智能化发展历程中发挥了关键作用。基于知识图谱和自然语言理解,我们构建了知识卡片、实体推荐、精准问答三个主要产品。在智能对话业务,针对音箱的场景,还重点建设了菜谱、古诗词、三国、世界之最等特色技能,输出到天猫精灵。而在生产侧,一方面持续引入知识抽取、知识推理的前沿新技术,另一方面也建立了图谱的社会化生产模式,来持续建设和补充专业领域的知识,使知识图谱更好地为业务赋能。

总结

去年一年,智能对话团队初步完成了从搜索到智能对话的技术升级,在实战中沉淀出AI+信息服务的架构、算法、运营、内容体系。感恩时代,AI对话的路很长,我们一起努力。


本文作者:张强

原文地址: http://click.aliyun.com/m/44053/

干货好文,请关注扫描以下二维码:


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/65037.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

三个步骤教你如何通过天猫精灵控制智汀,实现不同生态设备相互联动

我们在市面或某宝上看到很多智能设备,但是是隶属于不同智能家居品牌的,而智能家居品牌和生态之间是不互通,不兼容的;也就是说,虽然都能被智能生态语音控制,但是设备之间是有办法联动的,除非你买…

基于巴法云平台的天猫精灵控制开关

天猫精灵已经出来很久了,因为他的语音识比较精准,所以很多智能家居的开发者想通过天猫精灵来控制一些家电。于是天猫精灵,小度音响等一些列具有语音识别功能的音响问世。我了解到的最多的还是支持天猫精灵和小度音响。 今天讲的是利用巴法云来…

马云推出的“天猫精灵”到底有多牛? 细思极恐怖

这个时代的变化有多莫测? 开网店、改变银行的马云,搞起了机器人! 搞搜索、做地图的百度,完成了无人驾驶! 马云又打响一枪 马云大动作不断。三个重磅后,今天又打了对手一个措手不对。 天猫精灵——马云为…

15位大模型应用优秀代表出炉丨记2022大模型创新论坛 · 应用展示与交流

2022年,随着DALL-E2、ChatGPT等新模型的陆续发布,我们更深刻地认识到,超大规模预训练模型和基础模型等具有非凡的AI能力,他们懂语言、会写代码、能绘图画、演奏音乐,甚至开始具有身体。 2022年末,智源研究院…

斯坦福“草泥马”火了:100美元就能比肩GPT-3.5!手机都能运行的那种

梦晨 金磊 发自 凹非寺量子位 | 公众号 QbitAI 一夜之间,大模型界又炸出个big news! 斯坦福发布Alpaca(羊驼,网友口中的“草泥马”): 只花100美元,人人都可微调Meta家70亿参数的LLaMA大模型&…

TFBoys谁最红?BTS和EXO谁更红?杨幂杨颖谁更漂亮?看看ChatGPT怎么答送命题的(狗头)

最近大火的ChatGPT,不知道各位有没有玩,我倒是拿它来帮我编辑邮件内容、写述职报告、写文章等等的,简直太好用了哈哈哈 突然心血来潮,我想问问它娱乐圈的三大送命题:TFBoys谁最红?BTS和EXO谁更红?杨幂杨颖…

液压比例溢流阀R901170278、DBET-62/200G24-8K4V

DBET 型比例溢流阀是一种采用阀座设计的远程控制阀,可用于限制系统压力。借助带对中螺纹和可拆卸线圈的比例电磁铁进行操作。线圈的内部与油口 T 连接,并装满液压油。根据电气控制值的不同,这些阀门对要限制的系统压力进行无级设置。 这些阀…

浸液式液冷:数据中心主流液冷技术,龙头全梳理

引言 如今,随着人工智能的不断发展,数据中心越来越被重视。而数据中心的发展需要大量的IT设备,这些设备的持续运行将产生大量热量,需要不断被散发。为了保证数据中心的稳定运行,降温散热是必不可少的。当前液冷技术是数…

知识分享!冷却液温度传感器的结构、特性及功能-道合顺大数据

(一)冷却液温度传感器结构 冷却液温度传感器为负温度系数电阻计NTC,内部是由一个半导体热敏电阻构成,它具有负温度系数NTC。 当发动机冷却液温度逐渐升高时,热敏电阻的阻值将逐渐下降,相反则增大,结果发动机冷却液温…

数据中心服务器冷却技术,盘点数据中心液体冷却系统

多年来,由于增加服务器的密度并减少其体积的大小,服务器的密度变得越来越高,数据中心正日益产生更多的热量。因此,每平方英尺产生热量的瓦数正在不断上升,这种功率密度的增加严重制约了传统的冷却方法和技术。液体冷却作为是数据中心最新的制冷技术,正在被人们所接纳并应…

微流控芯片进样用多通道正负压力控制器的解决方案

摘要:在微流控芯片进样、化学反应进样和长时间药物注射领域,都需要能提供正负气压可精密控制的压力控制器。本文特别针对微流控芯片进样对多通道压力控制器的技术要求,提出了相应的解决方案,并详细介绍了方案中多通道气路结构、控…

厂商踊跃、数据中心观望 液冷距离爆发还差一场风

近年来,液冷技术在数据中心领域的遭遇可以用一个词形容:又冷又热。 技术冷:作为冷却介质,液体的冷却效能远远高于空气,所以在冷却效果上比风冷更“冷”一筹。 关注热: 随着技术发展与产业环境、政策变化&am…

浪潮信息:2025年,实现数据中心风冷、液冷同价

算力作为一种重要的生产力,俨然成为数字经济发展的关键驱动力。而数据中心作为算力的最重要的“输出方”,其作用不言而喻。特别是近来人工智能大模型相关产业的发展,对算力的需求呈指数级增长。大力发展数据中心、提升算力,成为经…

让用户真正放心的液冷技术来了

纵观人类历史,每次技术革新都伴随着生产要素和生产力的跨越式发展。如今,随着全球算力日益增长,数据中心单位空间中产生的热量正在不断增加、功率密度持续增大。赛迪顾问预测,快速增长的数据中心算力将推动高功率单机柜快速普及&a…

浪潮信息建设天池液冷产业基地 降低应用门槛 加速液冷技术普及

液冷技术的创新迸发,为产业提速输送了充沛的动力,期间,只有让液冷技术走向更多客户的数据中心,才能真正促进产业变革。 3月31日,浪潮信息举办了首个天池液冷产业基地开放日,展示了企业拥有的先进的液冷智造…

AI算法发现3种新纳米结构,研究时间从1个月压缩到6小时

衡宇 发自 凹非寺量子位 | 公众号 QbitAI AI又达成了一个新成就! 只用6个小时,发现新的纳米结构。如果使用传统方法,完成这个任务至少需要1个月。 这一结果发表在Science子刊Advance上。 △扫描电子显微镜图像描绘了AI发现的新型纳米结构 实验…

minigpt4搭建过程记录,简单体验图文识别乐趣

引言 从3月开始,aigc进入了疯狂的开端,正如4月12日无界 AI直播 在《探索 AIGC 与人类合作的无限可能》中关于梳理的时间线一样,aigc的各种产品如雨后春笋般进入了不可逆的态势,里面有句话很形象,人间一日,…

让天下没有难Tuning的大模型-PEFT(参数效率微调)技术简介

​ https://www.yuque.com/meta95/hmc3l4/ozgy13dx4akv7v17?singleDoc# 《让天下没有难Tuning的大模型-PEFT技术简介》 最近,深度学习的研究中出现了许多大型预训练模型,例如GPT-3、BERT等,这些模型可以在多种自然语言处理任务中取得优异的…

TransUnet训练自己的数据集

github的源代码https://github.com/Beckschen/TransUNet 一.先对自己的数据集进行处理 1.原始数据集如下图所示分images和labels,若数据集是png/jpg....格式,首先需要将每一张图的image和其对应的label合并转化为一个.npz文件. # 自建的将图片及对应标…

数据中台的商机

阿里拆中台了,很多人来问数据中台还要不要的问题,我认为中台总是要有的,无非是薄厚的问题。然后又有人来问数据中台价值创造的问题,这个其实是数据中台最核心的问题,我就来正式聊一聊,里面有很多的批判&…