Meta为全天候AR眼镜设计了AI系统的八大指导方针

众所周知,Meta不仅局限在Quest这类VR头显上,同时还在打造更轻量化的AR眼镜,目标就是让产品更好的融入到人们的日常生活中去。除了硬件上轻量化以外,在功能和交互体验上也至关重要,例如自然交互方式,比如手势输入,以及AI视觉助手等,这其中和计算机视觉和AI技术密不可分。

​AI技术将会是AR眼镜的重要组成部分,通过实时给用户提供回答和建议等帮助(例如推荐导航路线、甚至日程、根据喜好推荐菜品等)来提升AR眼镜的实用性,将会成为Meta AR眼镜的卖点之一。尤其是,考虑到Meta近年来在AI技术上的投入,我们完全有理由相信这一点。

​Reality Labs公布了一项研究:XAIR,从中我们可以了解到AR眼镜中AI系统的设计准则。该框架基于可解释人工智能框架(XAI)和人机交互(HCI)等研究,其中内含8大设计准则,可为AR眼镜的AI设计提供有价值的参考。

实验中使用了HoloLens头显

什么是XAI?

​据青亭网了解,XAI(Explainable AI)又称透明AI(Transparent AI),特点是行为容易被人所理解。大多数基于机器学习的AI都是在所谓的黑盒中运行,由于无法提供决策背后的原因和见解,此类AI具有一定风险性,因为不确定它是否可信、可靠,是否存在偏见。

XAI的概念可以追溯到四十多年前,后来随着黑盒AI/ML模型的成功,XAI技术开始受到学术业、监管机构等各行各业关注。研究表明,XAI将有望为用户提供清晰的决策,并建立信任。因此在工业领域,已经开始将XAI应用于日常场景,改善用户体验。

XAI可以服务于不同的目标受众,有各种不同的用途。早期的XAI研究仅关注算法开发者、数据科学家,以及临床医疗等领域的专家,而近年来越来越多的XAI开始面向普通用户,与消费级产品集成,比如在购物网站上显示推荐某产品的原因等等。不过,这目前还在早期阶段。

​XAI的重要性

想要让AI被人类广泛理解,将涉及多学科研究工作。比如,ML研究人员开发了生成透明模型的算法(例如,决策树、贝叶斯模型),或使用事后解释技术(例如,特征重要性、视觉解释)来生成解释。而HCI研究人员,则专注于提高用户信任度,以及对机器生成解释的理解。另一方面,心理学研究人员从更基本的角度研究XAI,研究人们如何生成、交流和理解。

公开透明的AI也很重要,它符合未来其在AR/VR领域的发展策略。在XAIR研究中,XAI的目的是通过生成细节或理由,来帮助用户清楚、容易理解AI的决策和功能。Meta指出,XAI是AI驱动的交互系统的重要组成部分,未来也会在日常AR应用中起重要作用,辅助用户与可视化的智能服务互动。XAI可以让AR智能系统的行为更好理解,避免意外的AI决策,并培养隐私意识,获得用户的信任。

不过,目前Meta面临的一个难题,是为日常AR应用创建有效的XAI体验。大多数现有的XAI研究侧重于将解释类型和生成技术分类,而没有考虑到日常AR场景的特点,比如用户和上下文产生的感知信息,全天候运行,适应能力好等因素。这些因素不仅可以形成更人性化的解释,还会影响解释接口的设计。

因此,Meta提出了XAIR设计框架,该框架描述了何时、如何解释AR中AI的决策。为了构建XAIR框架,还进行了一场500人实验,目的是收集他们对于AR体验设计的偏好。此外,还参考了12位专家对于AR交互的见解。

本次研究的重点,是确定三点问题:

  • AI该何时做出解释;
  • 可以解释什么;
  • 如何解释。

​先前的研究已经探讨了前两个问题,尽管非针对AR,但还是为XAIR的设计提供了一些有用的信息。

XAI设计指南

Meta认为,如果AR眼镜具备智能服务,那么AI将起到重要作用,比如根据AR眼镜传感器捕捉到的信息,为用户提供基于上下文的建议。除此之外,AI与用户交互需要基于有效的XAI设计,以确保AI决策可靠、值得信赖,从而改善用户体验。

与针对电脑、手机上的现有XAI框架不同,AR的XAI设计需要结合更深层、更丰富的上下文信息(甚至还要考虑用户的状态),因此需要为AR专门重新设计。而且,AR的XAI还需要具有3D感知能力、实时在线,才能应用于日常AR场景,将解释内容与物理空间融合。比如,在推荐食谱时,同时突出用户冰箱中的食材,即根据场景上下文来解释决策。而相比之下,市面上已有的XAI框架并不能满足这些需求。

于是,Meta通过用户调查总结了8大设计指南:

  • 1)始终生成AI结果,确保用户在需要时可便捷的访问;
  • 2)不自动触发解释,除非满足2个条件——识别到用户高认知负荷、紧迫感等情况,或是识别到用户惊讶、困惑、不熟悉、不确定等状态;
  • 3)个性化解释内容需考虑三个因素:​系统目标、用户目标和用户画像;
  • 4)在默认状态,优先考虑为什么解释,并选择简明的解释;
  • 5)​始终提供更详细的解释,可以通过小的提示窗口等,让用户根据需求展开;
  • 6)默认情况下,采用与AI输出相同的解释方式(除了触觉、音频),一种模态负载高时,选择另外一种;
  • 7)视觉相关:内容以文字为主,如果是图片也应尽可能简化、让用户易于理解;
  • 8)视觉相关:如主题场景相关可使用隐式提示,例如当你看书时提供推荐和浮动窗口;不相关则则使用显示提示,例如兑换框等。

Meta结合设计指南,开发了一些应用案例并在10名设计师中进行验证,结果设计师认为XAIR可为AR的XAI框架设计提供可用的综合参考或帮助,有助于激发设计师的思维和想象力。参与实验的12名最终用户也反馈,XAIR有出色的可用性。

应用案例

在这项研究中,Meta设计了两个演示案例,感兴趣可以来了解一下:

1)当用户在小路上慢跑时,AR眼镜考虑到当下的季节和风景,便为用户显示出附近的地图,建议绕道去附近的路赏樱花。AI可提供的解释包括:风景更好、路线长度合适、适合用户日程安排。解释形式包括文字、樱花图片等等。

2)AR用户在与邻居讨论园艺后回到家,这时AR眼镜会在周围的植物上显示一个“养护”提示,并为用户提供关于植物施肥的说明。这个建议需要用户手动触发,避免其认为AI侵犯隐私,手动触发可以较好的建立信任。此外,AI还可以提示:经过系统扫描,植物的叶子上有异常斑点,表明可能遭受真菌或细菌感染。解释形式除了文字外,也可以在叶子上用AR来标记异常点(文本为明显提示,AR提示则为隐秘式,与场景融合)。参考:Meta

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/24720.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

踩上元宇宙的风口后,消费级AR眼镜真的复兴了吗?

十一假期中,大家都追了哪些狗血新剧?重温了哪些老剧? 作为漫威的影迷之一,如果长假不刷点漫威系列总觉得空虚。漫威英雄里,笔者最喜欢钢铁侠,最心水的装备也是随叫随到的“贾维斯”。贾维斯的操控面板谁人不…

AR眼镜已逐渐走进现实

在可穿戴设备领域,有一个普遍共识:VR和AR有潜力成为继智能手机之后的消费级智能设备,即“第三屏”。其中,AR行业近年来发展势头强劲,虽然市场规模较小,但在投融资规模、产品更新迭代、市场知名度等方面均取…

Meta CTO:真正的全天候轻量化AR眼镜,可能要到2030年

去年Meta发布了售价高达1500美元的VST头显Quest Pro,该头显与Meta的Quest 2等产品在定价、技术路径上有很大不同,其搭载了眼球追踪、彩色VST等更高端的功能,而产品发布后,外界对其反馈也褒贬不一。作为Pro产品线首个产品&#xff…

Facebook 新款AR眼镜都有哪些技术创新?

作者|maver jiang 编辑|3D视觉开发者社区 Facebook一周前(2022年10月11日)发布了新款VR眼镜—— Meta Quest Pro。这款产品售价1500美元,而上一代的Meta Quest 2售价只有400美元。 小扎在产品发布会上宣称新产品融合了VR和AR,创造…

AR眼镜简要

介绍 AR眼镜(Augmented Reality Glasses)是一种将虚拟信息与现实场景融合在一起的眼镜,它通过激光投影、光学透镜等技术将虚拟图像叠加在真实世界中,让人们可以看到增强现实(AR)效果。 AR眼镜通常包括一…

基于AR眼镜有哪类功能可实现?

自从微软和谷歌两大科技巨头发布智能眼镜产品以来,可穿戴智能设备引起了整个行业的关注。AR眼镜让人们看到AR技术如何改变了我们的生活。加上元宇宙概念已成为各行业的焦点,人们对未来AR智能眼镜的发展更是充满了无限遐想。 经过多年的技术积累&#xff…

AR眼镜进入发展热潮,替代手机还有多远?​

当前,AR 应用依旧以搭载相对简陋的手机、Pad 等传统移动设备为主,面对更高端的需求,往往无法充分发挥优势,满足更高要求的应用。而真正意义上的 AR 移动设备则有着难以企及的高昂成本和差强人意的使用体验,这成为AR应用…

【大数据趋势】12月3日纳指大概率反弹到黄金分割附近,然后下跌,之后进入趋势选择期,恒指会跟随。感觉或许有什么大事情要发生,瞎猜中。

行情核心源头分析: 纳斯达克指数 是否会符合大数据规则,走黄金分割线规则 回顾一下上周大数据预测的趋势,虽有波折但最终趋势预测准确 上周11.20日大数据模拟出一个趋势图,大趋势上需要继续上涨尾期,制造一个背离出现&#xff0c…

浅谈股价预测模型:捉摸不定,最为致命

摘要与声明 1:本文将蒙特卡洛模拟的理念运用在股价预测上; 2:本文所使用的行情数据通过Tushare(ID:444829)金融大数据平台接口获取; 3:笔者希望搭建出一套交易体系,原则是只做干货的分享。后…

股指期货高频数据机器学习预测(Python)

代码详见:股指期货高频数据机器学习预测 主要学习本文对特征的提取和数据预处理操作 文章目录 问题描述问题分析数据分析数据集数据清洗 数据预处理归一化PricesVolume时间信息对于预测值的处理噪声 模型探索基于LSTM的RNN模型卷积神经网络全链接的神经网络模型利用…

软件开发中的理性和感性决定

作者 | 邹欣 责编 | 梦依丹 出品 | CSDN(ID:CSDNnews) 问题 CSDN 这个 “软件” (网站,app,开发云、猿如意、插件、公众号等)在过去的很多年中,有很多用户使用,也有不…

猿如意使用测评

本篇博客会记录使用猿如意这款产品的整体使用感受和相关建议,可以作为新人上手这款产品的参考 1. 猿如意的官方介绍 首先是官方对这款产品的介绍 猿如意是一款面向开发者的辅助开发工具箱,包含了效率工具、开发工具下载,教程文档&#xff0…

猿如意中的【Visual Studio Code】工具详情介绍

猿如意中的【Visual Studio Code】工具 一、 猿如意工具介绍二、 工具名称2.1 下载安装渠道2.2 如何在载猿如意中下载VS Code开发工具?2.3 安装流程2.4 安装完成的界面2.6 VS Code使用步骤常用快捷键 使用感受 一、 猿如意工具介绍 打开猿如意程序工具。猿如意下载…

猿如意中的【DBeaver】工具详情介绍,包含下载安装使用保姆级教程

猿如意中的【DBeaver】工具 一、 猿如意工具介绍二、 工具名称2.1 下载安装渠道2.2 如何在载猿如意中下载DBeaver工具?2.3 安装流程2.4 安装完成的打开界面2.6 DBeaver使用步骤 使用感受 一、 猿如意工具介绍 打开猿如意程序工具。猿如意下载地址:猿如意…

CSDN官方开发工具利器猿如意实测

目录 前言一.ChatGPT二.效率工具三.开发工具四.教程文档五.一行代码六.总结 前言 猿如意 是CSDN官方2022年推出的面向程序员效率工具集合,里面包含非常实用的小工具(如Linux命令查询、语音合成、Json格式化、Host切换、文字转图片、Postman、图片处理等…

跟着AIGC学Linux:简介(一)

文章目录 1.Linux内核的历史2.基本概念3.发行版4.Linux应用领域5.Linux VS Windows横向对比表格: 1.Linux内核的历史 Linux内核最初由一位名叫Linus Torvalds的芬兰计算机科学家于1991年创建。当时,Torvalds是一名赫尔辛基大学的学生,他在寻…

php count 数量不准,nfconntrackcount统计计数不准问题,大家有没有遇到过!!!

nfconntrackcount统计计数不准问题,大家有没有遇到过!!! (2012-07-21 03:59:43) 标签: 计数 统计 杂谈 nf_conntrack_count统计计数不准问题,大家有没有遇到过!!!我现在遇…

文本生成视频、AI临床知识理解、大模型有趣案例、智源社区《预训练周刊》第70期...

No.70 智源社区 预训练组 预 训 练 研究 观点 资源 活动 周刊订阅 《预训练周刊》已经开启“订阅功能”,扫描下面二维码,进入《预训练周刊》主页,选择“关注TA”,即可收到推送消息。 关于周刊 本期周刊,我们选择了12篇…

大模型当私人法律顾问?北大团队推出法律大模型,数据与模型全部开源!

作者 | 小戏、Python “要是我有一个学法的朋友就好了” 法律作为我们社会生活的最高指引,其重要性毋庸多言。然而类似于医学,法律又是一个入行门槛非常高的专业领域,想想通过率不到 10% 的法考,显然遇到法律相关的专业问题不太支…

还瞎问来定夺模型好坏?AGIEval:量化评估GPT等大模型!专为人类考试而生

本文 新智元 编辑:LRS 【新智元导读】让AI参加法考、高考、公务员考试的话,能拿几个offer? 随着语言模型的能力越来越强,现有的这些评估基准实在有点小儿科了,有些任务的性能都甩了人类一截。 通用人工智能&#xff…