ChatGPT、百度文心一言、Bard等大语言模型展现出了超强的创造能力,加速了生成式AI的应用进程。但AI模型只能基于训练数据执行各种任务,无法像人类一样利用生活知识、过往经验用于复杂的推理和决策。
例如,在玩游戏时,人类可以利用各种线索、常识、经验以及对游戏规则的理解做出最佳决策。而AI只能通过大量训练学习游戏的模式,不具备人性化理解功能。一旦游戏规则或环境发生变化,AI就很难做出正确的选择。
为了解决这些难题,克莱姆森大学AI实验室提出了自主认知技术框(Autonomous Cognitive Entity,简称“ACE”)。通过道德、全局战略、代理模型、执行、认知控制和任务执行6大分层设计,使AI模型可以实现“自主决策”和道德推理的认知架构。
长期以来,让AI模型具备“常识推理”的能力一直是科研界的重中之重。而ACE框架被视为解决这个难题的创新性突破研究。
其实ACE概念与前不久中国科学院自动化研究所和耶鲁大学提出的“思维传播”技术框架类似,都是让大模型学会利用过往经验增强复杂推理能力来处理全新的问题,只不过推理分层更加具体化,并加入了道德规范的限制保证输出内容的安全性。
论文地址:https://arxiv.org/abs/2310.06775
ACE技术框架得到了业界众多技术大牛的认可。斯坦福大学计算机科学系教授John Etchemendy表示,ACE框架标志着人工智能研究的新范式,其分层抽象和信息反馈的设计对实现人工常识推理大有帮助。
麻省理工AI实验室主任Daniela Rus认为,ACE框架构建了一个集成伦理、认知和计算原理的完整结构,为人工常识推理提供了新的研究方向。
ACE框架的总目标是实现一种既高能又伦理的人工智能系统。其核心创新在于融合了顶层的抽象伦理推理与底层的具体任务实现,构建一个闭环完整的认知体系。
ACE主要由道德、全局战略、代理模型、执行、认知控制和任务执行6大层组成,每一层集中处理不同的功能,高层处理抽象推理,低层负责具体任务执行。
道德层
最高的道德层确定了整个系统的方向和原则, 其功能是定义一个自治代理的核心价值观和伦理原则,包含3部分。
(1)基本伦理准则:这是直观的道德准则,为系统提供基本遵循。
(2)次要原则:诸如人权义务等提供具体指导。
(3)使命宣言:定义代理的核心目标和意图。
全局战略层
在接收到来自道德层的抽象使命后,全局战略层会结合具体情境,制定实现这些使命的长期计划,包含2部分。
(1)情境融合:吸收环境信息,理解代理面临的具体情境。
(2)战略文件:产出指导性文件,为下层提供行动指南。
代理模型层
致力于理解一个代理在给定环境下的能力参数、系统结构、限制条件等,构建一个“自我模型”为决策提供依据,包含4部分。
(1)运行参数:通过监测获得的遥测数据。
(2)配置信息:软硬件架构、版本等。
(3)能力范围:可以完成和不能完成的事项。
(4)局限性:只能在特定条件下工作的约束。
执行功能层
执行功能层扮演“项目经理”的角色,将来自高层的战略使命转化为明确的计划路线图。路线图提供所有具体的执行步骤,同时考虑资源分配和风险管理,使战略落地,包含4部分。
(1)定义任务步骤:将战略任务分解为细粒度操作。
(2)设置检查点:定义重要的中间结果以验收进展。
(3)分配资源:优化资源使用以保证计划顺利执行。
(4)评估风险:预测可能的问题并提前规划应对措施。
认知控制层
认知控制层扮演“任务管理”的角色,会根据当前环境和反馈动态选择和调度合适的任务,包含4部分。
(1)任务选择:根据优先级、环境等选择下一个任务。
(2)任务切换:在任务间流畅切换以优化订单。
(3)挫折感知:如果任务重复失败会产生主动变更。
(4)内部调节:思考不同选择的利弊。
任务执行层
最后的任务执行层直接与环境交互,执行由认知控制层下达的特定任务。根据任务类型,可以调用API接口、控制机械装置、进行对话等,包含3部分。
(1)数字通信:使用编程语言和接口调用实现数字任务
(2)物理协同:控制机器人和传感器完成物理任务
(3)结果监测:比较结果与预期,发送成功或失败反馈
这种分工明确的多层设计有诸多好处:第一,不同层级可以同时并行工作,提升了效率;第二,分层的封装和信息隐藏增强了系统的安全性和可解释性;
第三,分层使系统可以模块化迭代升级,而不需要全重构;第四,高层可以监控低层的运行, 当Einmal出现偏差可以进行修正,保证系统的可控性。
此外,ACE框架的另一个创新在于巧妙利用了当前热门的大语言模型,例如,ChatGPT、Bard等。
这些模型通过学习海量文本数据,已经展现了接近人类的语言理解和语言生成能力。ACE框架将语言层面融入每个层级,使语言模型不再单独运行,而是成为支撑整个认知架构的关键组件。
从道德层到任务层,语言模型帮助理解抽象概念,进行策略推理,建立自我模型,甚至最终控制机器人执任务的方式都是语言化的。
这种融合为语言模型提供了明确的上下文和指导,让其生成的输出更加准确,避免了“自说自话”的问题。
这也表明,大语言模型也可以在系统级扮演重要角色,而不仅仅是完成单个语言任务。ACE框架展示了如何更好地利用大语言模型的潜力,将其打造为推动认知发展的核心引擎,为人工常识推理提供动力。
本文素材来源克莱姆森大学论文,如有侵权请联系删除