从被动响应到主动帮助,ProActive Agent开启人机交互新篇章

在人工智能领域,我们正见证着一场革命性的变革。传统的AI助手,如ChatGPT,需要明确的指令才能执行任务。但现在,清华大学联合面壁智能等团队提出了一种全新的主动式Agent交互范式——ProActive Agent,它能够主动观察环境、预判用户需求,并在未被明确指示的情况下主动提供帮助。

安装步骤

  1. 克隆仓库并进入目录

    bash
    git clone git@github.com:thunlp/ProactiveAgent
    cd ProactiveAgent
  2. 创建并激活虚拟环境,安装依赖

    bash
    conda create -n activeagent python=3.10
    conda activate activeagent
    pip install -r requirements.txt

配置步骤

  1. 复制配置文件示例并进行修改
    bash
    cp example_config.toml private.toml
    请根据您的实际情况,修改private.toml文件中的default_completions_modelapi_keybase_url等设置。

运行Proactive Agent

  1. 进入./agent目录,按照README中的说明运行Proactive Agent。

资源链接

  • 项目官网:MimicTalk GitHub
  • GitHub 仓库:ProactiveAgent GitHub
  • arXiv 技术论文:技术论文链接
  • Activity Watcher:ActivityWatch 官网

ProActive Agent:AI交互的新纪元

ProActive Agent不再是简单的指令执行者,而是升级成为了具有“眼力见”的智能助手。它能够主动观察环境、预判用户需求,并在未被明确指示的情况下主动帮用户排忧解难。这一新范式下的Agent实现了从“被命令”到“会思考”的质的飞跃。

技术突破:ProActive Agent的核心组件

ProActive Agent的技术原理包括三个核心组件:

  1. 环境模拟器:模拟特定环境,为智能体的交互提供沙盒条件,通过使用Activity Watcher软件采集的真实人类数据生成事件,维护环境状态。
  2. 主动智能体:预测用户意图,生成预测任务,并在用户接受后执行任务。
  3. 用户智能体:模拟用户行为并对主动智能体的任务做出反馈,通过奖励模型模拟人类标注员的判断过程。

ProActive Agent的应用场景

ProActive Agent在日常生活中有丰富的应用潜力。以下是一些预想可实现的场景:

  • 场景1:在情侣聊天中,ProActive Agent主动为女生定闹钟提醒起床。
  • 场景2:ProActive Agent主动帮助用户存储文件,并根据文件内容重命名。

ProActive Agent的实验研究

该研究通过采集不同场景下的人类活动数据构建了环境模拟器,并构建了数据集ProactiveBench。通过训练模型,获得了与人类高度一致的奖励模型,并比对了不同模型在数据集下的性能。

ProActive Agent的性能评估

在性能评估方面,研究团队提出了一套度量方式衡量奖励模型和人工标注员的一致性,包括需求遗落(MN)、静默应答(NR)、正确检测(CD)和错误检测(FD)。在这四个度量方式上进行召回率、精确度、准确度和F1分数的计算,从结果上看,所有的现有模型都在正确检测上表现良好,但对于其他指标则性能较差。现有模型倾向于接受智能体的任务,尽管可能毫无助益。相对的,该研究训练的模型性能最优,因此被选为ProActiveBench的奖励模型。

结语

ProActive Agent的提出,有望将AI从被动的工具转变为具有洞察力和主动帮助的智能协作伙伴,开启人机交互的新范式。这一技术革新不仅将改变我们与AI的互动方式,更有望为大众群体创造更加包容和便利的智能化生活环境。

感谢您的阅读,如果您对ProActive Agent或AI的未来发展有任何想法或见解,欢迎在评论区留言讨论。

 BuluAI算力平台现已上线,再也不用为算力发愁嘞!详情点击官网了解吧~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/483179.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot(一)

Springboot(一) 什么是SpringBoot SpringBoot是Spring项目中的一个子工程,与Spring-famework同属于Spring的产品 用一些固定的方式来构建生产级别的Spring应用。SpringBoot推崇约定大于配置的方式以便于能够尽可能快速的启动并运行程序 我们把Spring Boot称为搭建程…

PDF与PDF/A的区别及如何使用Python实现它们之间的相互转换

目录 概述 PDF/A 是什么?与 PDF 有何不同? 用于实现 PDF 与 PDF/A 相互转换的 Python 库 Python 实现 PDF 转 PDF/A 将 PDF 转换为 PDF/A-1a 将 PDF 转换为 PDF/A-1b 将 PDF 转换为 PDF/A-2a 将 PDF 转换为 PDF/A-2b 将 PDF 转换为 PDF/A-3a 将…

【设计模式系列】备忘录模式(十九)

目录 一、什么是备忘录模式 二、备忘录模式的角色 三、备忘录模式的典型应用场景 四、备忘录模式在Calendar中的应用 一、什么是备忘录模式 备忘录模式(Memento Pattern)是一种行为型设计模式,它允许在不暴露对象内部状态的情况下保存和恢…

window 下用Ollama 开发一个简单文档问答系统

文档问答系统 本系统利用先进的语言模型和检索技术,为用户提供基于上传文件内容的问答服务。支持多种文件格式,包括 Word、PDF、CSV、SQL 和 TXT 文件。 功能介绍 文件上传 用户可以同时上传多个文件。支持的文件类型包括:.doc, .docx, .…

全国296个地级市平均房价数据(2000-2022年)

全国296个地级市平均房价数据(2000-2022年),包括面板数据和截面数据 点击下载 1、数据来源:安居客、房天下、房价行情网等住房交易网页整理 2、时间跨度:2000-2022年 3、区域范围:全国296个地级市 4、缺失说明:西…

贴片式内存卡 ​SD NAND​

SD NAND FLASH 贴片式SD卡 贴片式t卡 存储芯片 1. 什么是贴片式内存卡 贴片式内存卡是指一种将内存芯片直接贴装在电路板上的内存卡类型。与传统的插针式内存卡(如SD卡、MicroSD卡)不同,贴片式内存卡通常不具有外部引脚或接口,而…

C—操作符易错点

strlen与sizeof strlen求的是大小,包含“\0” strlen求的是,长度不包括“\0” 注意:空格也算一个字符 操作符“/”(除法) 对于除法操作符来说,两边都是整数,那么就是整数除法 如果想计算出小数&#x…

基于PyTorch框架的线性回归实现指南

目录 ​编辑 1. 线性回归基础 2. PyTorch环境搭建 3. 数据准备 4. 定义线性回归模型 5. 损失函数和优化器 6. 训练模型 7. 评估模型 8. 结论 线性回归是统计学和机器学习中最基本的预测模型之一,它试图找到输入特征和输出结果之间的线性关系。在深度学习框…

R语言机器学习论文(六):总结

文章目录 介绍参考文献介绍 本文采用R语言对来自进行数据描述、数据预处理、特征筛选和模型构建。 最后我们获得了一个能有效区分乳腺组织的随机森林预测模型,它的性能非常好,这意味着它可能拥有非常好的临床价值。 在本文中,我们利用R语言对来自美国加州大学欧文分校的B…

基于Java Springboot校园导航微信小程序

一、作品包含 源码数据库设计文档万字PPT全套环境和工具资源部署教程 二、项目技术 前端技术:Html、Css、Js、Vue、Element-ui 数据库:MySQL 后端技术:Java、Spring Boot、MyBatis 三、运行环境 开发工具:IDEA/eclipse微信开发…

面试题-RocketMQ的基本架构、支持的消息模式、如何保证消息的可靠传输

相关问题 1、RocketMQ的基本架构是怎样的?请简述各组件的作用。 2、RocketMQ支持哪几种消息模式(如点对点、发布/订阅)?请简要说明它们的区别。 3、如何使用Java客户端实现一个简单的消息生产者和消费者? 4、RocketMQ…

WPF+LibVLC开发播放器-LibVLC在C#中的使用

使用WPFLibVLC快速 开发一个播放器 安装包Nuget 安装下面两个包,必须安装两个 一个是相关框架对应的包,Winform就安装LibVLCSharp.Winform;WPF就安装LibVLCSharp.WPF,以此类推,他们都默认依赖LibVLCSharp,不需要例外安装 一个是…

CSS变量用法及实践

目录 一、基本用法 1.1、定义变量 1.2、使用变量 1.3 、修改变量的值 二、命名规范 2.1、使用有意义的名称 2.2、使用命名空间 三、变量值类型 3.1、如果变量值是一个字符串,可以与其他字符串拼接,例如: 3.2、 如果变量值是数值&a…

WEB开发: 丢掉包袱,拥抱ASP.NET CORE!

今天的 Web 开发可以说进入了一个全新的时代,前后端分离、云原生、微服务等等一系列现代技术架构应运而生。在这个背景下,作为开发者,你一定希望找到一个高效、灵活、易于扩展且具有良好性能的框架。那么,ASP.NET Core 显然是一个…

【汇编语言】标志寄存器(一) —— 标志寄存器中的标志位:ZF、PF、SF、CF、OF 一网打尽

前言 📌 汇编语言是很多相关课程(如数据结构、操作系统、微机原理)的重要基础。但仅仅从课程的角度出发就太片面了,其实学习汇编语言可以深入理解计算机底层工作原理,提升代码效率,尤其在嵌入式系统和性能优…

纯Go语言开发人脸检测、瞳孔/眼睛定位与面部特征检测插件-助力GoFly快速开发框架

前言​ 开发纯go插件的原因是因为目前 Go 生态系统中几乎所有现有的人脸检测解决方案都是纯粹绑定到一些 C/C 库,如 ​​OpenCV​​ 或 ​​​dlib​​​,但通过 ​​​cgo​​​ 调用 C 程序会引入巨大的延迟,并在性能方面产生显著的权衡。…

2、Three.js初步认识场景Scene、相机Camera、渲染器Renderer三要素

三要素之间关系: 有了虚拟场景Scene,相机录像Camera,在相机小屏幕上看到的Renderer Scene当前空间 Mesh人在场景 Camera相机录像 Renderer显示器上 首先先描述下Scene: 这个场景为三要素之一,一切需要展示的东西都需…

电子电气架构 --- 车载网关GW连接外部IP Tester

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 所谓鸡汤,要么蛊惑你认命,要么怂恿你拼命,但都是回避问题的根源,以现象替代逻辑,以情绪代替思考,把消极接受现实的懦弱,伪装成乐观面对不幸的…

防火墙iptables

一、概述 1.1相关概念 入侵监测系统 在互联网访问的过程中,不阻断任何网络访问,也不会定位网络的威胁,提供告警和事后的监督,类似于监控。 入侵防御系统 透明工作模式,在判定为攻击行为或者是病毒威胁时&#xff0c…

Android Camera2采集并编码为H.264

前言 本篇博文主要讲述的是基于Android原生MediaCodec通过Camera2 API进行图像数据采集并编码为H.264的实现过程,如果对此感兴趣的不妨驻足观看,也欢迎大家大家对本文中描述不当或者不正确的地方进行指正。如果对于Camera2预览还不熟悉的可以观看博主上…