实用版ChatBing论文阅读助手教程+新测评

实用版ChatBing论文阅读助手新测评

AI进化(更新)的速度太快了!距离我上次的【Chat嘴硬!基于NewBing的论文调研评测报告】,才四天,它已经进化到快能用的地步了!

这次是我刷B站看到热门推荐,有一个up主,分享了一个教程:新版Bing——科研人的终极解决方案

他介绍了新版的edge dev版本浏览器,可以分栏阅读你的pdf文件。

他视频做了演示,我这篇帖子,做一个详细的教程,以及测评,把上次网页版的Chat嘴硬的问题拿过来再问一次。

另外,我要检测一下,它到底是读取了pdf网页的全文内容,还是只读取了标题,然后去网络上搜索,重新生成。

教程:

  1. newbing排队,点击www.bing.com/new,加入waitlist,把它推荐的那两个优先操作做了,否则时间再长都不行!
  2. 如果你已经排上队了,会给发一个邮件提醒你。听说最近排队周期变长了,之前是四天左右。
  3. 下载dev版本的edge浏览器!网址是:https://www.microsoftedgeinsider.com/zh-cn/download?ch
  4. 安装后,登录你排上队的邮箱

可以网页版本聊天,但这次我们测试的是侧边栏的功能。
5. 用Edge dev浏览器打开本地PDF格式的论文,会看到右上角有一个bing的案件,点开,会看到下面的图片:在这里插入图片描述

  1. 接下来就可以让chatbing来帮你总结文章了。

重现测评:

  1. 根据这篇文章的内容,帮我回答下面的问题:Q1论文试图解决什么问题?Q2这是否是一个新的问题?Q3这篇文章要验证一个什么科学假设?Q4有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?Q5论文中提到的解决方案之关键是什么?
  2. 根据这篇文章的内容,再帮我总结一下下面的问题:Q6论文中的实验是如何设计的?Q7用于定量评估的数据集是什么?代码有没有开源?Q8论文中的实验及结果有没有很好地支持需要验证的科学假设?Q9这篇论文到底有什么贡献?Q10下一步呢?有什么工作可以继续深入?

这两段文字输入进去,它并不能回答:
在这里插入图片描述
我将问题翻译成英文就可以了。

在这里插入图片描述

然后出现了诡异的问答场景:
在这里插入图片描述

我怀疑这次版本更新对中文数据的处理大大削弱了。

下面的提问,我换了一种prompt方式:

用中文回答下面几个问题:“Q5论文中提到的解决方案之关键是什么? Q6论文中的实验是如何设计的?
Q7用于定量评估的数据集是什么?代码有没有开源? Q8论文中的实验及结果有没有很好地支持需要验证的科学假设? Q9这篇论文到底有什么贡献?
Q10下一步呢?有什么工作可以继续深入?”

这次可以正常的回复了:

根据网页和搜索结果,我尝试用中文回答下面几个问题:

Q5论文中提到的解决方案之关键是什么?
A5论文中提到的解决方案之关键是情景自我模仿学习(ESIL),它是一种新颖的自我模仿算法,它结合了轨迹选择模块和自适应损失函数,可以加速强化学习。与原始的自我模仿学习算法不同,它利用了整个情景(无论成功与否)并根据**事后经验重放(HER)**将它们转化为“专家”轨迹。–没什么问题

Q6论文中的实验是如何设计的? A6论文中的实验是基于OpenAI
Fetch环境中的四个机器人操纵任务设计的。这些任务都是目标条件的,并且只提供稀疏奖励。论文将ESIL与PPO结合,并与其他几种基线算法进行比较,包括PPO、SIL+PPO、HER+DDPG、GAIL等。论文还测试了不同的轨迹选择方法对ESIL性能的影响。–没什么问题

Q7用于定量评估的数据集是什么?代码有没有开源? A7用于定量评估的数据集就是OpenAI
Fetch环境中提供的四个任务:FetchReach-v1、FetchPush-v1、FetchSlide-v1和FetchPickAndPlace-v1。这些任务都有一个目标位置和一个抓取物体,机器人需要通过移动物体来达到目标位置。论文在第五节给出了详细的实验设置和评估指标。代码已经开源在这里:https://github.com/TianhongDai/esil-hindsight. --除了Reach任务没有抓取物体之外,其他的比较正常,尤其是链接。

Q8论文中的实验及结果有没有很好地支持需要验证的科学假设?
A8论文中的实验及结果有很好地支持需要验证的科学假设。科学假设是ESIL可以解决连续控制问题,并且在稀疏奖励环境下优于其他算法。从图3和表2可以看出,ESIL在所有四个任务上都达到了最高或接近最高的成功率,并且收敛速度也很快。此外,从图4可以看出,轨迹选择模块对ESIL性能有显著影响,而自适应损失函数也有一定作用。---------其他的没什么问题,我特意去看了图4,轨迹选择模块确实重要。但是图4只是展示了自适应损失函数的变化趋势,没有讨论作用,所以这段表述有待商榷。

Q9这篇论文到底有什么贡献? A9这篇论文主要有以下三个贡献:

提出了一种新颖的情景自我模仿学习(ESIL)算法,它可以利用整个情景进行事后经验重放,并结合轨迹选择模块和自适应损失函数加速强化学习。
实证地回答了[20]提出的一个开放问题:是否可以将SIL应用于连续控制问题,并且在稀疏奖励环境下有效。-----introduction里面的内容,属于重新表述
在四个复杂度不同但具有挑战性和代表性的机器人操纵任务上取得了最佳或接近最佳性能。
Q10下一步呢?有什么工作可以继续深入?
A10根据第六节给出

A10后面没有输出了,这段回答比较长,断掉了。

这段表述还是比较理想的,我把上次的问题重新再问一下:
在这里插入图片描述
这次回答正常了,但偶尔还会出现它把你的中文,翻译成英文的情况,非常诡异。

再次分析这段回答的正确性:

Q1: 论文试图解决的问题是如何用自我模仿学习(SIL)来加速强化学习(RL),并解决连续控制任务中稀疏奖励的挑战。
没问题,但信息量低
Q2: 这不是一个全新的问题,但是现有的自我模仿学习算法在处理连续控制环境和稀疏奖励时表现不佳,因此论文提出了一种新的自我模仿学习算法:情节自我模仿学习(ESIL)。
没问题,但信息量低
Q3:
这篇文章要验证的科学假设是情节自我模仿学习可以利用整个情节中的后见之明(HER)来改进自我模仿学习,并通过引入一个轨迹选择模块来过滤不相关或不良的样本,从而提高在目标导向、稀疏奖励和连续控制任务中的性能。
没问题,信息量稍微高点。

再测试一下论文细节:
在这里插入图片描述

直接提问,会报错,因为新版本,连续对话能力也被削弱了~~~

在这里插入图片描述
看来有点问题,没有结合文章内容回答,我继续尝试用英文直接提问:

在这里插入图片描述

看来也有问题,不知道是不是我提问的方式不对。

探讨是根据pdf内容,还是重新进行网页搜索:

实验设置,我将这个pdf只保留第一页,其他的用别的文章的内容替换掉,我想看看,它会按照谁的来。
第一页是上面那篇文章,第二页到之后都是DHER算法:
在这里插入图片描述

我尝试了几次,获得了下面的截图:
在这里插入图片描述

有点诡异,所以它是有读取PDF的功能,但是提问会经常出问题,也许是用多了,现在直接不给我回复了~~~

放弃测评~~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9469.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT与Midjourney:用AI在Youtube和抖音上疯狂传播

释放被动收入和病毒式增长:2023年利用人工智能、YouTube短片、抖音、ChatGPT和Midjourney的力量,解锁被动收入和。病毒式增长:2023年利用人工智能、YouTube短片、抖音、ChatGPT和Midjourney的力量。你渴望挖掘YouTube短片和抖音的病毒潜力吗?想利用ChatG…

电脑使用代理连接,关掉代理之后连接不了网络的解决方法

关掉IP代理之后,IE浏览器代理状态还在,没有取消。需要取消的话,方法是点击IE浏览器上面的工具选项,如果是IE9及以上的版本,点击IE浏览器右上角的小齿轮图标。 具体的操作是:工具-Internet选项-连接-局域网设…

Huggingface的from pretrained的下载代理服务器方法设置

笔者需要用到下载预训练模型,但是此时TUNA和BSFU的镜像已经停止了,希望有可用的途径下载到位于网上的预训练模型。 此时查找了huggingface的文档Configuration 根据文档,该参数proxies (Dict, optional) A dictionary of proxy servers to …

内网服务器设置代理访问外网

内网服务器设置代理访问外网 背景 首先需要两台云服务器,其中服务器A无公网IP,服务器B有公网IP。 AB公网IP/110.40.255.180内网IP172.17.64.11172.17.64.17 配置A代理 直接配置环境变量即可。 cd /etc/profile.d/ vim proxy.sh进入proxy.sh文件后&…

HttpClient内外访问外网,添加代理(二)

HttpClient内外访问外网,添加代理(二) 问题背景HttpClient工具类调用url实例,附源码(一)HttpClient内外访问外网,添加代理(二) 项目搭建Lyric: 你已走得很远 …

Thinkphp5设置反代理

目的:节省OSS外网访问流出流量 购买了阿里云OSS的存储资源包后,发现还需要外网访问流出费用,内网访问是免费的。 百度得相关方法,即设置反向代理。前提是服务器和OSS存储桶需要属于同一个地区。 一、环境 服务器环境 Nginx 1.20…

端口转发与代理工具 内网代理 内网反弹代理

目录 一、LCX 二、nc 反弹 三、socks代理工具 四、frp 内网穿透利器 五、ngrok 内网穿透 理论上,任何接入互联网的计算机都是可访问的,但是如果目标主机处于内网,而我们又想和该目标主机进行通信的话,就需要借助一些端口转发…

Langchain对设置代理地址

可以通过如下方式对ChatOpenAI设置代理地址api_base from langchain.chat_models import ChatOpenAI import os OPENAI_API_BASEhttps://xxx/v1 openaichat ChatOpenAI(model_name"gpt-3.5-turbo", api_baseOPENAI_API_BASE) 参考源码如下 langchain源码 openai源…

巧用chatGPT解决生产者消费者问题

背景 学校的操作系统课程布置了一项实验,是关于生产者消费者问题的,一开始毫无头绪,通过搜索引擎搜索出来的内容也五花八门,之后就想着能不能借助chatGPT解决这一个实验。 实验要求 1.编写程序解决生产者与消费者问题&#xff…

用户注册页面接入短信验证功能的注意点?

网站或者app的用户注册页面,在接入手机短信验证接口的时候,多少都会遇到一些问题,这里就将这些问题及处理方案分享一下: 一、注册页面被刷 如果注册页面未做必要的防范的话,页面上的短信接口很容易被刷,造…

tp短信验证码(配置以及使用)

阿里云短信验证码 今天搞了一个短信的验证码,用的是阿里云的平台,https://cn.aliyun.com/ss/?k%E7%9F%AD%E4%BF%A1api,免费的验证码测试,不用充钱了。阿里的api有很多也有很多免费测试的接口(其实冲一块钱&#xff0c…

tp6 短信发送验证码

更改配置文件 app.php 里添加 //前端模块default_module >home,在config文件下cache.php里面去添加redis配置 // 缓存连接方式配置stores > [file > [// 驱动方式type > File,// 缓存保存目录path > ,// 缓存前缀prefix > ,// 缓存有效期…

有了域名想绑定域名邮箱?拥有域名后,如何免费绑定邮箱呢?如何使用【昵称@你的.域名】收发邮件

有了域名想绑定域名邮箱?拥有域名后,如何免费绑定邮箱呢?如何使用【昵称你的.域名】收发邮件 前提: 如文章标题,此篇文章的前提是“已经拥有了自己的域名” 有了自己的域名后,采用本篇文章的方式&#xf…

ios系统邮件怎么绑定QQ邮箱

一、做准备工作,开启IMAP/SMTP服务,怎么开启的教程就在↓如何开启QQ邮箱IMAP/SMTP服务?分享开启方法 - 三好电商网 然后你就获得了一串授权码 二、选择“邮件”app打开以下页面 三、选择QQ邮箱打开以下页面 四、电子邮件就填你的QQ邮箱账号…

其他邮箱如何绑定到常用的邮箱

背景介绍! 一般我们国人最最最常用的邮箱就是QQ邮箱了,能推送到QQ、能搞成自己喜好的风格等等功能确实值得青睐。 最大的优点还是:可以及时收到别人发来的消息 当然,还有其他的邮箱各有各自的用处。例如大学生母校为学生准备的…

ChatGPT 掀起抢人大战,提示词工程师年薪近34万

火爆的ChatGPT ChatGPT 引发的资本盛宴还在持续上演,每个人都在谈论它背后的AI技术,每个人都在担心自己会不会被AI替代,但很少有人注意到,这项技术带来的新就业岗位。 这种岗位被称为“提示工程师”(Prompt Engineer),…

ChatGPT之父传奇:8岁会编程,16岁出柜,2个月做到月活过亿

雷递网 雷建平 2月5日 聊天机器人ChatGPT的爆火,推出仅仅2个月,就达到月活过亿,成为历史上增长最快的消费者应用程序。 根据Sensor Tower数据,TikTok在全球推出后用约9个月时间达到1亿用户,Instagram用了30个月才达到同…

最爱 ChatGPT,每天编码 300 行,月薪 8k-17k 占比骤减!揭晓中国开发者真实现状...

作者 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 瞬息万变的技术圈,似乎随时都在给予技术人数不清的机遇与挑战: 过去一年,频繁出圈的虚拟人曾一度将元宇宙的热度推至巅峰,如今却逐渐“悄无声息”&…

ChatGPT爆火至今,国内十余家知名公司竞相入局!高质量文本标注需求不断

2022年底OpenAi推出chatGpt,爆火至今。 据《华尔街日报》报道,百度将于3月16日左右推出类似ChatGPT的聊天机器人。科大讯飞预计今年5月落地ChatGPT相关AI学习机 。与此同时,更有腾讯、华为、字节、京东、360、网易、快手等 10 余家企业宣布有…

2022年大数据产业规模已超1000亿,从ChatGPT的爆火看大数据行业发展

哈喽大家好,小编注意到最近一段时间ChatGPT突然爆火,可能很多朋友已经体验过了ChatGPT的智能程度,体验过的小伙伴们可以留言交流下心得哦! 聊天机器人ChatGPT的交流模型在经过大数据的浇灌后,展现出了令人大吃一惊的智…