GPT-4最强竞品迎来重磅升级:一次10万token,百页资料一分钟总结完毕

夕小瑶科技说 分享
来源 | 量子位
作者 | 丰色 萧箫

号称ChatGPT“最强竞争对手”的Claude,今天迎来史诗级更新——

模型记忆力原地起飞,现在1分钟看完一本数万字的小说,已经不在话下。

消息一出,评论区直接炸了,网友们蜂拥而至,“woc连连”:

疯了疯了!


事情进展得太快了,又是为人类担心的一天!


原来,这次更新,将模型的上下文窗口token数提到了足足10万,相当于7.5万个单词!

这意味着,大模型“记性”不好的缺陷现在得到补强,我们可以直接丢给它上百页上万字的材料,比如财报、技术文档甚至是一本书。

而它都能在一分钟之内帮你分析总结完毕!

要知道,之前市面上几乎所有AI聊天机器一次都只能读取有限数量的文本,理解长资料里的上下文关系非常灾难。

而我们人类自己去处理大篇幅的文本又太慢了,比如光是要读完10万token的材料,就需要大约5个多小时,更别提还要花更多的时间去理解去消化才能进行总结。

现在,Claude直接一把搞定。

这波,简直是“五雷轰顶”、“反向开卷”GPT-4,因为,刚刚后者也不过才做到3.2万token。

所以,一次性比GPT-4多出3倍的处理量,Claude效果提升究竟如何?

Claude重磅更新:一次记忆10万token

据Anthropic官方介绍,升级后的Claude-100k版本,对话和任务处理能力双双得到极大提升。

一方面,是“一次性可处理文本量”的增加,直接拓宽了Claude的可从事岗位类型。

之前,大模型最多用来处理个几十页的文档。

现在,Claude已经能速读公司财报年报、技术开发文档、识别法律文件中的风险、阅读上百页研究论文、乃至于处理整个代码库中的数据。

最关键的是,它不仅能通读全文总结其中的要点,还能进一步完成具体任务,如写代码、整理表格等。

例如,快速理解几百页的开发文档,并根据文档开发应用程序demo。

以Claude之前没见过的一项新技术LangChain作为示例:

当交给它一个240页的LangChain API报告后,要求它快速给出一个LangChain的demo演示:

几乎没用多少时间,Claude就快速给出了一个基于LangChain开发的应用程序demo:

又例如,甩给它一个漫长但又不得不听的5小时知识播客:

它不仅能将重点转成文字提取出来,还能快速整理表格,对观点进行分析:

难度增大一点,30页的研究论文也能很好地处理,甚至能准确指定它整理某一章节的某一段落:

除此之外,还能帮导演处理剧本选址一类的问题。如给出《沙丘》的电影脚本,问Claude最适合拍摄的地点,它很快就能给出几个对应的参考地址:

最后,官方还给出了一个《了不起的盖茨比》案例,虽然没有demo演示。

他们将这篇喂给Claude后,替换了其中一个角色Mr. Carraway,把他的角色变成“Anthropic里的一位工程师”,再交给Claude阅读,让它找不同。

几乎只用22秒钟,Claude就读完这本书,并发现了Mr. Carraway的“不同身份”。

另一方面则是“记忆力”的增加,带来了对话题掌控度的提升、以及聊天能力的提升。

此前大模型经常会出现“聊着聊着忘了话题”的情况,对话窗口总字数超过几千字后,开始胡言乱语。

举个栗子🌰,如果你用大量提示词设置了一个ChatGPT版猫娘,那么它开始聊天后,可能几个小时就忘记了自己和你说过的话,开始表现出一些“出轨”的迹象(手动狗头)

但现在,拥有一次10万+个token记忆力的Claude,则不太可能出现这种情况,反而能牢牢记住和你聊过的话题,连续交谈上好几天。

那么,目前我们能通过什么方式用上最新版Claude呢?

API和网页版均已上线

各个大模型的研究测试传送门

阿里通义千问传送门:

https://tongyi.aliyun.com

百度文心一言传送门:

https://yiyan.baidu.com

ChatGPT传送门(免墙,可直接测试):

https://yeschat.cn

GPT-4传送门(免墙,可直接测试,遇到浏览器警告点高级/继续访问即可):

https://gpt4test.com

Anthropic先是宣布推出了Claude-100k的API版本,之后又火速上线了网页端。

Anthropic工程师

所以无论你是用网页端还是用API,目前都已经可以直接体验这个拥有“超长记忆力”的Claude版本。

很快啊,已经有网友迫不及待玩上了。

像OthersideAI的CEO Matt Shumer,就试用了一下网页端的Claude-100k总结技术报告的效果。

他先测了波Claude-9k的效果,发现它面对长达上百页的GPT-4技术报告,还是会出现“幻觉”;随后测试新版Claude-100k,发现它给出了有理有据的估计:

GPT-4的参数量级大约在5000亿左右!

这是它的推测过程:

不知道这波OpenAI的奥特曼会不会出来辟谣(手动狗头)。

还有一位Assembly AI的老哥,测试了一下Claude-100k的API版本。

在视频演示中,他用Claude-100k总结了一下Lex Friedman的5小时长播客(内容与John Carmack有关),效果看起来也非常不错:

但无论是网页版还是API,都还不是我们能免注册直接试玩的版本。

之前我们说的不用注册、不用申请、不用“骚操作”就能玩、体验也很不错的是slack端,它的添加方法我们在之前的文章中介绍过,非常简单。

遗憾的是,目前它还是Claude-9k“体验版”。

所以,总结一下就是,这个Claude-100k的版本:

  • 可以用API的方式体验,不过不是免费的;

  • 网页版也行,但需要你有试用资格,没有就去申请,等一等;

  • Slack端还不行,只是个体验版。

反向开卷GPT-4,网友:卷对了方向

昨天,谷歌刚刚在I/O大会上宣布了数项重大更新,包括:

  • 重构谷歌搜索、开启AI对话

  • 发布大模型PaLM 2

  • 全面开放Bard,不用排队直接玩

……

这被视作针对微软和OpenAI的一系列反击。

图片

现在,来自Anthropic的Claude紧随其后,发布如此重大更新,直接反向开卷GPT-4——

有网友评价:

Claude卷对了方向。

确实,目前大部分语言模型普遍都只能处理2-8k的token量,大家都在苦苦追寻提高模型记忆力的办法。

比如上个月那篇可将Transformer token上限扩展到100万甚至200万的论文就引起了非常大的关注,不过网友测试效果似乎不太理想。

现在,Claude直接“业内第一人”宣布做到了100k,并拿出来给大家用,很难不让人称赞。

除此之外,还有网友“站得更高”,称:

资本主义之间的竞争果然很美妙。

言外之意,卷得好啊卷得妙。没有巨头和各垂直企业之间的你争我抢,我们哪能在短短两天之间又目睹了如此多和重大的进展呢?

诶,不过话说回来,鉴于Anthropic是由当初不满意OpenAI与微软走得太近的几位前员工创立,而谷歌也斥资3亿美元投资了这家公司。

大胆猜测:

这次两人前后脚的“一唱一和”,是不是提前商量好的?

参考资料

[1]https://techcrunch.com/2023/05/11/anthropics-latest-model-can-take-the-great-gatsby-as-input/
[2]https://twitter.com/AnthropicAI/status/1656700154190389248
[3]https://www.anthropic.com/index/100k-context-windows
[4]https://twitter.com/mattshumer_/status/1656781729485529089
[5]https://www.youtube.com/watch?v=2kFhloXz5_E

本文由mdnice多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/34568.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

总结下软件架构的10个质量属性

一般地,对于软件系统的需求而言,分为两类:功能性需求和非功能性需求。软件系统的架构设计既要满足软件的功能性需求,还要满足软件的非功能性需求。特别地, 系统架构对软件非功能性需求的支撑成为架构的质量属性。本文描…

对接微信公众(开放)平台,获取微信用户信息,实现第三方登录

一、主要流程 实现第三方登录,从微信获取用户信息,用微信公众平台和微信开放平台,其实流程和原理都是一样的,就是调用的接口和对应的参数有点区别。 微信公众平台 和 微信开放平台 对应的官方文档如下: 微信开放文档…

Java-最新微信第三方平台公众号授权

第三方平台api地址 https://developers.weixin.qq.com/doc/oplatform/openApi/OpenApiDoc/预授权码获取之后调用接口获取授权方信息 https://developers.weixin.qq.com/doc/oplatform/Third-party_Platforms/2.0/api/ThirdParty/token/authorization_info.html#%E6%8E%88%E6%9D…

微软 Edge 浏览器怎样安装插件

微软 Edge 浏览器怎样安装插件 一、安装微软商店提供的插件二、安装第三方插件到Edge浏览器 之前安装插件就没有了解很深,放到浏览器里面就直接用了,最近再次想在微软的Edge浏览器安装插件的时候,发现没有之前的那么顺手,于是记录…

惊!最靠谱的谷歌与edge浏览器安装扩展插件方法

谷歌与edge浏览器安装扩展插件 谷歌浏览器安装扩展插件Edge浏览器安装扩展插件注意 谷歌浏览器安装扩展插件 1.在浏览器地址栏中输入: chrome://extensions/ 2.打开开发者模式,并点击加载已解压的扩展程序 3.选中下载好的文件夹feisou-assist导入即可&#xff…

电影解说文案开头模板

一个好的解说文案,开头几句必须精彩!我们要解说一部影视作品,首先得自己先看一两遍,摸清故事情节,到底讲了一个什么故事,然后再结合我们对故事的理解,将故事讲给观众听。我们把文案分为开头、内…

修改Ubuntu国内镜像源地址

目录 方法一方法二方法三 方法一 Ubuntu可视化界面修改 在设置中的软件和更新中修改红框内容即可,修改后关闭会提示重启服务选择它即可 方法二 修改源文件 位置:/etc/apt/sources.list 首先备份以便出错后还原:sudo cp /etc/apt/sources.…

跟着GPT-4 从零完Python 爬虫

前言 先说个人情况:我作为产品经理自从 4 年前毕业很长时间都没有写过代码了,本科时候接触过一点 Python 的 慕课,但那个时候也是理论多于实操,为数不多跑通过的爬虫可能是豆瓣的电影 TOP 250;更多时候是被环境配置和…

Go 统计含 emoji 字符串字符数

1.背景 项目种需要统计用户昵称的字符数量进行限制,用户可以输入英文,中文,emoji 字符,当用户输入中英文和普通的 emoji 字符时,将字符串转为 []rune 进行统计没有问题。 func main() {s0 : "我爱中国" …

PostgreSQL中统计指定字符或者单词或者字符串在一个长字符串中出现总次数,PostgreSQL统计字符串中某字符出现次数

PostgreSQL中统计指定字符或者单词或者字符串在一个长字符串中出现总次数,PostgreSQL统计字符串中某字符出现次数 pg自带函数的方式另外一种思路方式,字符替换,统计被替换的字符数函数 translate(string text, from text, to text) pg自带函数…

PostgreSQL 字符串函数汇总

文章目录 前言拼接字符串填充字符串大小写转换获取字符串长度截取字符串裁剪字符串获取第一个字符的ASCII码计算string的MD5散列判断是否包含字符串null 和 的区别与判断以及COALESCE函数nullif函数合并字符串将字符串合并成一个数组分割字符串 总结 前言 本文基于 PostgreSQ…

婚礼视频mv短片制作,3分钟快速教程!教你制作婚礼开场创意视频

制作一个婚礼视频或婚礼MV短片,当下非常流行。用生活照、婚纱照片做成视频,在婚礼上当作开场或者生活中留给婚礼一个纪念,都是不错的选择。而且用照片做成视频,方法简单,但是创意依旧满满。 今天就教大家3分钟快速学会制作婚礼视频,利用生活照或婚纱照,配上数码大师里的…

SpringBoot+Redis实现接口限流

1.redis接口限流注解 定义一个注解标明需要使用限流的接口 Target(ElementType.METHOD) Retention(RetentionPolicy.RUNTIME) Documented public interface AccessLimit {/*** return 单位时间(秒)*/int seconds();/*** return 单位时间最大请求次数*/…

访问url图片并上传oss图片显示不完整问题解决

问题:在之前通过链接上传图片的时候,都是先获取inputStream流,然后通过available()方法获取文件大小。但是通过这种方法获取到的文件大小是不准确的,因为这个时候文件还没有读取完全,所以获取到的文件大小是不完全的。…

乱序执行的原理——减轻数据灾难的影响

文/Hisa Ando 处理器基本上会按照程序中书写的机器指令的顺序执行。按照书写顺序执行称为按序执行(In-Order )。按照书写顺序执行时,如果从内存读取数据的加载指令、除法运算指令等延迟(等待结果的时间)较长的指令后面紧跟着使用该指令结果的指令,就会陷…

倍福 ton_b%C3%A9ton野蛮或野蛮

倍福 ton Brutalism style mainly has emphasis on materials, textures and construction, producing highly expressive forms. Popular in the 1960s and 1970s brutalism originated post–World War II when the design of low-cost housing and government buildings wer…

每周分享第 55 期

这里记录过去一周,我看到的值得分享的东西,每周五发布。 欢迎投稿,或推荐你自己的项目,请前往 GitHub 的 ruanyf/weekly 提交 issue。 (题图:昆山火车站,苏州,2018) 关于 996 工作制&#xff0c…

每周分享第 34 期

这里记录过去一周,我看到的值得分享的东西,每周五发布。 欢迎投稿,或推荐你自己的项目,请前往 GitHub 的 ruanyf/weekly 提交 issue。 英国有一家叫做 BioTeq 的创业公司,主营业务是人体芯片,也就是在人的体…

OpenStack 环境配置

OpenStack 环境配置 虚拟机资源信息 1、控制节点ct CPU:双核双线程-CPU虚拟化开启 内存:8G 硬盘:300G 双网卡:VM1-(局域网)192.168.100.20 NAT-192.168.80.20 操作系统:Centos 7.6&#xff0…

那一年,我们在巴塞罗那找到的「ONES 图腾」

临近2021年岁末,「圣诞之星」被悬挂到圣家族大教堂第二高塔「圣母塔」之上,这意味着大教堂进入了最后的施工阶段。 圣家族大教堂(简称「圣家堂」)被称为世界上最著名的「烂尾楼」——从1882年开始修建,至今依然没有建成…