问了 Gemini 1.5 Pro 五个问题,找到了初遇ChatGPT的感觉

一个月前(2月15日),Sora和 Gemini 1.5 同时推出,这个故事很多人都听过了,Google 被冠以 AI 界汪峰的名头。

人们纷纷震惊于 Sora 的强大,讨论 Sora 是不是世界模型。而 Gemini 1.5 的第一个模型 Gemini 1.5 Pro 在发布后没多久就逐渐无人问津了。

当时 Gemini 1.5 Pro 只开放了 Waitlist,一直没能上手测倒是成了一块心病。

最近 Gemini 1.5 Pro 迎来一波大规模开放测试,当时排队的基本都能使用了,有些没有邮件通知,朋友们都可去看看。

链接 :https://aistudio.google.com/

图片

Gemini 1.5 Pro 最大的特点就是10M 上下文与多模态理解相互搭配,实现超强的检索和学习能力,我们也就围绕这两点,问了他五个问题

问题一:88 万字的《三体》,后续故事怎么发展?

我们向Gemini提供了长达约88万字的科幻小说《三体》,它可以根据小说的题材重新编写一版新的小说大纲,从背景设定、主要人物、情节梗概、主题设定到小说结局它可以非常有逻辑地完成。

另外对于《三体》的开放式结局它也可以继续扩写,在充分地满足大家的各种想象的同时又不脱离原著。

图片

问题二:20篇论文,哪篇更有价值?

我们选取了20篇神经网络相关的英文学术文章。Gemini 不仅能够对各种细节问题对答如流,而且还能够非常有条理有逻辑地整理出最具参考价值的学术论文。

各位研究学者们再也不用熬夜看文献写报告了!你们的头发有救啦!

图片

问题三:我该怎么学习 JavaScript?

我试着用两个功能时想到,上传一本课本岂不妙哉!这技术能读懂全书,大学党考试周还愁啥!直接1对1辅导到手。

下面我直接上传了《JavaScript高级程序设计(第4版)》,Gemini 还帮我搞了个大纲和学习建议,真懂我们。不仅考试的时候能天天陪着你,指导复习,还能出套带答案的期末题,老师们可能得偷偷珍藏。

图片

图片

逐渐成型的生态

上传了个 Open AI 机器人的视频到 Gemini,它不仅快速总结出来,准确度还挺高;还把视频里的英文字幕翻译成了中文。

为测深度理解,让它找视频里机器人递苹果的画面,它真找到了!

好奇它能不能辨认手绘,我画了个苹果试试。一开始,它认出苹果,但装作没在视频里看见过。我一逼问,它才勉强承认,还不忘找借口,吐槽我画的苹果和视频里的完全不像!

图片

问题五:什么?Sora 是 Google 出品的?

本次测试可以看出 Gemini 能够对视频画面进行精确的解读,但是当我问到它对 Sora 的了解时,它却说 Sora 是 Google 训练的模型。

总的来说它具有一定的逻辑能力和常识的,同样似乎没有联网能力,不能获取近期发生的事件。

图片

整体使用下来,我能看到它 10M 上下文的潜力,能让人发出“啊?这样也可以的?”的惊呼。就好像是第一次使用 ChatGPT 的那种感觉。

但也能看到它也存在很多瑕疵,比如老生常谈的幻觉问题,不能被 Sora 抢了风头就说 Sora 是自家兄弟吧。

而且这次大规模开放也导致算力不足,很多问题都回答的非常“懒惰”,只能提示“继续”让他继续回答,但也效果不好。在他人演示中 60 分钟的视频可以很好的理解,但在实际测试中,超过 30 分钟的视频,就会经常出现超时未响应的情况。尽管 Token 长度允许,但算力也分配不过来了。越短的视频,它处理的也就越好。

目前不支持联网,也无法读取视频链接,只能说是尝鲜试用。

最近 Google 也发布了 Gemini 1.5 的详细介绍文档:

https://arxiv.org/ftp/arxiv/papers/2403/2403.05530.pdf

里面展示了一个非常有意思的场景:

测试人员将一本Kalamang语言的参考语法书、一个双语词汇表(字典),以及大约400句额外的句子喂给了 Gemini 1.5 Pro,这些素材总共大约有250K tokens。

这个任务的挑战在于,Kalamang语是一种只有不到200个使用者的濒危语言,在模型的训练数据中几乎没有出现,因此 Gemini 1.5 Pro 必须依赖于上下文中给出的数据进行学习,来给出答案。

最终的结论是:

  • Gemini 1.5 Pro在半本书的设置下,其表现远远超过了GPT-4 Turbo和Claude 2.1。当给予整本书的上下文时,Gemini 1.5 Pro的表现进一步提升。在Kalamang到英语的翻译中,Gemini 1.5 Pro的人类评估得分为4.16(满分6分),而在英语到Kalamang的翻译中,得分为5.38。与此相比,人类语言学习者的得分分别为5.52和5.60。虽然不如人类学者,但也遥遥领先同行竞争对手了。

图片

期待赶紧给 Gemini 1.5 模型更新到 Gemini 的消费级产品中,作为 Gemini Advance会员已经迫不及待的想要使用它的完整版了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/277926.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

redis发布订阅与stream类型

发布订阅 redis发布订阅(pub/sub)是一种消息通信模式;发送者(pub)发送消息,订阅者(sub)接收消息。redis客户端可以订阅任意数量的频道。 基础命令: 语法 redis publish命令基本语法如下: redis 127.0.0.1:6379> PUBLISH ch…

unity学习(61)——hierarchy和scene的全新认识+模型+皮肤+动画controller

刚刚开始,但又结束的感觉? 1.对hierarchy和scene中的内容有了全新的认识 一定要清楚自己写过几个scene;每个scene之间如何跳转;build setting是add当前的scene。 2.此时的相机需要与模型同级,不能在把模型放在相机下…

STM32输入捕获模式测频率

STM32频率的测量:高频适合使用的方法是测频法,低频适合使用的是测周法,(其中使用测频法测量频率比较稳定,使用测周法测量频率的方式没有这么稳定,因为测周法只会通过一次的测量就能得出结果所以测试出来的频…

WPF监控平台(科技大屏)[一]

跟着B站的视频敲了一个略微复杂的WPF界面,链接如下.在这里我详细的写一份博客进行设计总结. 系统介绍和配置及主窗口设计_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1Wy421Y7QD?p1&vd_source4796b18a2e4c1ec8a310391a5644b6da 成果展示 实现过程 总体来说,我的…

Python程序设计基础——代码习题

1 __name__属性 import demodef main():if __name__ __main__:print(这个程序被直接运行。)elif __name__demo:print(这个程序作为模块被使用。) main()3.3 编写程序,生成包含1000个0~100之间的随机整数,并统计每个元素出现的次数。 import randomx[r…

某赛通电子文档安全管理系统 DecryptApplication 任意文件读取漏洞(2024年3月发布)

漏洞简介 某赛通电子文档安全管理系统 DecryptApplication 接口处任意文件读取漏洞,未经身份验证的攻击者利用此漏洞获取系统内部敏感文件信息,导致系统处于极不安全的状态。 漏洞等级高危影响版本*漏洞类型任意文件读取影响范围>1W 产品简介 …

Orbit 使用指南 03 | 与刚体交互 | Isaac Sim | Omniverse

如是我闻: “在之前的指南中,我们讨论了独立脚本( standalone script)的基本工作原理以及如何在模拟器中生成不同的对象(prims)。在指南03中,我们将展示如何创建并与刚体进行交互。为此&#xf…

Jmeter+ant,ant安装与配置

1.ant含义 ant:Ant翻译过来是蚂蚁的意思,在我们做接口测试的时候,是可以用来做JMeter接口测试生成测试报告的工具 2.ant下载 下载地址:Apache Ant - Ant Manual Distributions download中选择ant 下载安装最新版zip文件 3.…

解决分布式事务,Seata真香!

年IT寒冬,大厂都裁员或者准备裁员,作为开猿节流主要目标之一,我们更应该时刻保持竞争力。为了抱团取暖,林老师开通了《知识星球》,并邀请我阿里、快手、腾讯等的朋友加入,分享八股文、项目经验、管理经验等…

4、设计模式之建造者模式(Builder)

一、什么是建造者模式 建造者模式是一种创建型设计模式,也叫生成器模式。 定义:封装一个复杂对象构造过程,并允许按步骤构造。 解释:就是将复杂对象的创建过程拆分成多个简单对象的创建过程,并将这些简单对象组合起来…

Linux字符设备驱动开发一

linux字符设备驱动 0 驱动介绍1 字符设备驱动1.1 字符设备相关概念和结构体1.2 实现简单的字符设备模块1.3 创建字符设备1.4 总结 应用程序调用文件系统的API(open、close、read、write) -> 文件系统根据访问的设备类型,调用对应设备的驱动API -> 驱动对硬件进…

面试经典150题——随机链表的复制

​前两天断更了两天有点事情🤗 1. 题目描述 2. 题目分析与解析 2.1 思路一 开始还是没什么思路,没思路那就先把题目解决不管方法的好坏。如果不考虑复杂度,该怎么解决? 可以有这样的一种思路: 首先复制链表的所有节…

记OnlyOffice的两个大坑

开发版,容器部署,试用许可已安装。 word,ppt,excel均能正常浏览。 自带的下载菜单按钮能用。 但config里自定义的downloadAs方法却不一而足。 word能正常下载,excel和ppt都不行。 仔细比对调试了代码。发现app.js…

fetch,前端 面试题

Fetch Fetch API 是近年来被提及将要取代XHR的技术新标准,是一个 HTML5 的 API。 基于promise的设计,返回的是Promise对象 fetch()采用模块化设计,API 分散在多个对象上(Response 对象、Request 对象、Headers 对象)…

Java双非大二找实习记录

先说结论:2.22→3.6线上线下面了七家,最后oc两家小公司,接了其中一个。 本人bg: 真名不经传双非一本,无绩点无竞赛无奖项无实习,23年12月开始学java。若非要说一点相关的经历,就是有java基础&…

新手向-从VNCTF2024的一道题学习QEMU Escape

[F] 说在前面 本文的草稿是边打边学边写出来的,文章思路会与一个“刚打完用户态 pwn 题就去打 QEMU Escape ”的人的思路相似,在分析结束以后我又在部分比较模糊的地方加入了一些补充,因此阅读起来可能会相对轻松(当然也不排除这是…

Hadoop大数据应用:NFS网关 连接 HDFS集群

目录 一、实验 1.环境 2.NFS网关 连接 HDFS集群 3. NFS客户端挂载HDFS文件系统 二、问题 1.关闭服务报错 2.rsync 同步报错 3. mount挂载有哪些参数 一、实验 1.环境 (1)主机 表1 主机 主机架构软件版本IP备注hadoop NameNode (…

Ubuntu 20.04 系统如何优雅地安装NCL?

一、什么是NCL? NCAR Command Language(NCL)是由美国大气研究中心(NCAR)推出的一款用于科学数据计算和可视化的免费软件。 它有着非常强大的文件输入和输出功能,可读写netCDF-3、netCDF-4 classic、HDF4、b…

【遍历方法】浅析Java中字符串、数组、集合的遍历

目录 前言 字符串篇 1.1 使用 for 循环和 charAt 方法 1.2 使用增强 for 循环(forEach 循环) 1.3 使用 Java 8 的 Stream API 最终效果 数组篇 2.1 使用普通 for 循环 2.2 使用增强型 for 循环( forEach 循环) 2.3 使用 Arrays.asList 和 forE…

C#调用Halcon出现尝试读取或写入受保护的内存,这通常指示其他内存已损坏。System.AccessViolationException

一、现象 在C#中调用Halcon,出现异常提示:尝试读取或写入受保护的内存,这通常指示其他内存已损坏。System.AccessViolationException 二、原因 多个线程同时访问Halcon中的某个公共变量,导致程序报错 三、测试 3.1 Halcon代码 其中tsp_width…