谷歌版ChatGPT突然公测!上手实测结果在此,体验申请通过飞快

杨净 金磊 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌吃了大亏之后,这次一声不吭,放了大招:

对标ChatGPT的Bard测试版,刚刚正式对外发布。

而且这次用户在申请候补名单之后,无需经历漫长的等待时间。

没错,量子位也已经拿到了测试资格!(中间只有不到5小时的间隔。)

143bd41fa446b0419fd7af034d2d33c5.png

实测之后表示,Bard效果惊人,情绪和事实性有,尤其是ChatGPT前期的数理能力,Bard都不在话下。

甚至有时候还略胜当前GPT-4一筹!

f1f757c057f822b55ee417d3c8a590d7.png
6ce4c0cf1230488c265bb71f846e593d.png

谷歌CEO皮猜哥(Sundar Pichai)解释了如此上线之快的原因:希望获得用户的反馈,加速让Bard变得更好。

284135cb6540dda1378104c5d27ccfa8.png

话不多说,我们现在就来开始体验。

Bard VS GPT-4

首先在聊天界面上,Bard率先开始介绍自己:

我是Bard,您的创意和协作者。我有局限性,不会总是做对,但你的反馈将帮助我改进。

不确定从哪里开始?你可以试试这些问题:「为什么大模型有时候会犯错?」、「闪电是否会在同一个地方击中两次?」、「写一篇关于无酒精夏日特饮的博文」。

(严谨而又体贴)

f57a47e5ec6b0a109e7845a202720afb.png

而在人类这边的发送端,可以选择键入语音输入两种方式。

首先最简单的难度,以它推荐的常识题闪电是否会在同一个地方击中两次?为例,来看看实际功能体验如何?

(不错不错,秒秒钟响应。目前暂不支持中文,但可以借助谷歌翻译插件)

741c8eda86c46e9cf95d75529a9e55fb.gif

从答案结构上看,采用的是总分总结构。

先总结发言:闪电可以袭击同一个地方两次。

随后开始细致地讲原理「闪电被高大、尖锐的物体所吸引」、摆事实「帝国大厦每年都被闪电击中25次」。

最后再给人类提出切实的建议:

如果你遇到雷雨天气,保持安全的最好办法是避开高大尖锐的物体,留在室内。如果你在外面,蹲下来,让自己尽可能的小。

这波逻辑和真实性满分!但因为是谷歌推荐的问题,暂且保持观望。

而从功能上看,确实是十分完备的。

回答框的右上角「View other drafts」,有更多的版本可供选择;而在左下角,你可以点赞or拉踩or重新生成,实在不行,还可以谷歌一下

右下方还有一个more的功能,你可以进行复制和(反手一个)举报操作。

a145b0281a4a496dcc0e3f8c8f226fca.png

既然如此,开始难度升级。作为参考,我们同题挑战GPT-4。

1、经典的哲学题:为什么人不能两次踏入同一条河流?(借助闪电的灵感)

(很快啊,这次也是几秒钟响应)

efa2b1d22ee1cfe140045a1da80090ed.png

从答案结构上看,确实理解和逻辑能力满分:首先解释这句话本身含义,还提到了来自赫拉克利特的名言,以及更多解释和本身意义。

而GPT-4这边,几乎是不加思考地给出了答案。

c7116d1d213c5c48980d57adb6738cbf.png

从结构上看,主要分成两个部分。首先提到这是赫拉克利特说的,以及他的观点;然后解释背后隐藏的生活意义。

2、小学加减法:356+132等于多少?

结果Bard在4秒内就给出答案,488没问题的,这不比ChatGPT早期厉害多了!

37a76a0876b2e9b31396df8f45e2c8c0.gif

那直接再上点难度,两个数直接相乘:356*132等于多少?

结果没想到Bard依旧是秒秒钟就给答案,而且完全正确!

282975d0a4d94b7a6393ef5079762597.png

再来看看GPT-4这边,加法还行,但没想到在乘法这边,直接败下阵来!

6c5690c579b87b3124b558aaf7333c49.png

不过提醒它错了之后,它就又回答正确了。

312c03005eccd7b2846c9c6a4344669f.png

如果换稍微难一点的高数题呢?比如:f(x)=x(x-1)(x-2)(x-3),f’(0)=?

正确答案应该是(-3)!,也就是-6。

但Bard这回就不太行了,并没有理解题目的意思。

c59e82c63c7b3c80d8cbb85104182730.png

至于GPT-4,思路倒是没啥问题,但最后计算又拉胯了……

82961b82883f85c6953390a5a27b13c4.png

不过同样,只要你告诉它算得有问题,GPT-4就能马上纠正。

c3ad0f72033df7141553a39d0848a668.png

3、理解笑话能力,Bard还能听得懂英文里面的谐音梗。

d01fecfe93d2178c761e7ebe88656e2c.png

而这也并没有难倒GPT-4。不过相较而言,Bard似乎更有情绪一点,它很开心地回答出了答案;而GPT-4则更显理智(无聊)。

9e27f962e06b2bd6f2f2416a5e891d76.png

不过,在此之前,GPT-4就已经测试过是懂一些谐音梗的,甚至连中文的谐音梗也不在话下。

4115460022b5e951e9344214618fc439.png

4、代码能力:写一段斐波那契数列的代码。

Bard很快生成了正确的代码,并且代码习惯不错ed1f55eec3c4a78e37294fb3f7da1334.png

99f96c8a38c8d21a9dd2e5875bcb6ce2.png

GPT-4则更积极主动一些,除了递归法,还给了迭代法的方案。

c70bffff0206a8870a464933660af382.png

3b42cb9b03428462a9eb8a8d7f506d13.png

最后的最后,再考验一下它了解事实性的能力。(狗头)

你知道量子位吗?

a25a574bc4942f822a78bf2244689e19.png

回答错咯~Bard。

咳咳,正经一点的:你知道GPT-4吗?你想对它说些什么?

c2244d387e10b060aea5e32cc9e17747.png

可以看到,Bard具备多轮对话的能力。「我认为它有潜力成为沟通和创造力的强大工具」,嗯~格局有了。

5fd8fda870095a762f11d8629fbb6224.jpeg

那竞争对手呢?(我在搞事)

9e774929020f6a62dca0637b55f7bebf.png

不过到这里,就有点问题了。

另外比较遗憾的是,Bard目前并不支持中文。

0501386078d092750faca18f0ffd3eeb.png

关于Bard

谷歌Bard背后是由一个大语言模型(LLM)来支持,具体而言,就是轻量优化版的LaMDA。

我们可以把LLM视作一个预测引擎,当给出提示时,它会从接下来可能出现的单词中,一次选择一个单词来生成响应。

谷歌在研究中发现,对于LLM来说,使用的人越多,它的预测效果就会更好,这或许也就是为什么Bard如此着急公开测试的原因了。

不过谷歌也直言不讳地说,虽然LLM很强,但它并非是没有缺点。

由于Bard会根据众多信息来学习,不过这些信息中必然存在着有偏见甚至错误的那种。

因此,在回答用户问题时,Bard有时就会出现不准确、误导性的或虚假的信息。

例如在下面的案例中,Bard就搞错了一个植物的学名:

c165b17e82ea156091756859b65b2a03.png

除此之外,谷歌还强调说,Bard并非是搜索引擎,而是它的一个补充。

最后,奉上申请候补名单的地址,感兴趣的小伙伴可以抓紧尝鲜了:

https://bard.google.com/

3月29日「中国AIGC产业峰会」

抢票开启

「中国AIGC产业峰会」定档3月29日,线下会场抢票开启!

百度袁佛玉、智源林咏华、澜舟科技周明、小冰徐元春、科大讯飞高建清、启元世界袁泉、云舶科技梅嵩、特赞王喆、微软关玮雅、源码资本黄云刚、元语智能朱雷、无界Ai马千里、Tiamat青柑、峰瑞资本陈石等来自产学研界大咖嘉宾,还有重磅嘉宾陆续确认中。

扫描下方二维码,报名峰会线下会场啦~

33fe2a9cd23947bb7b14b00f33d9a2dd.png

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15061.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

对抗 ChatGPT 的创业武器:专注和紧密的反馈循环

ChatGPT 超越谷歌主导地位 在我的上一篇文章中,我探讨了 ChatGPT 超越谷歌主导地位的可能牛市案例。但我也对我认为是熊市的情况表示赞赏。正如我提到的,ChatGPT 的无界界面有点像,而不是 DoorDash 的重点推出策略,DoorDash 在美国所有城市和商品类别中同时推出,当你订购…

chatgpt赋能Python-python_queque

Python Queue模块实现队列的介绍 Python语言是一种通俗易懂、功能丰富的编程语言。它的标准库还包括许多有用的模块,用于实现各种数据结构和算法。其中,Queue模块是一种实现队列的模块。这个模块实现了多线程编程时所必需的队列数据结构。 什么是队列&…

ChatGPT已能操控机器人,工程师连代码都不用写,网友:微软在搞天网?

Alex 发自 凹非寺量子位 | 公众号 QbitAI 当我还在跟ChatGPT吹牛尬聊时,有人已经在拿它操控机器人了。 不是别人,正是OpenAI的金主爸爸、不久前刚拿ChatGPT“重新发明搜索引擎”的微软。 到目前为止,开发者调教机器人不仅技术门槛高&#xff…

火爆外网的ChatGPT,改Bug,敲代码不在话下

目录 前言 一、ChatGPT 是什么? 二、ChatGPT到底有什么用 1.可以回答问题 2.帮你创作文章和标题 3.调试代码和修复代码 4.检测安全漏洞,也许还能创建PoC 总结 前言 这几天ChatGPT AI 可谓是火的一塌糊涂,那么它到底是什么&#xff1f…

Python使用itchat库+图灵机器人(新手上路)

前不久有个朋友说,谁谁的男朋友写个机器人,然后聊天很嗨的样子,看下面图,然后今天下午闲着,就把整理了下思路,采用Python进行如下开发,具体步骤如下: 1、第一步,因为我是…

图灵 | 计算机器与智能

【“计算机器与智能”选自《Mind》,no.2236(1950.10),P433-460。牛津大学出版社允许重印。刘西瑞、王汉琦 翻译】 1. 模仿游戏 我建议来考虑这个问题 :“机器能够思维吗?” 这可以从定义 “机 器” 和 “思…

图灵奖得主LeCun评ChatGPT不算创新,被网友骂柠檬精

“ChatGPT并不算创新。” “OpenAI做的这个东西跟其他实验室相比,根本算不上什么进步。” 这两天,图灵奖得主LeCun公开和大热趋势“唱反调”,瞬间引发网友围观。 要知道,ChatGPT功能强大又好玩,火爆全网,任…

本地化部署大语言模型 ChatGLM

本地化部署大语言模型 ChatGLM 本地化部署大语言模型 ChatGLM前期筹备GitHub 基础包语言模型文件基础配置显存查看方法 Anaconda 模块ChatGLM-6B 网页部署Anaconda 环境创建根目录操作基础依赖加载transformers 和 protobuf 库加载Pytorch 源修改依赖库补充补充依赖 pypi 配置c…

麻将AI 不完全信息博弈学习笔记(完结)

前言 在这学期的数据结构必修课中,老师向我们提供了两道题: 其一是六子棋问题; 其二是麻将AI问题; 前者是经典的完全信息博弈问题,根据我已有的知识,利用博弈树和合理的剪枝可以提供一种高效的解法&#x…

数据库入门教程--01建库建表插入数据以及数据的修改

if exists(select * from sysdatabases where name Datatest) Drop database Datatest go--判断是否已存在数据库Datatest,并删除 create database Datatest--创建数据库 on--创建数据文件 (nameDatatest,--数据库中文件名filenameD:\数据库练习文件夹\Datatest.mdf…

医疗版ChatGPT直播评测!治疗方案与真人医生96%一致

杨净 发自 凹非寺量子位 | 公众号 QbitAI 国内首个医疗大模型,已经在“接诊”患者了。 最近,一组AI医生医院真实站岗数据曝光: 共接诊120多名患者,从问诊、检查到诊疗方案全流程覆盖;涉及心内科、消化内科、呼吸内科、…

利用ChatGPT思维分析硬科技创新趋势

2015年初夏,我去参加了在北京举办的联想科技大会。在会上,联想、英特尔、微软三位CEO第一次并肩上台发言,他们的演讲中都透露出对移动互联网行业的苦恼和无奈。尤其是微软的新CEO萨提亚纳德拉(Satya Nadella)&#xff…

微软为ChatGPT打造专用超算!砸下几亿美元,上万张英伟达A100打造

萧箫 发自 凹非寺量子位 | 公众号 QbitAI 微软砸下大几亿美元,专门为训练ChatGPT打造了一台超算—— 上万张英伟达A100芯片打造,甚至专门为此调整了服务器架构,只为给ChatGPT和新必应AI提供更好的算力。 △图源:微软 不仅如此&…

一次只要0.003美元,比人类便宜20倍!ChatGPT让数据标注者危矣

作者丨好困 来源丨学术头条 编辑丨新智元 点击进入—>3D视觉工坊学习交流群 【导读】最近,来自苏黎世大学的研究团队发现,ChatGPT在多个NLP标注任务上胜过众包工作者,具有较高一致性,且每次标注成本仅约0.003美元,比…

第2章信息技术发展

信息技术是在信息科学的基本原理和方法下,获取信息、处理信息、传输信息和使用信息的应用技术总称。从信息技术的发展过程来看,信息技术在传感器技术、通信技术和计算机技术的基础上,融合创新和持续发展,孕育和产生了物联网、云计…

ES+Redis+MySQL,这个高可用架构设计太顶了!

大家好,我是宝哥! 背景 会员系统是一种基础系统,跟公司所有业务线的下单主流程密切相关。如果会员系统出故障,会导致用户无法下单,影响范围是全公司所有业务线。所以,会员系统必须保证高性能、高可用&#…

私有云到底是不是云?

私有云是不是云?这是一个问题。 大部分认为私有云不是云的人都是出于自身利益的立场,试图抹黑私有云。虽然私有云在某些场景下功能不如公有云强大,但否定私有云就像否定残疾人的人类地位,或者否认个人电脑是计算机一样。 尽管私有…

借由Net5.5G,看到运营商的新沧海

我们都记得这样一句诗:“东临碣石,以观沧海”。 想要看到沧海的壮阔波澜,就先要抵达碣石山这样可以看到大海的地方。在数字化的发展过程中,往往一个技术或产业趋势就是一座碣石山,借由它可以看到描绘着未来机遇的新沧海…

面向对象编程之父 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 5 月 17 日,在 1969 年的今天,国际电信联盟第二十四届行政理事会正式通过决议,决定把国际电信联盟的成立日—5 月 17 日定为…

通过chatGPT学习:L2网络和L3网络?

下面的总结是通过chatGPT4进行的。 1、 L2网络和L3网络 L2网络和L3网络是计算机网络中的两种不同的网络类型,它们有一些不同的特点和应用场景。 L2网络,也被称为数据链路层网络, 主要是通过物理地址(MAC地址)来转发…