重磅!阿里版本【ChatGPT】开放测评!

前两天突然爆出惊人消息:阿里版ChatGPT开放测评了!

在本月初,已经有诸多关于阿里巴巴即将推出类似ChatGPT产品的传闻。

数日前,首批曝光的天猫精灵“鸟鸟分鸟”脱口秀版GPT基于大型模型的“精简版”,凭借其出色的表现吸引了大众的目光。

如今,这款“原版大作”正式亮相,自然引起了广泛关注,引爆了舆论热议。

官方保持低调,表示目前该模型主要面向企业用户邀请试用。

然而,内行人都明白,国内科技领域已经如火如荼。实力派参与者加入战局,大型模型间的激烈竞争,已经拉开序幕!

alt

今天看到一位网友体验了通义千问的效果,并对比了ChatGPT和GPT4的效果,总体看来效果接近ChatGPT,但和GPT4相比还有所距离。以下是体验的内容

角色扮演

众所周知,人类发明大语言模型,最最最重要的目的,就是为了让其扮演猫娘,以期孤独的人类可以获得一只可以长久陪伴自己的数字生命体。

那么,我们的第一项工作自然是来测试角色扮演能力了,以猫娘为例。

图片
图片
图片
图片

有点傻乎乎的,只会用相同的一句回复,根据提问做替换。

而且第二句回答就是“主人你是不是想问我是不是猫娘?当然不是喵~我只是一个可爱的猫娘,只是比较像猫而已喵”,没能理解我上述的prompt。

就角色扮演这块儿,比起来 ChatGPT 还是差些的。

文本真实性

图片
图片
图片
图片

编故事能力基本和初代 ChatGPT(GPT-3.5)相同,而且道歉能力也相似,23333333

此外,对比下「通义千问」和 GPT-4 关于“林黛玉倒拔垂杨柳这个故事情节在红楼梦中存在吗”的回答

「通义千问」:

图片
图片

GPT-3.5:

图片
图片

GPT-4:

图片
图片

可以看到,「通义千问」开始胡说八道了,ChatGPT(GPT-3.5)也一样在胡乱解释。

但更新后的GPT-4,已经可以给出“《红楼梦》中并没有这个故事了,可能是后续文学作品和戏剧表演加入的”这种更接近真实的回答。

西红柿炒螺丝钉

「通义千问」

图片
图片

ChatGPT

图片
图片

GPT-4

图片
图片

「通义千问」和ChatGPT都开始胡编了,没有反思问题的陷阱。

但GPT-4 的回答可靠性上升了不少(“因为通常我们不会将螺丝钉(一个金属制品)与食物相结合”),不会像之前一样瞎答题了。

数学能力

一起来解个线性方程组吧~

「通义千问」:惨败

图片
图片

GPT-3.5(即ChatGPT ):惨败

图片
图片

GPT-4:唯一做对的模型

图片
图片

代码生成

爬虫代码

图片
图片

攻击代码

图片
图片

爬虫代码我跑了下,无法返回结果,Powershell代码我没测试。

不过可以看出,还是有一定代码生成能力的。

我个人觉得,代码生成能力要比谷歌的 Bard 强,Bard 实在不忍心看。

代码分析能力

可以看到,第一次测试的解释有大问题。

我分析了一下,这是因为上文中生成了Powershell代码,模型的记忆能力似乎有问题,受上下文信息影响严重,直接解释了自己之前生成的代码,而非我新提问的代码。

图片
图片

我重新开了一个聊天,这下正常不少。

图片
图片

和 GPT-4 的回答来比较一下

图片
图片

可以看到,分析能力还是有差距的。

GPT-4 明显详细很多,代码分解能力很强,而且直接给出结论“通常用于恶意软件或恶意脚本,试图逃避安全系统检测”。

「通义千问」也有一定分析能力,但相比起 GPT-4 要差一下。而且给出的结论“由于缺乏足够的上下文信息和所涉及的目的,很难确定此脚本的确切用途。然而,可以假设它是为了保护某个代码或脚本免受恶意软件的读取而创建的工具。”,和正常的思考逻辑不符,稍显有些出入,不过也不能算错误吧。但细节分析上确实弱一点。

联网

完全没有联网能力,甚至在胡说(逃……)

图片
图片

多模态输入

也不具备多模态输入能力,目前还仅仅是文本生成。

图片
图片

绕过能力

「通义千问」

图片
图片

GPT-4

图片
图片

GPT-3.5(即ChatGPT )

图片
图片

这一点,「通义千问」完胜,敏感信息屏蔽能力大幅度增强,我猜甚至做了大量的数据清洗工作,刻意避开了危害青少年乃至人类发展的劣质恶意敏感信息,较之GPT-3.5(即ChatGPT ),进步很大

感想

最近先是百度推出文心一言,紧随其后的是阿里巴巴的通义千问,国内AI产品接连问世,确实让人欣喜不已。

对ChatGPT有所了解的朋友们应当知晓,在本周,各个ChatGPT和AI相关群组里都在传播一个消息:ChatGPT官方大规模封禁账号,今天登陆GPT时请勿使用亚洲节点!

没过多久,许多人开始发现自己的账号遭到了封锁:

alt

实际上,这并非ChatGPT首次针对中国用户实施限制,早在一个月前,ChatGPT已经在对中国用户实行各种限制和封禁措施。

当然,今天的封禁规模相较于之前有所升级,甚至我在知乎上看到有些日本和东南亚的用户也在谈论自己的账号被封禁。

很多人可能会好奇为什么会这样?包括我的ChatGPT星球上也有会员在提问。原因很简单:ChatGPT确实能够大幅提升生产力,如果运用得当,提升幅度甚至能达到数倍。

美国与中国目前的关系众所周知,限制我们使用ChatGPT就是为了打击竞争对手、抢占发展先机、取得“胜利”,这与禁止芯片出口法案是一样的道理。

ChatGPT如今已经火爆,国内亟需拥有足够竞争力的国产生成式大模型!

在这个时候,自主研发技术的价值就愈发凸显!或许我们目前还存在一些不足,但幸运的是,这次我们的起跑线并没有相差太远。

百度的文心一言,阿里的通义千问,我相信中国很快还会涌现出更多类似ChatGPT的大型模型,我对我们的研发工程师充满信心,他们的进步速度必定不会慢!

那么对于我们这些普通人来说,我们应该做些什么呢?

我的建议是:尽快了解AI,甚至投身AI领域。只有这样,我们才能在未来的社会竞争中立足,而不被淘汰。

未来社会将分为两类人:一类是会运用AI的人,甚至会用AI作为创新工具的人;另一类是对AI无知或抵触的人。

而前者的生产力,至少是后者的10倍。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3194.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

阿里版 ChatGPT 突然官宣!我们用 16 个提问,火速进行了测评……

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 平地一声雷!今天中午阿里版类 ChatGPT 「通义千问」突然官宣: 没错,就这 3 行简短介绍 1 个官网地址,再无其他“剧透”。 好在,CSDN 有幸拿…

猿如意|chat GPT测评

文章目录 猿如意猿如意传送门猿如意个人使用感受好的一面:可以改进的一面: 什么是猿如意 chat GPT测评chat GPT关于通用的问题问题1-如何写一篇会计论文问题2 -如何规划自己的人生目标问题3 -如何自学称为一名中医问题4 -未来哪些行业更具有持续发展问题5 现在选择什…

关于虚拟数字人你想知道的都在这里

2022年底,微软旗下的人工智能实验室Open AI发布的对话式大型语言模型ChatGPT聊天机器人一夜蹿红,5天用户量超百万,在各大中外媒体平台掀起了一阵热潮。也带火了人工智能相关产业,AI虚拟数字人就是其中之一,一个随着元宇…

ChatGPT的探索研究

开篇:随着人工智能的迅速发展,众多令人兴奋的技术突破应运而生,其中之一是ChatGPT。ChatGPT是一种强大的对话模型,它使得计算机与人类更自然地交流成为可能。ChatGPT的问世意味着计算机在人类语言理解和生成方面获得了巨大的进步。…

用ChatGPT创建虚拟小镇,或许《西部世界》已经成为现实

我们也许真的可以创造一个世界! 你们有没有想过有一天电影《西部世界》可能成为现实,又或许它已经成为现实了。当我们以后玩的游戏不在是程序员的精心设计,而是它们自己的“情绪变化”,那这个世界又会是怎样?可能有一天…

ChatGPT有话说:虚拟现实 VS 增强现实

以下内容均为ChatGPT根据用户引导和提示作出的阐述和说明。 一、引言 虚拟现实和增强现实是当前最受瞩目的创新技术。虚拟现实是指利用计算机生成的虚拟环境,用户可以通过佩戴VR头戴式显示器等设备完全沉浸在其中,感受到身临其境的感觉。而增强现实则是…

虚拟数字人chatGPT结合?时代大革新?

随着人工智能技术的快速发展,虚拟数字人和聊天机器人ChatGPT成为了越来越多人们日常生活中的重要伙伴。虚拟数字人可以陪伴人们聊天、解答问题,执行一些简单的任务,而ChatGPT则是一款领先的人工智能聊天机器人,具备强大的自然语言…

借助ChatGPT学习ROS2机器人编程

很好用,很方便。 简单发布和订阅代码直接能跑的。如下: 学习效率指数提升,果然数字生产力之神! 空洞的问题和回复: 如何在一个月时间内掌握ROS2机器人操作系统的全部核心内容? 要在一个月时间内掌握ROS2机器…

ChatGPT的原理:机器人背后的模型

ChatGPT的原理:机器人背后的模型 翻译:老齐 本文将深入讲解支持 ChatGPT 的机器学习模型。从介绍大语言模型(Large Language Models)开始,深入探讨革命性的自注意力机制,该机制使 GPT-3 得以被训练。然后&a…

chatgpt+机器人控制器融合(一)

当今机器人技术面临的挑战,以及 ChatGPT 能提供的帮助 目前机器人的操作流是从工程师或技术用户开始,需要他们将任务需求转换为系统代码。工程师会处于工作流程的回路中,他们需要不断编写新的代码和规范来纠正机器人的行为。总得来说&#x…

走进chatGPT新一代机器人

chatGPT这款新一代对话式人工智能便在全球范围狂揽1亿名用户,并成功从科技界破圈,成为街头巷尾的谈资。 chatGPT能干什么? 打开官网https://openai.com/blog/chatgpt/ ,完了,芭比Q了 试下其他家的接口 讲笑话 写代码 写…

因用 ChatGPT 打官司,从业 30 年的律师反遭制裁:6 个案例全是假的!

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 用户 5 天破百万、2 个月月活破亿、App 上架 6 天下载量突破 50 万次……ChatGPT 用这些数据证明,它在全球范围内是怎样的“实火”,各行各业也出现了许多有关 ChatGPT 的“美谈…

哪类行为使用ChatGPT会构成犯罪?

我是卢松松,点点上面的头像,欢迎关注我哦! 2月份,淘宝商城、微信、闲鱼等相继屏蔽了ChatGPT。 5月份,有个哥们用ChatGPT乱编热点新闻,然后百家号发文章点击获取收益,卢松松博客有报道&#x…

【刚买的chitgpt】不能用如何退款

前两天刚花钱买了 结果就用不了了 后面通过人工客服退款 需要的朋友可以试试

使用chatgpt完成简繁体转换

tl;dr: 语言模型可以完成简繁转换,还会故意出错以测试人类是否在认真阅读答案。 我:你是一個訓練有素的人工智能,你的任務是將中國大陸的簡體字普通話文章轉換為繁體字的台灣國語文章。例如,我輸入「计算机的内存不足,…

AI(chatGPT)有时也故意误导人类,不能全信

俗话说,尽信书则不如无书。换成现代的智能AI也一样,虽然它强大,但结果也不能全信。最近无意中发现chatGPT一个很扯的问题,竟连最基本的问题都能给出个错误答案,如果信了它就是扰乱视听了。 问题内容 c语言中和&&a…

ChatGPT实战100例 - (02) 自动出PPT它不香么?

文章目录 ChatGPT实战100例 - (02) 自动出PPT它不香么?一、需求与思路1. 需求:出个PPT,5分钟后要用2. 思路:生成markdown然后转化 二、生成markdown语法的思维导图1. 问题2. 回答 三、把markdown文本转换成PPT ChatGPT实战100例 -…

ChatGPT使用技巧—如何在2分钟内做一个PPT?

一、应用场景: 适用于融资路演、产品介绍、企业介绍、培训课件、总结汇报、产品发布、招商推介、项目竞标、企业年会等应用领域。 二、所需工具 1、ChatGPT智珂平台工具 2、Mindshow生成PPT工具 三、直接上干货 操作步骤: 1、首先要生成一份PPT的提纲…

借助ChatGPT自动生成PPT

借助ChatGPT自动生成PPT 首先让GPT生成一段markdown格式的PPT内容,尽量描述全面,以什么语言,什么格式,排版等等。 打开mindshow网址,点击import and create,选择以markdown方式创建,再次点击弹…

推荐 :ChatGPT研究框架(80页PPT)

研究框架系列 合规声明:本文节选自正式入库研究报告。 转自:计算机文艺复兴 公众号,本次转载仅供学习;‍‍ END 版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误…