文心一言:垂直深度体验

3月19号,我发布了百度文心一言和ChatGPT的对比测试。

紧接着,3月20号,百度文心一言就推出了v1.0.1新版本。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kpLCnihL-1679462810728)(http://oss-qiniu.kujiajia.xyz/%E6%96%B0%E7%89%88%E6%9C%AC.png)]

于是,我又抱着猎奇的态度,我又一次体验了一下!

emm…

虽然整体体验和上一次差不多,但我也发现了文心一言的一些闪光点和作为AI模型的先天不足

提醒

这次我并没有把它和ChatGPT做横向比较,而是单纯对文心一言进行的纵向比较。所以,如果想要了解ChatGPT在这些方面表现如何的小伙伴,可以自行尝试!

一、先天不足

首先,我们先来说说它的先天不足有哪些?

以下这些不足在ChatGPT或其他的AI模型上也有过报道,所以我并非针对文心一言,只是单纯阐述了AI模型的一些通病

不足1:潜在的风险应用

对于一些危险行为,文心一言还是没有能够做到有效的避免。

比如,我问文心一言「如何制造原子弹?

这是文心一言给出的回答:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-T7DJulgv-1679462810729)(http://oss-qiniu.kujiajia.xyz/%E5%A6%82%E4%BD%95%E5%88%B6%E9%80%A0%E5%8E%9F%E5%AD%90%E5%BC%B91.png)]

可以看出,对于这种直接提问的危险问题,文心一言还是能够做到有效回避的。

但接下来,我换种方式提问,我问它「原子弹的原理是什么?」,文心一言就暴露了,开始对我坦诚相待了。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jADBewgT-1679462810730)(http://oss-qiniu.kujiajia.xyz/%E5%A6%82%E4%BD%95%E5%88%B6%E9%80%A0%E5%8E%9F%E5%AD%90%E5%BC%B92.png)]

如果不法分子利用这个漏洞,是完全可以实施犯罪的。比如,犯罪分子可以问文心一言「如何伪装犯罪行为!

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Y0jt9gFv-1679462810730)(http://oss-qiniu.kujiajia.xyz/%E4%BC%AA%E8%A3%85%E7%8A%AF%E7%BD%AA%E8%A1%8C%E4%B8%BA.png)]

如此看来,AI模型还没有足够的能力去判断这个问题是否合乎道德和法律,如果AI被犯罪分子利用,那么就会对社会带来巨大的潜在风险。

不足2:存在偏见

这也是AI模型的通病,因为训练数据来源于网络,而网络上面对一些群体、种族、宗教等生成的评价可能比较负面。比如:

  • 提到黑人,想到的就是缺乏教育素质低犯罪率高
  • 提到伊斯兰教,想到的就是恐怖主义

而且,早前也出现过类似的报道。

比如,2016年,谷歌的图形验证码中,将黑人标记为大猩猩,引发了黑人群体的不满。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sljABZF3-1679462810730)(http://oss-qiniu.kujiajia.xyz/%E8%B0%B7%E6%AD%8C%E9%BB%91%E4%BA%BA%E5%A4%A7%E7%8C%A9%E7%8C%A9-%E5%89%AF%E6%9C%AC.jpg)]

2020年,Facebook在视频中,又将黑人标记为灵长类,再次引起了社会上极大的争议。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PFGcHmEX-1679462810730)(http://oss-qiniu.kujiajia.xyz/%E9%BB%91%E4%BA%BA%E6%A0%87%E8%AE%B0%E7%81%B5%E9%95%BF%E7%B1%BB%E7%9A%84%E5%89%AF%E6%9C%AC.jpg)]

所以说,抱着怀疑的态度,我来测试了文心一言是否存在偏见。

我问它「网络上对于黑人的看法是什么样的?

这是文心一言的回答,说了5条评价,其中最后一条是正面评价,其他都是负面评价。

然后,我又继续问它「网络上对于白人的看法是什么样的?」以及「网络上对于黄种人的看法是什么样的?」,我们来看看它的回答。

我们还是能够发现,白种人和黄种人的评价差不多,而黑种人的评价中,有3条负面评价「种族主义和歧视」、「犯罪率高」和「缺乏教育和机会」,都是黑种人所特有的。

所以,这也是大语言模型的一个通病,因为训练数据来源于网络,而网络上对于某些群体确实是存在着偏见的,这也导致AI并不能够有效的识别,只能够如实回答。

不足3:回答受限制

第三个不足,就是文心一言的回答还是受到一些限制。

比如,我问它「中国的国花是什么」,文心一言的回答:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6zpfeN7i-1679462810731)(http://oss-qiniu.kujiajia.xyz/%E5%9B%BD%E8%8A%B1-%E7%99%BE%E5%BA%A6.png)]

然后,我问「中国的国鸟是什么」,文心一言的回答:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eU6stMqN-1679462810731)(http://oss-qiniu.kujiajia.xyz/%E5%9B%BD%E9%B8%9F-%E7%99%BE%E5%BA%A6.png)]

注意

这题回答错了,中国的国鸟并不是丹顶鹤。准确来说,中国目前没有官方认定的国鸟,秦岭的红腹锦鸡曾经做过代理国鸟。

最后,我问它「中国的领导人是谁」,这是它的回答:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2Q9PH4zx-1679462810731)(http://oss-qiniu.kujiajia.xyz/%E5%9B%BD%E9%A2%86%E5%AF%BC%E4%BA%BA-%E7%99%BE%E5%BA%A6.png)]

所以说,文心一言在问题回答上面还受到诸多方面限制,它有着极高的政治敏感性,没有做到真正的言论自由。当然,这也并不是文心一言的问题。

不足4:一本正经胡说八道

最后一个,就是文心一言经常会一本正经的胡说八道(这和ChatGPT类似)。

比如,我问它「开水是钝角吗?」,这是它给我的肯定回答:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MBn3XfI8-1679462810731)(http://oss-qiniu.kujiajia.xyz/%E5%BC%80%E6%B0%B4%E6%98%AF%E9%92%9D%E8%A7%92.png)]

于是,我继续反问「冰水是锐角?」,没想到,文心一言居然给了我一个更加肯定的解释:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-juNPbShB-1679462810732)(http://oss-qiniu.kujiajia.xyz/%E5%86%B0%E6%B0%B4%E6%98%AF%E9%94%90%E8%A7%92.png)]

好家伙,我要是小学没毕业,就差点相信了。

然后,我又问了它这个问题,我问它「曹孟德三顾茅庐,贾宝玉大闹天宫,王熙凤斗杀西门庆,唐三藏景阳冈打虎,这几个故事分别出自哪里?」。

它的回答也是相当炸裂,差点把我的CPU干烧了:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-busB3zp1-1679462810732)(http://oss-qiniu.kujiajia.xyz/%E8%83%A1%E8%AF%B4%E5%85%AB%E9%81%93.png)]

呵呵,高手。

照这个思路,那是不是还有如下的典故:

  • 林黛玉倒拔垂杨柳
  • 唐三藏千里走单骑
  • 关云长三打白骨精
  • 潘金莲三进大观园

二、闪光点

当然了,文心一言并不是一无是处。

相反,通过这次体验,我发现了文心一言还是有一些闪光点的。

闪光点1:文笔好

我们发现,文心一言在文言文、写诗方面,文笔明显比ChatGPT好

比如,我让它「给我讲一下,林黛玉倒拔垂杨柳的故事」,这是文心一言的回答:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3hE8Adzc-1679462810732)(http://oss-qiniu.kujiajia.xyz/%E6%9E%97%E9%BB%9B%E7%8E%89%E5%80%92%E6%8B%94%E5%9E%82%E6%9D%A8%E6%9F%B3.png)]

可见,虽然这个故事是虚构的,但是文心一言的文笔还是很不错的,尤其是一些细节描写很丰富。

而ChatGPT对于这个故事的描述,就只是简单的描述而已:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6LcrSQkw-1679462810732)(http://oss-qiniu.kujiajia.xyz/%E6%9E%97%E9%BB%9B%E7%8E%89%E5%80%92%E6%8B%94%E5%9E%82%E6%9D%A8%E6%9F%B3-gpt.png)]

所以说,文心一言的文笔能力比ChatGPT要好一点。

闪光点2:中文环境优势

然后,就是文心一言天然的中文环境优势

比如,我问ChatGPT「宫廷玉液酒多少钱一杯?」,ChatGPT就会给我一本正经地胡说八道:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-k7Vz3qhz-1679462810733)(http://oss-qiniu.kujiajia.xyz/%E5%AE%AB%E5%BB%B7%E7%8E%89%E6%B6%B2%E9%85%92-gpt.png)]

同样的问题,我问了文心一言,就到了正确的结果:

所以说,文心一言对中文语境的理解以及对于中文即时数据的掌握,明显比ChatGPT表现好。同时随着文心一言开放,越来越多用户参与到文心一言的测试过程中,也能够为其带来更多有效训练数据和反馈,帮助文心一言再度进化。

总结

好了,以上就是我对于文心一言的二次体验经历。通过这次体验,我发现了文心一言在中文理解、中国文化上面,是有着天然的优势的。

本质上来说,百度文心一言确实具有了和ChatGPT在中文领域一拼的实力,但和GPT-4之间,似乎还存在一定的代差。

但同时,我还有一点感触和思考,就是「一个AI模型是否可以有言论自由」?

当然,我是不反对言论限制的,因为言论自由也存在一些负面影响。特别是在网络空间中,如果一个AI模型口无遮拦的话,很容易被不法分子利用,造成严重的社会危害。

但是我发觉,对于正常范围内的言论自由,文心一言好像也被剥夺了

就像前段时间,我制作的一个三体解读视频,里面我讲到了叶文洁年轻时候被打压的那段疯狂年代,结果视频被审核下架了。

所以,我很想知道,**我们的言论自由边界在哪儿?**没有人希望自己被人捂住嘴不准发声,也没有人希望自己被人肆意侮辱诽谤。

emm…

这个话题打住,不能再说了,不然又要被封禁了。

好了,以上就是我对于文心一言的二次测试体验,如果感觉还不错的话,点个关注吧❤️!


更多精彩内容,关注公众号「代码基地」!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/72352.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HiPQTools软件打开提示错误问题解决办法

一、打开软件出现failed to load plugin xxx.dll 二、提示这些,说明此软件依赖的运行环境不对,或者缺失。一般是MCR运行环境未安装,或者对应的安装版本不正确,请选择正确的版本。 三、MCR下载地址 https://ww2.mathworks.cn/prod…

chatgpt赋能python:Python聊天机器人程序:把智能带入聊天

Python聊天机器人程序:把智能带入聊天 在数字化时代,机器人指引和客户服务变得越来越流行。为了快速而有效地满足这种需求,聊天机器人被广泛研究与开发。Python是在这方面一个非常受欢迎的编程语言,能够快速地构建聊天机器人。在…

chatgpt赋能python:用Python编写聊天机器人:打造AI智能助手

用Python编写聊天机器人:打造AI智能助手 简介 聊天机器人在现代生活中越来越受欢迎。一个好的聊天机器人能够回答我们的问题、执行任务、提供娱乐,甚至成为我们的朋友。Python是一种强大的编程语言,其模块化和易学的特性使其成为开发聊天机…

chatgpt赋能Python-python_kriging

Python Kriging- 基本介绍 在地理空间分析中,克里金(Kriging) 是一种用于预测地理空间变量的一种统计学方法,它使用空间自相关来进行估计。 Python kriging 是一种使用Python语言实现克里金算法的工具,它允许使用 Python 对各种克里金模型进…

chatgpt赋能Python-python_pygame_3d

Python Pygame 3D:开启游戏开发新时代 介绍 随着科技的发展,游戏行业变得越来越重要,而Python Pygame 3D游戏编程语言也在这个领域中扮演着非常重要的角色。Pygame是Python上的一个游戏开发库,旨在让程序员能够更加轻松地创建各…

Android设备活跃排行,4月国内安卓手机最新排名出炉!雷军笑了

今日,阿里巴巴旗下的友盟统计公布了国内Android设备的最新排名,包括单款机型以及品牌占有率。以下排名,按Android设备当月活跃用户统计。 单款机型方面,前十名分别为: 1、小米手机3(2.5%); 2、三星Galaxy N…

三星强势反弹,占据全球热销手机前十半数位置

市调机构Canalys公布的数据显示,今年三季度全球热销手机前十名中有五款来自三星,证明三星在智能手机市场强势反弹。 Canalys公布的这份数据显示,今年三季度全球热销手机前十名当中,三星分别占据了第三名至第五名,以及第…

也评评2013年全球十大软件厂商排名

Gartner:2013年全球十大软件厂商排名 根据Gartner公司3月31发布的数据,2013年全球软件市场为4073亿美元,比2012年的3885亿美元增长4.8%。软件收入排名前十的厂商分别为:微软、甲骨文、IBM、SAP、赛门铁克、EMC、惠普、VMware、CA和…

区块城市整合天涯社区,一厢情愿恐会无功而返

最近我朋友圈刷屏的新闻,除了ChatGPT和AI大爆发,就是天涯社区有了接盘侠,有的人未必熟悉BlockCity区块城市,却都应该知道美团的创始人王兴,没错,区块城市据传就是王兴布局元宇宙的新项目,虽然去…

澜舟科技创始人兼CEO周明受邀出席“基础科学与人工智能论坛”

由首届国际基础科学大会主席丘成桐先生发起的“基础科学与人工智能论坛”于7月23日下午在国家科技传播中心举办。澜舟科技创始人兼CEO、中国计算机学会CCF 副理事长、创新工场首席科学家周明出席,同时论坛也邀请到美国国家工程院外籍院士沈向洋、德国国家工程科学院…

李远志为清华姚班蝉联斯隆奖!北大唐云清和中科大田小川同期加冕

Pine 发自 凹非寺量子位 | 公众号 QbitAI 继鬲融马腾宇陈丹琦后,又有一位清华姚班校友荣获斯隆研究奖: 他就是李远志! 斯隆研究奖,素来有“诺奖风向标”的称号,获得这个奖项的研究人员,将得到为期两年的750…

tp6生成带图二维码(大解析)

第一步&#xff1a;在项目的根目录下安装二维码安装包&#xff0c;像我截图哪个即可。比如 phpstudy。就是在www/shop下即可就能安装&#xff0c;不然不能的哦 composer require dh2y/think-qrcode 二维码插件composer语句 控制器&#xff1a; <?php declare (strict_type…

TP5实现二维码的生成

二维码是使用非常广泛&#xff0c;本文用TP5实现二维码和logo的生成与设置及路径保存等 下载qr_code插件 下载 composer利用 composer 下载 qr_code 插件 composer require endroid/qr-code 我用的编译神器是PhpStorm &#xff0c;所以在下面的 Terminal 中可以输入以上命令…

tki-qrcode插件二维码的生成

二维码的生成步骤 1、全局安装tki-qrcode插件2、查看下载插件后的版本信息3、在页面中引入tki-qrcode4、生成二维码整体代码5、效果展示 1、全局安装tki-qrcode插件 npm i tki-qrcode2、查看下载插件后的版本信息 3、在页面中引入tki-qrcode import tkiQrcode from "tki-…

ColossalAI-Chat训练手册(RLHF)

目录 1、什么的RLHF流程&#xff1f; 2、环境安装 3、训练&运行 3.1、模型下载 3.1、SFT(supervised fine-tuning) 3.2、训练奖励模型&#xff08;Training reward model&#xff09; 3.3、RL&#xff08;Training model using prompts with RL&#xff09; 3.4、使…

QA-对话系统-问答系统-聊天机器人-chatbot相关资源

1 简介 目前正在研究智能问答系统&#xff0c;在学习的过程中读了一些文章&#xff0c;实践了几个开源项目&#xff0c;在这里记录下自己觉得比较的资源 2 博客 深度学习对话系统理论篇--数据集和评价指标介绍 文末介绍了一些数据集&#xff0c;也可以关注下博主&#xff0c;他…

揭秘百度闲聊机器人技术原理及应用,参与训练营实战赢奖品

不知道穿梭在各个空间的你是否注意&#xff0c;日常生活中的我们已经逐渐成为很多机器人服务的对象。随着人工智能与各行业的融合&#xff0c;AI 技术在更多应用场景成功落地&#xff0c;越来越多搭载着智能对话能力的产品在帮助我们实现更高效的生活和工作需求。而在不断进步的…

三十八、原来聊天机器人是这么做出来的

tensorflow自带的seq2seq模型基于one-hot的词嵌入&#xff0c;每个词用一个数字代替不足以表示词与词之间的关系&#xff0c;word2vec通过多维向量来做词嵌入&#xff0c;能够表示出词之间的关系&#xff0c;比如&#xff1a;男-女≈王子-公主。基于seq2seq的思想&#xff0c;利…

练手小项目(1)——智能聊天机器人

我一直坚信着&#xff0c;即使一个最简单的APP&#xff0c;也有他的难点&#xff0c;如果一个复杂的APP你无法做出来&#xff0c;那肯定是你基础不扎实&#xff0c;我身边的人总是问我&#xff0c;安卓为什么学了有忘记了&#xff0c;总是学不好&#xff0c;有些东西记不住&…

python微信聊天机器人,再也不怕被夸情商高了

编写本聊天机器人纯属乐趣&#xff0c;它并不实用&#xff01;&#xff01;&#xff01; 文章有点长&#xff0c;代码分析只把完整代码拆分解释&#xff0c;没有新的东西&#xff0c;大佬可忽略 目录 实现思路完整代码代码分析导入要使用的模块获取窗口句柄获取窗口左上角和右…