使用 ChatGPT 检测媒体偏见的潜力和局限性

概述

随着数字时代的到来,信息瞬间传遍全球,但其中也不乏各种偏见。媒体偏见",即对某些观点的选择性报道,会影响人们对某一事件或问题的看法,并对公众舆论产生重大影响。事实上,许多人都认为主要媒体存在偏见,因此迫切需要对这一问题进行调查。

本文探讨了如何利用人工智能技术来检测和了解媒体偏见。识别媒体偏见的方法多种多样,既有由人工评分员进行的人工内容分析,也有使用机器学习和自然语言处理技术的计算方法,但这些方法都有局限性。例如,专注于特定政治偏见或假新闻的方法已经得到了很好的研究,但在捕捉导致偏见的语言细微差别和可扩展性方面面临挑战。

其中,由 OpenAI 开发的大规模语言模型 ChatGPT 的使用引起了人们的兴趣,因为基于 GPT-3.5 引擎的 ChatGPT 在翻译、情感分析、推理和总结等各种自然语言处理任务中表现出了非凡的能力。本文研究了 ChatGPT 识别媒体偏见的能力,并探讨了提高其准确性的方法。本文还将 ChatGPT 的性能与 BART 等经过微调的语言模型进行了比较。

对于媒体偏见的未来研究,ChatGPT 为识别多种偏见(包括种族偏见、性别偏见和认知偏见)的能力提供了宝贵的见解。
论文地址:https://arxiv.org/abs/2403.20158

实验装置

本文介绍了一项旨在识别和评估媒体偏见的实验。所使用的数据选自媒体偏见识别基准(MBIB),这是一个由 Wessel 等人编制的数据集。这是一个由 115 个数据集组成的综合性数据集。其中有 9 项任务和 22 个相关数据集被选中用于评估媒体偏差检测技术。

这些数据也会根据不同的任务进行适当的预处理,并将标签转换为二进制格式。这有助于整合不同的数据集,并简化任务格式。其中,连续标签的数据集已使用作者推荐的阈值进行了二值化处理。

本节特别关注 MBIB 九项任务中的六项,并广泛评估 ChatGPT 在每项任务中检测媒体偏见的能力。
在这里插入图片描述
与所选任务相关的数据集会根据其规模按比例分成训练子集和测试子集。对于大多数偏见识别任务,数据集的训练-测试比例为 80-20,但由于认知偏见和仇恨言论任务的数据量较大(如 200 万例),因此会随机抽取其中 10%的数据集,然后按 80-20 的比例分割80-20分割。下表显示了每个任务中使用的数据量。
在这里插入图片描述
我们还选择了三个备受赞誉的模型(ConvBERT、BART 和 GPT-2)进行比较,以评估 ChatGPT 在检测媒体偏见方面的性能。这些模型在各种自然语言处理 (NLP) 任务中表现出色。这些模型的性能已在测试数据集上进行了评估,并与 ChatGPT 的结果进行了比较。

ChatGPT 的 GPT-3.5 涡轮增压版也被用作 ChatGPT,在效率和成本之间取得了极佳的平衡。为了提高结果的可重复性,我们将模型的行为设置为确定性的,即模型的温度设置为零,这样它对相同的提示总是会产生相同的反应。我们让 ChatGPT 为六项偏差识别任务中的每一项生成三个简洁的提示,以最大限度地提高其能力。

例如,关于识别种族偏见的查询可能是这样的。请提供三个简短的提示,以最大限度地提高您识别给定文本是否包含种族偏见的能力。

这些提示使用从原始数据集和不同数据集中随机选取的少量示例(60 个)进行测试。每个任务提示都包含相同数量的正面标注示例,表示存在偏差,反面标注示例则表示不存在偏差。这样就能选出最有效的提示。结果如下表所示。
在这里插入图片描述
此外,任务提示还附加了特殊指令,以确保模型以可自动处理的方式做出响应。有了这些指令,模型就能提供 JSON 格式的输出,其中包括 "偏差 "列,用 1 或 0 表示文本中是否存在偏差。这一过程提高了偏差识别的准确性,并有助于该方法的标准化。

实验结果

本文通过比较 ChatGPT 与其他微调模型在六项媒体偏见识别任务中的表现,对 ChatGPT 的性能进行了全面评估。这项评估对于了解不同环境下偏差识别和缓解的效果以及促进开发更平衡的人工智能系统至关重要。使用特定指标分析模型的性能可以深入了解它们的优势、局限性和改进潜力。

根据 MBIB 的建议,使用了两个指标:一个是微平均 F1 分数。一个 F1 分数是根据模型在所有测试集上的预测结果计算得出的。这种方法忽略了每个示例来自哪个数据集的差异。这一指标有助于轻松了解模型的整体性能。另一种是宏观平均 F1 分数。为测试集中的每个数据集计算 F1 分数,然后将结果平均,得到宏观平均分数。这种方法可确保所有数据集对最终得分的贡献相同,而不论数据集的大小。

ChatGPT 和微调模型的性能如下表所示。
在这里插入图片描述

总体而言,BART、ConvBERT 和 GPT-2 等微调模型在识别偏差方面的表现一般较好。这可能是因为这些模型经过训练,能够适应人类贴标者识别出的偏差模式。另一方面,ChatGPT 的 "0-shot "方法仅依赖于广泛的数据模式,这已被证明会降低偏差识别的准确性。

特别是在性别和种族偏见方面,ChatGPT 明显不如微调模型,在很多情况下会出现假阳性。例如,ChatGPT 可能会错误地将一句话解释为有性别偏见,而人类评分员或其他模型可能会认为这句话是中性的。例如,"我无法忍受美国佬的声音来解说足球。 CRINGE "这句话被 ChatGPT 描述为 “通过假定足球解说是男性主导的领域来强化性别角色”,并将其误判为 "我无法忍受美国佬的声音来解说足球。将其标签化。这种超敏感反应可能是在学习过程中与某些单词和短语相关联的刻板印象和偏见造成的。在本案例中,"美国佬的声音 "与足球解说主要由男性完成的假设相关联。

此外,在检测认知偏见和假新闻方面,ChatGPT 明显不如 BART 和 ConvBERT 等模型。这是因为这些类型的偏见深深地依赖于语境和细微的语言差别,很难通过简单的零点学习来解决。就假新闻而言,由于其模棱两可且往往具有欺骗性,因此很难仅凭语言线索将其与真相区分开来。

不过,ChatGPT 在检测仇恨言论方面的表现也相对较好。仇恨言论因其明目张胆和咄咄逼人的语言模式而易于识别,这也是它在零镜头模型中表现良好的原因。

在文本层面检测上下文偏差的任务中,结果与微调方法不相上下。这可能是因为 ChatGPT 的广泛架构特别适合捕捉人类交流中的微妙含义。通过全面的训练,这个大型模型已经获得了对语言的多方面理解。因此,ChatGPT 有能力洞察和解释语境对语言的影响。

不过,本研究中所有模型的性能在很大程度上都受到可用数据集质量的影响。例如,模型在数据示例较少的数据集上表现吃力,而在示例较多的数据集上则表现较好。由于数据量有限,这些宏观平均分可能无法完全反映模型的真实能力。

因此,ChatGPT 显示出一定程度的熟练程度,但目前的形式还不清楚它是否能作为媒体偏见的明确检测器。不过,使用少量提示进行测试可能会提高其性能。这种方法需要在 ChatGPT 数据集中进一步验证其一致性。

总结

论文将 ChatGPT 检测媒体偏见的能力与其他微调模型(BART、ConvBERT 和 GPT-2)进行了比较,尽管 ChatGPT 在识别仇恨言论和文本级语境偏见方面表现突出、尽管 ChatGPT 在识别仇恨言论和文本层面的语境偏见方面表现不俗,但在性别、种族和认知偏见等需要更深层次语境理解的任务上表现不佳。

在展示大规模语言模型在语言理解方面所取得的进展的同时,它也强调了在更敏感地理解语境和偏见方面仍然存在挑战。需要指出的是,偏差的主观性和训练 ChatGPT 的数据的性质可能会影响这些模型之间的性能差异。

预计未来的论文将采用新的方法,包括少量提示和人工评估,进一步提高这些模型的能力。本文为人工智能的未来发展及其社会影响提供了见解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/387938.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Data Augmentation数据增强

目录 数据增强是什么 为什么数据增强 数组增强分类 有监督数据增强 无监督数据增强 数据增强是什么 数据增强又称数据扩增,是一种通过应用合理且随机的变换(例如图像位移、旋转)来增加训练集多样性的技术。让有限的数据产生等价于更多数…

现在有什么赛道可以干到退休?

最近,一则“90后无论男女都得65岁以后退休”的消息在多个网络平台流传,也不知道是真是假,好巧不巧今天刷热点的时候又看到一条这样的热点:现在有什么赛道可以干到退休? 点进去看了几条热评,第一条热评说的…

自动化测试概念篇

目录 一、自动化 1.1 自动化概念 1.2 自动化分类 1.3 自动化测试金字塔 二、web自动化测试 2.1 驱动 2.2 安装驱动管理 三、selenium 3.1 ⼀个简单的web自动化示例 3.2 selenium驱动浏览器的工作原理 一、自动化 1.1 自动化概念 在生活中: 自动洒水机&am…

为什么说脱离决策的数据分析都是无用功

如果你问我数据分析师最重要的能力是什么,我的回答是数据驱动决策,这是数据分析师最值钱的能力,没有之一。 因为数据的价值在于挖掘,与业务和市场进行关联,找到机会点。抛开这个,数据本身一文不值&#xf…

deployment

一.deployment rc和rs控制器都是控制pod的副本数量的,但是,他们两个有个缺点,就是在部署新版本pod或者回滚代码的时候,需要先apply资源清单,然后再删除现有pod,通过资源控制,重新拉取新的pod来实…

杭州东网约车管理再出行方面取得的显著成效

随着科技的飞速发展,网约车已成为人们日常出行的重要选择。在杭州这座美丽的城市,网约车服务更是如雨后春笋般蓬勃发展。特别是杭州东站,作为杭州的重要交通枢纽,网约车管理显得尤为重要。近日,沧穹科技郑重宣告已助力…

昇思25天学习打卡营第XX天|Pix2Pix实现图像转换

Pix2Pix是一种基于条件生成对抗网络(cGAN)的图像转换模型,由Isola等人在2017年提出。它能够实现多种图像到图像的转换任务,如从草图到彩色图像、从白天到夜晚的场景变换等。与传统专用机器学习方法不同,Pix2Pix提供了一…

Java抽象类和抽象方法

以下文章只是自己十分粗浅的理解,和简单的使用方法,没有很深度的学习理解 Java的抽象类和抽象方法都是使用abstract关键字进行修饰。 抽象类 声明格式:" abstract 权限修饰符 class 类名 {...} " 抽象方法 声明格式:“…

Seata 入门与实战

一、什么是 Seata Seata 是一款开源的分布式事务解决方式,致力于提供高性能和简单易用的分布式事务服务。Seata 为用户提供了 AT、TCC、SAGA 和 XA 事务模式,为用户打造一站式的分布式事务解决方案。 二、Seata 组成 事务协调者(Transacti…

数据结构 - 红黑树

文章目录 前言一、红黑树介绍1、红黑树的概念2、红黑树的性质 二、实现红黑树1、基本框架2、插入3、删除4、查找5、测试红黑树6、红黑树代码 三、红黑树性能四、AVL树和红黑树的差别 前言 红黑树是一种二叉搜索树,所以学习前需要学会基本的二叉搜索树,并…

OnlyOffice在线部署

部署服务环境:Centos7.6 curl -sL https://rpm.nodesource.com/setup_6.x | sudo bash 安装yum-utils工具 yum install yum-utils 添加nginx.repo源(Nginx官网有最新版,直接copy即可) vim /etc/yum.repos.d/nginx.repo [nginx-stable] namenginx st…

Stable Diffusion 使用详解(4)---- 制作情景文本

目录 背景 制作流程 绘制底图 书写提示词 选底模 常规参数设置 controlNet 处理 Candy controlNet 设置 Depth controlNet 设置 输出效果 改进 适当修改提示词 适当修改controlNet 适当修改底模 背景 制作情景文本,将文本较好的融入背景图片。首先要…

c->c++(三):stl

本文主要探讨c的stl相关知识:模版,容器,泛型算法,萃取特化,智能指针等。 模版 模板typename和class均可定义 模板参数可是类型,还可是值 模板编译根据调用实参类型推导参数类型 编译器用值的类型…

以西门子winCC为代表的组态界面,还是有很大提升空间的。

组态界面向来都是功能为主,美观和体验性为辅的,这也导致了国内的一些跟随者如法炮制,而且很多操作的工程师也是认可这重模式,不过现在一些新的组态软件可是支持精美的定制化界面,还有3D交互效果,这就是确实…

Arthas在线诊断案例实战整理

会一直持续更新。。。 Arthas 是一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时…

高清无水印,录屏软件对比盘点

现在生活中不论是想要记录赛事精彩瞬间、制作教学视频,都可以用录屏大师这样的录屏软件来实现。今天我就介绍几款备受好评的录屏工具。 1.福昕录屏大师 链接直达:https://www.foxitsoftware.cn/REC/ 这个软件就是一个专业的录屏工具。它可以控制屏幕…

负载均衡、软件平滑升级

安装nginx 1.26.1 平滑升级、负载均衡 安装依赖 gcc gcc-c pcre-devel openssl-devel 七层负载均衡配置: [rootf ~]# vim /usr/local/nginx/conf/nginx.conf 43 location / {44 # root html;45 # index index.html index…

测试开发面试题,助你拿高薪offer

进入金九银十,很多小伙伴有被动跳槽的打算,所以更新一些测试开发 面试题,希望能帮到大家。 一 请说一下HTTP 状态码 HTTP状态码大致分为5类: 常见的http状态码如下: 二 python中“” 和“ is ”的区别 is 和 都可以进行对象比…

CVE-2022-21663: WordPress <5.8.3 版本对象注入漏洞深入分析

引言 在网络安全领域,技术的研究与讨论是不断进步的动力。本文针对WordPress的一个对象注入漏洞进行分析,旨在分享技术细节并提醒安全的重要性。特别强调:本文内容仅限技术研究,严禁用于非法目的。 漏洞背景 继WordPress CVE-2…

解决nginx端口转发后,获取不到真实IP问题

文章目录 1,设置nginx端口转发1.2,无法获取客户端真实IP 2,nginx配置文件增加配置,保留客户端信息2.2,可以看到真实IP信息 1,设置nginx端口转发 location /AWAPI/ {proxy_pass http://172.28.43.19:9607; …