视学算法报道
编辑:编辑部
【导读】大反转来了?Stack Overflow「ChatGPT禁令」突然松动,而版主们不得不联名罢工表示抗议,血泪控诉LLM生成的垃圾内容将充斥整个社区。截至发稿前,公开信上已有227位用户签名。(而且还在不断增加中)
大家都还记得,ChatGPT刚出来时,它的代码生成功能让人们大感新鲜。
然而,随着各种似是而非、真假难辨的答案如潮水般涌入,被逼急的Stack Overflow不得不连夜下封杀令——ChatGPT,禁!
具体来说,Stack Overflow的版主有权封禁疑似发布ChatGPT等AI生成内容的账号,并且直接删帖。
然而,Stack Overflow最近却发布了这样一条新规:
鉴于目前我们无法准确识别AI生成的内容,「假阳性」的概率非常高,这种一言堂的过度禁言措施,可能会让网站损失大量有贡献的网友。
因此,只有在真实可验证的情况下,版主们才能禁言账号。而不管是写作风格等主观猜测,还是GPT检测器的结果,都不可作为衡量指标。
这条版规一发,简直让版主们瞬间炸了锅!
在他们看来,这简直是对LLM幻觉肆意扩散的公然默许,是对社区清明环境的公开破坏,是道德的沦丧,人性的扭曲……
其中一些版主,已经愤而罢工了。
保卫我们的社区不被AI侵占
一些版主和用户写了一封公开信,愤怒控诉新规将使Stack Overflow这个大家心中的代码问答圣地彻底沦陷。
他们义愤填膺地表示,AI生成的内容会对「平台和内容的完整性、可信度构成重大威胁」。而运营者的决定将破坏Stack Overflow成为「高质量信息库」的目标。
从前,版主只要自己认定帖子内容是AI生成的,就能自行删帖或封号。
但如今,这个标准变得非常严苛。以往的惯用方法,如今都不再适用。
而这些版主们认为,这将意味着:以后在Stack Overflow上,AI生成的内容可以被肆意发布,丝毫不用顾忌社区对此是何看法。
从此,一打开Stack Overflow,我们很可能会看到满眼的错误信息,和抄袭来的内容。
另外,新政也将剥夺Stack Exchange社区自行定义政策的余地。
遗憾的是,到目前为止,运营者与版主们尚未取得良好的直接沟通,版主们最后能做的就是——选择罢工,不再对平台的帖子进行审核。
在他们看来,自己的罢工是拯救社区「免于完全价值流失」的最后手段。
版主的抗议公开信全文
在大量AI生成的内容被删除之后,Stack Overflow公司颁布了一项新的「禁令」,默许不正确的信息和不受约束的剽窃行为在Stack Exchange上泛滥。这对该平台及其内容的完整性和可信度构成了重大威胁。
以下签名者,是Stack Overflow和Stack Exchange的志愿版主、贡献者和用户。
从即日起,我们将对Stack Overflow和Stack Exchange开展全面罢工,以抗议Stack Overflow公司现在以及将来将要强加给我们的政策和平台规则变动。
我们通过合理的方式实现平台变革的努力被忽视了,我们的担忧也被无视了。现在,作为最后的手段,我们要退出这个我们已经投入了超过十年的关心和志愿努力的平台。
我们坚信Stack Exchange的核心使命:以问答的形式提供一个高质量的信息库,而Stack Overflow公司最近采取的行动则直接损害了这个目标。
具体来说,版主不再被允许以AI生成的答案为由,在部分情况下删除AI生成的答案。这使得几乎所有AI生成的答案都可以自由发布,而无需考虑社区对此类内容已有的既定共识。
反过来,这使得不正确的信息(俗称「幻觉」)和剽窃行为在该平台上肆意泛滥。
正如Stack Overflow公司之前指出的那样,这破坏了我们对平台的信任。
此外,直接发给版主的政策细节与公开概述的准则有很大不同,版主还被禁止在公开场合分享这些细节。
这些政策无视此前上赋予给每个Stack Exchange社区决定各自政策的余地,在没有和社区交换意见的情况下进行直接修改,推翻社区的共识,还拒绝三思而行。
在这件事得到我们满意的解决之前,我们将暂停这些活动,包括但不限于以下:
· 发布和处理flag
· 运行SmokeDetector,反垃圾邮件机器人
· 关闭或投票关闭帖子
· 删除或投票删除帖子
· 审查队列中的任务
· 运行协助审核的机器人,如检测抄袭、低质量答案和粗鲁的评论等
在Stack Overflow公司收回这一新政策,以解决版主的担忧,并允许版主有效地执行针对AI生成的答案的既定政策之前,我们呼吁全面罢工,此举将作为保护Stack Exchange平台和用户免受完全价值损失的最后努力。
同时,我们也想提醒Stack Overflow公司,一个完全依赖志愿者的网络,不能一直忽视、虐待,并将矛头指向这些志愿者。
Stack Overflow的新政策
新规中写明,Stack Overflow官方对目前的内容审核方法进行了一系列分析后发现,AI生成的内容审核机制并不准确。
也就是说,对于一些内容是否由AI生成的判定并不一定正确,负责的版主或者志愿者可能会出现错误判断的情况。
官方担心,此举会助长对某些地区或国家的用户的偏见,或是把大量合法的内容发布者拒之门外。
为了解决这个问题,官方要求负责审核内容的版主在封号之前,需要用非常严格的证据标准来确定该用户发布的内容是由AI生成的。
在新规下,版主们惯用的基于用户写作风格,以及论坛行为等好用的标准都将不能再使用,因为这并不算「严格」。
官方表示,版主们所惯用的方法并不能100%的进行裁定。
同时,GPT检测器在官方看来也不可取。误判率过高,不可接受,不能作为判定的可靠指标。
总之,新规中官方对版主的权力进行了限制。只有经过严格证据审查得出的结论才能采纳,并采取进一步行动(如封停账号等)。
任何靠直觉、猜测的方式都不应该再采用。
为什么不得不罢工?一个版主的血泪控诉
一位版主在Stack Overflow上发帖,详细解释了版主们不得不选择罢工的原因。
ta表示,大家这样做,或多或少都是为了整个社区的利益。
2022年11月下旬,随着ChatGPT的推出,大量用户开始疯狂把AI生成的答案搬运上来。
用ChatGPT生成的答案,与真人用户的回答非常相近
比如下面这位网友就表示,自己先新建了一个账户,然后把没有答案的随机问题贴进ChatGPT里,再把生成的答案po出来。
在一个半小时内,ta就po出了9个回答,并取得了1个接受、3个赞成,以及62个声望值。
随后,这些随机复制粘贴自ChatGPT的回答,迅速产生巨大的影响,这位网友非常期待后续的情况。
玩花了的网友们引起的审核团队的注意,他们警铃大作,立即为Stack Overflow制定了新规。
新规自然是有道理的,Stack Overflow从2008年成立以来,就一直靠社区志愿者审核来维持运营。
但ChatGPT生成的答案通常看起来很好,无数网友在疯狂发布这些答案,会给志愿者造成巨大的负担。
因此,社区才不得不发布禁令。
这位版主表示,禁令发布后,版主们兢兢业业,直接参与了社区管理团队,在方方面面帮助这项新政策在这条社区实行。
而处理帖子的过程,也非常麻烦。
审核团队会使用JavaScript脚本来帮助审核,需要工具的时候,他们会直接上手去写。他们还会扩展现有的网站功能。
每天,版主们都会处理大量的帖子,还会经历被辱骂之类的情况。
因此,在周一接到新版禁令后,版主们非常心累。毕竟,大家都是志愿者,而不是正式员工。他们已经为社区付出够多了……
罢工者的诉求
罢工的版主们想要什么?归根结底还是问题解决。
有些问题需要官方亲自承认,有些问题需要员工们公开进行讨论,明确到底应该做什么。
ChatGPT规则是由整个社区共同制定的规则,并且已经得到了广泛的支持。
员工不应该仅仅使用非公开渠道(聊天室和版主团队)进行大规模的规则变更,走这些渠道就意味着广大用户将无法知晓。
版主被要求根据一项从未公开的规则来处理flag。而实际上,网站上的所有内容都表明了旧有的政策仍然有效。
因此,版主仍然会收到无法与该政策一致处理的flag。最终,社区肯定会注意到这种不同。
那些在公告公开之前就发帖讲解政策变化的少数版主,其实他们正冒着失去版主权力、无法访问版主团队的风险。这对版主来说非常不公平。
Philippe发帖怒斥新规,他表示,官方所担心的可能产生的种族歧视是一种赤裸裸的指责。但很显然,没有人希望被无端指控为种族歧视。
在最坏的情况下,新规反映出员工认为版主和社区持对立态度。
员工对政策的表述非常含糊(正如前面所说的,公开的和私下的政策存在差异),并且没有提供他们认为做得不正确的具体实例。
他们希望版主不再将GPT检测器作为唯一的判断标准,这当然可以,但是对于一个在两个小时内发布了十几个长回答的人来说,很明显,这些回答肯定不全是他们自己写的,他们只是在复制粘贴地回答问题。
根据政策,这是不可接受的,但版主们应该如何处理呢?
版主们是否可以在没有直接证据证明其为抄袭的情况下使用检测工具?
然而,现实是,没人告诉版主他们到底应该怎么做……
参考资料:
https://openletter.mousetail.nl/
点个在看 paper不断!