作者:Melissa Heikkilä
翻译:李洪君
校对:王晓颖本文约1700字,建议阅读5分钟AI聊天机器人的回答听起来聪明、少涌现些有害又无意义的言论的秘诀,在于使用一种从人类反馈的强化学习技术。
ANNA SOROKINA
让AI聊天机器人的回答听起来聪明、少涌现些有害又无意义的言论的秘诀,在于使用一种从人类反馈的强化学习技术,即通过人类的输出来改进模型的回答。
这项技术依赖于一小部队人工数据标注师,他们会评估某段文本是否符合逻辑、或者听起来是否流利自然,然后再决定是否将该文本在AI模型的数据库中保留或删除。
即便是最令人印象深刻的AI聊天机器人,也需要数千小时的人工才能使其按照创建者的意愿行事,并且就算如此,它们的表现依然不太可靠。这项工作可能是残酷和令人沮丧的,正如我们将在本周进行的关于公平、问责和透明性的ACM会议(FAccT)上听到的一样。这个会议汇集了我喜欢介绍的一些研究,例如如何使AI系统更具问责性和道德性。
我期待有AI伦理学先驱者Timnit Gebru的那个部分,他在被解雇之前曾经共同领导过谷歌的AI伦理部门。Gebru将讲述在埃塞俄比亚、厄立特里亚和肯尼亚工作的数据工作者如何被剥削以便清理网络上的仇恨与虚假信息。例如,肯尼亚的数据标注员每小时收入不到2美元,但他们却需要筛选掉大量有关暴力和性虐待等负面的内容,以减少ChatGPT的有害性。目前,这些工作者正在组织工会以争取更好的工作条件。
在去年的《MIT Technology Review》系列文章中,我们探讨了人工智能正在如何创造一种新殖民式的世界秩序,而数据工作者正在承受这其中的沉重压力。随着ChatGPT、Bing、Bard等受欢迎的AI聊天机器人以及DALL-E 2和Stable Diffusion等图像生成AI的兴起,揭示围绕AI的剥削性劳动变得愈发的紧迫和重要。
数据标注员参与了AI开发的每个阶段,从训练模型到验证输出再到提供反馈,才使得在模型发布后进行微调成为可能。伦敦城市大学的劳动实践博士研究员Srravya Chandhiramowuli表示,数据工作者经常被迫以极快的速度工作,以满足高目标和紧迫的截止日期。
“认为在没有人类干预的情况下就可以构建这些大规模系统的观念是绝对错误的,”Chandhiramowuli说道。
数据标注员为AI模型提供了其需要的重要背景信息,使其能够规模化地做出复杂巧妙的决策。
Chandhiramowuli给我分享了一个案例:一个印度的数据标注员需要区分汽水瓶的图像,并挑选出看起来像Dr. Pepper的图像。但是Dr. Pepper并不是在印度销售的产品,于是解决这个问题的责任落在了数据标注员的身上。
Chandhiramowuli表示,这件事的期望是数据标注员可以找出对公司重要的价值。“他们不仅仅是在学习这些对他们来说毫无意义的遥远事物,他们还要弄清楚这些事物的其他背景以及他们正在构建的系统的优先级是什么”,她说道。
实际上,加州大学伯克利分校、加州大学戴维斯分校、明尼苏达大学和西北大学的研究人员在一篇新发布在FAccT上论文中争论说:无论我们是否意识到,我们都是大型科技公司的数据劳动力。
文本和图像的AI模型是用由互联网上收集的大量数据集训练的,其中包括我们的个人数据和艺术家的版权作品,而我们创造的数据现在永久地成为了公司用来赚钱的AI模型的一部分。我们通过在公共网站上上传照片、在Reddit上投票支持评论、为reCAPTCHA标注图像或进行在线搜索等方式,无意中免费为这些公司做出了贡献。
目前,权力的不平衡严重倾向于且有利于全球最大的一些科技公司。
要改变这种情况,我们需要进行一些毫不逊色于数据革命和监管的变化。研究人员认为,人们可以通过倡导数据使用的透明度,提供人们的反馈权和反馈途径,并享有其数据被使用后带来的收益的方式,重新掌控他们的互联网生活。
尽管这种数据劳动构成了现代人工智能的支柱,但数据工作在全球范围内仍然长期地被严重低估和忽视,并且标注员的工资依然很低。
“对于数据工作的贡献几乎没有得到任何认可,”Chandhiramowuli说道。
----------------------------------------------------------------------------------------------------------------------
// 后面的段落都是一些推荐文章,与本文无关。
原文标题:
We are all AI’s free data workers
原文链接:
https://www.technologyreview.com/2023/06/13/1074560/we-are-all-ais-free-data-workers/
编辑:王菁
译者简介
、
李洪君,清华大学建筑学专业研究生。立足于未来人居研究,探索大数据与城市建筑的交叉,发掘理性分析与感性设计的融合。欣然在混沌数据中寻有序规律,乐于在持续迭代的算法中不断求索。感谢加入数据派大家庭,愿在踏实和谦逊中共同进步。
翻译组招募信息
工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。
你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。
其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。
点击文末“阅读原文”加入数据派团队~
转载须知
如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。
发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。
点击“阅读原文”拥抱组织