ImageNet决定给人脸打码,却让哈士奇图片识别率猛增

晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

315晚会让大家意识到人脸识别有多可怕。在大洋彼岸,全球最具影响力的AI数据集也开始行动了。

近日,ImageNet数据集决定:给所有人脸打码,保护被收录者隐私。

ImageNet管理者之一Olga Russakovsky与李飞飞团队合作,一起“纠察”数据集中所有包含人脸的图像。

ImageNet总共有1000多个标签,其中只有3个标签与人相关,而很多看似与人脸无关的标签下,反而可能有大量人脸照片。

因此,研究团队通过亚马逊Rekognition的自动人脸识别以及众包方式,在150万张图片中,找出了243198张包含人脸的图片。

这些图片中的562626张人脸都已被模糊处理。

给人脸打码会影响AI模型效果吗?这恐怕是“炼丹”人士最关心的问题了。

在修改数据集之后,普林斯顿大学的博士生杨凯峪对这个问题进行了一番研究。

偏差不大,但结果微妙

研究者使用模糊处理后的数据集进行目标检测和场景检测基准测试。

在AlexNet、VGG、ResNet等15种主流网络模型上测试后发现,Top-1准确率最多下降1%,平均仅下降0.66%,Top-5准确率平均下降0.42%。

根据图片中模糊区域比例的不同,Top-1准确率下降程度随着模糊比例的增大,最高超过4%。

某些类别中离模糊人脸更近的目标,例如口琴或面具,会导致更高的分类错误率。

令人费解的是,一些没有人脸的照片反而会有很大的准确率波动,比如“哈士奇”、“爱斯基摩犬”分类。

其中,爱斯基摩犬的识别准确率出现大幅下降,而哈士奇的识别准确率反而大幅上升。

连作者也觉得很奇怪,因为这两个类别中的大多数图像都没有人脸。具体原因如何只有等待后续研究了。

MIT科学家Aleksander Madry认为,模糊人脸的数据集训练的AI有时候很奇怪,数据中的偏差非常微妙,但可能会带来严重的后果。

向隐私和偏见说不

2020年,在计算机科学道德伦理学术会议FAccT上,ImageNet数据集删除了“人”子树中2702个同义集,因为这些类别中含有令人反感、贬义或污秽的表述。例如一些种族和性别歧视的内容。

虽然ImageNet此次对隐私问题做出了重大改变,但来自UnifyID的首席科学家Vinay Prabhu指出该数据集还有许多严重问题。

去年7月,Prabhu发表的一篇论文指出,ImageNet、Tiny Images等图片数据集中不仅存在危害隐私的状况,甚至还有一些不可描述的图片。

在那篇论文中,Prabhu建议,对数据集中的人脸做模糊处理,并且要做到在参与者明确同意后才能收集图片,不要为这类数据集创建数据共享许可证。

他曾给连续10个月给ImageNet团队发送邮件反馈此问题,直到去年4月才收到李飞飞的回复。

而此次ImageNet团队的论文并没有引用他,在接受《连线》杂志采访时,Prabhu表示对ImageNet团队没有承认他所做的工作感到失望。

Russakovsky回复称,论文的更新版本将会把Prabhu的研究加入引文中。

2019年,微软悄悄删除了包含1000万张图片的人脸数据集MS Celeb,这些照片都未征得本人同意。

此前用公共摄像头搜集的数据集,如杜克大学的MTMC、斯坦福大学的Brainwash,近年来都被悉数删除。

在公众隐私意识觉醒、法律逐渐完善的背景下,AI数据集到了必须要保护用户隐私的时候了。

参考链接:
[1] https://venturebeat.com/2021/03/16/imagenet-creators-find-blurring-faces-for-privacy-has-a-minimal-impact-on-accuracy/
[2] https://www.wired.com/story/researchers-blur-faces-launched-thousand-algorithms/
[3] http://image-net.org/update-mar-11-2021.php
[4] https://github.com/princetonvisualai/imagenet-face-obfuscation
[5] https://vinayprabhu.medium.com/a-study-of-a-study-of-face-obfuscation-in-imagenet-d7e7591795a2

—  —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

点这里????关注我,记得标星,么么哒~

加入AI社群,拓展你的AI行业人脉

量子位「AI社群」招募中!欢迎AI从业者、关注AI行业的小伙伴们扫码加入,与50000+名好友共同关注人工智能行业发展&技术进展

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/24595.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GPT-4自己对意识的回答

充了一个月的chatgpt plus,来问问gpt的回答 当前要解决的问题,短时睡眠即可以训练,内心想闭眼睛,但是实际不想闭眼睛,所以没有闭眼睛,所以内心的声音只是一部分,实际的输入还包括不是内心声音的…

一个续写故事达到人类水平的AI,OpenAI大规模无监督语言模型GPT-2...

雷锋网 AI 科技评论按:模型大小的比拼还在继续!自谷歌大脑的 2.77 亿参数的语言模型 Transformer-XL 之后,OpenAI 也完成了自己具有 15 亿个参数的语言模型 GPT-2,而且这个模型还有一项惊人的能力,就是从短句续写成篇的…

磁盘配额(Quota)与高级文件系统管理(14章)

1 磁盘配额 1.1 Quota功能与作用 让磁盘的容量公平的分配,且只对一般身份使用者有效 quota 比较常使用的几个情况是: 针对 WWW server ,例如:每个人的网页空间的容量限制!针对 mail server,例如&#xff…

GPT-5不能停!吴恩达LeCun直播回怼马斯克:汽车都还没发明,要什么安全带

点击上方“AI遇见机器学习”,选择“星标”公众号 第一时间获取价值内容 梦晨 发自 凹非寺量子位 | 公众号 QbitAI 大模型研究不能停! 吴恩达和LeCun为了这事儿,甚至亲自搞了场直播。毕竟再不出手,事态眼看着越来越严重了&#xff…

OpenAI创始人:面临GPU短缺恐慌,GPT-3或将开源!

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【目标检测和Transformer】交流群 转载自:机器之心 眼下 OpenAI 面临的最大问题是「缺芯」。 从 ChatGPT 问世以来,大模型和 AI 技术就引起全世界的广…

国产大模型赛道人才济济,AI大战究竟谁能折桂?

原创 | 文 BFT机器人 横空出世的ChatGPT迅速在全球掀起一股AI浪潮,而后GPT4的惊艳发布更是在科技界掷下一颗深水炸弹。 正如英伟达创始人黄仁勋在GTC2023上说的那样“我们正处于AI的iPhone时刻”,由ChatGPT掀起的科技风暴正席卷世界,“AI是否…

“心机boy”马斯克:明面上呼吁暂停先进AI研发,背地里悄悄买1万块GPU推进自研ChatGPT项目...

mi点击“开发者技术前线”,选择“星标” 让一部分开发者看到未来 来自:AI前线 为了研发自家 AIGC, 马斯克狂买 GPU 并四处挖人 早前 马斯克带头和数千名科技大佬呼吁:叫停超强AI研发6个月!,而在当地时间 …

ChatGPT新功能曝光:可记住用户信息、上传文件和工作区

🦉 AI新闻 🚀 ChatGPT新功能曝光:可记住用户信息、上传文件和工作区 摘要:一张神秘截图曝光了ChatGPT新功能,包括可记住用户信息的"My profile"、上传和管理文件的"My files"以及可以让AI使用不…

【类ChatGPT】中文羊驼大模型Alpaca-13B体验

书接上回:https://blog.csdn.net/nlpstarter/article/details/129834424推荐一个在本地部署中文类ChatGPT大模型的开源项目https://blog.csdn.net/nlpstarter/article/details/129834424 之前在推荐了一个中文类ChatGPT的大模型,感兴趣的可以看一下上面…

一名七年老安卓的一二月小结

你好,我是 shixin,一名工作七年的安卓开发。 每两个月我会做一次总结,记下这段时间里有意义的事和值得反复看的内容,为的是留一些回忆、评估自己的行为、沉淀有价值的信息。 一转眼 2023 年过去了六分之一,这两个月经历…

蛋仔派对兑换礼包码分析

🍋前言 由于C站版权太多,所有的爬虫相关均为记录,不做深入! 接到了一个项目大概是电商老板想弄一个自动化工具,方便自己处理买家买的兑换码,一个一个的兑换有点累人,代码写到一半才发现由于自己的原因分析错了,刚刚开始我以为他的验证码是在html上的,就像这样 <…

残疾人手语交流辅助系统手语识别与翻译基于数据手套的虚拟手的实现

残疾人手语交流辅助系统手语识别与翻译&&基于数据手套的虚拟手的实现 1、 特征提取 原始数据含有背景等大量无用成分&#xff0c;通过骨架技术&#xff0c;直接获得手的运动信息&#xff0c;减小问题复杂度。硬件和软件使用的是&#xff1a;Kinect和OpenNI。Kinect可…

AI绘图网站 MJ(Midjourney) 基础讲解+注册教程

【ChatGPT】前些天发现了一个巨牛的人工智能学习电子书&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;无广告&#xff0c;忍不住分享一下给大家。&#xff08;点击查看学习资料&#xff09; 最近有很多伙计在在问如何使用AI作图&#xff0c;MJ当属第一了&#xff0c;不…

ControlNet精准控制AI绘画教程

ControlNet精准控制AI绘画教程 AI绘画相信大家都已经不陌生了&#xff0c;虽然AI绘画出图很方便&#xff0c;但是要让其生成一副自己满意的图&#xff0c;还是需要费一番心思&#xff0c;有时候多次调整关键词就是生成不了自己想要的画面&#xff0c;这些一直以来都是AI绘画的痛…

python爬虫教程实战

写了那么久的博客&#xff0c;终于有了属于自己的小窝&#xff0c;欢迎各位访问我的个人网站&#xff0c;未来我们一起交流进步。 ChatGPT国内镜像站https://gpt.huntersking.top 八方云已经跑路&#xff0c;但其他的如果有类似的bug也一样。 成品 失效 下载链接 https://wwh…

让 ChatGPT 快速实现 To-Do List Web 应用

体验 ChatGPT 有段时间了&#xff0c;关于它的代码能力&#xff0c;只是比较粗浅地使用过。比如让它解一道算法题、解释一段代码的含义等。但它的潜力不止于此&#xff0c;它可以做更多的事情。比如&#xff0c;我们可以让它实现一个 To-Do List Web 应用&#xff0c;像下图这样…

chrome设置黑暗模式的4种方法

chrome设置黑暗模式的4种方法 前言方式一&#xff1a;自带皮肤暗黑具体操作效果 方式二&#xff1a;自带内容暗黑具体操作效果 方式三&#xff1a;安装chrome主题方式四&#xff1a;使用插件效果 额外&#xff1a;开发工具的暗黑设置结语 前言 对于大部分chrome用户来说&#…

实现暗黑模式

一、先在全局css中创建.dark-theme和.light-theme类&#xff0c;在分别在该类中创建相同的var变量 二、在组件刷新时为html添加类&#xff0c;再添加一个按钮可以进行模式切换 效果如下 暗黑模式如下 最后&#xff01;&#xff01;&#xff01;此案例通过vue写的&#xff0…

为 TDesignBlazor 添加暗黑模式

本文将讲述我为 TDesignBlazor 开源项目提交 PR 的经历&#xff0c;主要介绍暗黑模式功能的实现以及之后如何在项目中使用。我将会分享我在实现这一功能时遇到的问题&#xff0c;以及我是如何解决这些问题的。我希望通过我的经历能够鼓励更多的人参与开源项目&#xff0c;为 TD…

暗黑模式(黑暗模式,深色模式)适配

暗黑模式&#xff08;黑暗模式&#xff0c;深色模式&#xff09;适配 全局关闭 打开Info.plist 项目配置文件&#xff0c;添加UIUserInterfaceStyle字段&#xff0c;key类型为String&#xff0c; 其value值设置为 Light模式。 部分关闭 iOS13之后UIViewController与UIView …