BppAttack:通过图像量化和对比对抗学习来攻击深度神经网络

BppAttack:通过图像量化和对比对抗学习来攻击深度神经网络

论文地址:BppAttack

一.
当前主流trigger:
  • image patches:BadNet

  • watermark:

  • image filter:ABS

  • learned image transformation: SSBA(依赖于输入,需要自动编码器资源要求高); Lira辅助图像转换模型

不同Trojan attack的sample比较

在这里插入图片描述

现有Trojan attack工作的问题:

问题一:trigger人眼可以识别,然后基于reverse engineering重构触发器,识别模型是否有Trojan。

问题二:不同的样本共用触发模式.对应defence:Spectre;Abs;Strip;NC

现有主流defence:

基于训练时的分析:训练前光谱特征和activation cluster;训练时poison suppression基于差分隐私

基于逆向工程:NC,ABS,针对patches trigger,对不同trigger types无效(input-aware trigg)

基于清除木马:fine-tune ;pruning;

基于GradCAM:Februss;SentiNet检测模型预测是否本地化,当trigger不是本地化的时候(filter trigger),方法失效

二.
假设:

attacker能够完全控制数据集、训练过程和模型的实现,通过毒害数据集来注入木马。

思路:

人眼感知对颜色微小改变不敏感 →减少bit-per-pixel (BPP) →利用颜色量化和抖动产生trigger →这种small-size作为触发器,导致注入trigger困难 →提出利用对比学习和对抗性训练的方法inject

不可感知的实现:以前定义距离函数测量两个样本视觉上的相似性(LP距离和SSIM分数—)。

generate

1.颜色量化:通过减少颜色深度,将图像的原始palette(每个通道上的每个像素的m位)压缩成一个更小的palette(d位)。对于每个像素,我们使用压缩d位空间中最接近的像素值来替换原始值

在这里插入图片描述

2.抖动:当palette有限时,dithering产生颜色深度错觉。使用Floyd–Steinberg dithering 。它将一个像素的残差量化的误差添加到其相邻像素上,从而扩散误差。

在这里插入图片描述

inject

3.交叉熵损失函数对BPP收敛效果不好,利用对比监督学习和对抗性训练。PGD(基于优化)生成对抗样本,训练时作为negative sample。

三.

代码架构

├── classifier_models # 存放分类模型
├── networks          # 
├── utils             # 模型加载和工具调用
├── bppattacks.py     # 主函数
├── config.py         # 参数设置
├── requirements      #需要的package 
数据集和设置

在这里插入图片描述

classifier_models(不同架构)

在这里插入图片描述

bppattack.py

抖动的实现:每个channel的每个pixel的m位压缩成d位。m=8;2^d=squeeze_num; α1;α2;α3;α4

def floyDitherspeed(image,squeeze_num):channel,h,w=image.shapefor y in range(h):for x in range(w):old =image[:,y,x]temp=npp.empty_like(old).astype(np.float64)new=rnd1(old/255.0*(squeeze_num-1), 0, temp)/ (squeeze_num- 1)*225error = old-newimage[:,y,x]=newif x+1<w:image[:, y, x+1] + =error*0.4375if (y+1<h) and (x+1<w):image[:, y+1,x+1] + =error*0.0625if y+1<h:image[:, y+1,x]+ = error*0.3125if (x-1>=0) and (y+1<h):image[;, y+1, x-1] + = error*0.1875return image

MNIST Classifier的设置

在这里插入图片描述

其他defence的效果:

  • Spectral Signature:收集latent feature,计算outline scores,排除有毒样本。
  • Universal Litmus Patterns:假设trigger是patches。本文trigger不是patchs。
  • Neural Knowledge Distillation:ASR显著下降

在这里插入图片描述

  • Fine-tune:借助Latent backdoor attacks on deep neural networks的方法来对抗fine-tune
attack 比较:
  • ISSBA:利用自动编码的辅助模型,对计算资源要求更高,耗时更多。
  • WaNet:效果近似。

backdoor attacks on deep neural networks*的方法来对抗fine-tune

attack 比较:
  • ISSBA:利用自动编码的辅助模型,对计算资源要求更高,耗时更多。
  • WaNet:效果近似。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/60842.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

生成对抗网络(GAN)详解与实例

GAN介绍 理解GAN的直观方法是从博弈论的角度来理解它。GAN由两个参与者组成&#xff0c;即一个生成器和一个判别器&#xff0c;它们都试图击败对方。生成备从分巾中狄取一些随机噪声&#xff0c;并试图从中生成一些类似于输出的分布。生成器总是试图创建与真实分布没有区别的分…

深度对抗神经网络(DANN)笔记

一 总体介绍 DANN是一种迁移学习方法&#xff0c;是对抗迁移学习方法的代表方法。基本结构由特征提取层f,分类器部分c和对抗部分d组成&#xff0c;其中f和c其实就是一个标准的分类模型&#xff0c;通过GAN&#xff08;生成对抗网络&#xff09;得到迁移对抗模型的灵感。但此时…

机器学习:BP神经网络,CNN卷积神经网络,GAN生成对抗网络

1&#xff0c;基础知识 1.1&#xff0c;概述 机器学习&#xff1a;概念_燕双嘤-CSDN博客1&#xff0c;机器学习概述1.1&#xff0c;机器学习概念机器学习即Machine Learning&#xff0c;涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。目的是让计算机模拟或实…

生成对抗网络(GAN)简单梳理

作者&#xff1a;xg123321123 - 时光杂货店 出处&#xff1a;http://blog.csdn.net/xg123321123/article/details/78034859 声明&#xff1a;版权所有&#xff0c;转载请联系作者并注明出处 网上已经贴满了关于GAN的博客&#xff0c;写这篇帖子只是梳理下思路&#xff0c;以便以…

生成对抗网络(GAN)简介以及Python实现

本篇博客简单介绍了生成对抗网络(Generative Adversarial Networks,GAN)&#xff0c;并基于Keras实现深度卷积生成对抗网络(DCGAN)。 以往的生成模型都是预先假设生成样本服从某一分布族&#xff0c;然后用深度网络学习分布族的参数&#xff0c;最后从学习到的分布中采样生成新…

生成对抗网络(GAN)教程 - 多图详解

一.生成对抗网络简介 1.生成对抗网络模型主要包括两部分&#xff1a;生成模型和判别模型。 生成模型是指我们可以根据任务、通过模型训练由输入的数据生成文字、图像、视频等数据。 [1]比如RNN部分讲的用于生成奥巴马演讲稿的RNN模型,通过输入开头词就能生成下来。…

对抗神经网络学习和实现(GAN)

一&#xff0c;GAN的原理介绍 \quad GAN的基本原理其实非常简单&#xff0c;这里以生成图片为例进行说明。假设我们有两个网络&#xff0c;G&#xff08;Generator&#xff09;和D&#xff08;Discriminator&#xff09;。正如它的名字所暗示的那样&#xff0c;它们的功能分别是…

生成对抗网络(GAN)

1 GAN基本概念 1.1 如何通俗理解GAN&#xff1f; ​ 生成对抗网络(GAN, Generative adversarial network)自从2014年被Ian Goodfellow提出以来&#xff0c;掀起来了一股研究热潮。GAN由生成器和判别器组成&#xff0c;生成器负责生成样本&#xff0c;判别器负责判断生成器生成…

基于图神经网络的对抗攻击 Nettack: Adversarial Attacks on Neural Networks for Graph Data

研究意义 随着GNN的应用越来越广&#xff0c;在安全非常重要的应用中应用GNN&#xff0c;存在漏洞可能是非常严重的。 比如说金融系统和风险管理&#xff0c;在信用评分系统中&#xff0c;欺诈者可以伪造与几个高信用客户的联系&#xff0c;以逃避欺诈检测模型&#xff1b;或者…

生成对抗网络(Generative Adversial Network,GAN)原理简介

生成对抗网络(GAN)是深度学习中一类比较大的家族&#xff0c;主要功能是实现图像、音乐或文本等生成(或者说是创作)&#xff0c;生成对抗网络的主要思想是&#xff1a;通过生成器(generator)与判别器(discriminator)不断对抗进行训练。最终使得判别器难以分辨生成器生成的数据(…

快讯|莫言用 ChatGPT 写《颁奖辞》;特斯拉人形机器人集体出街!已与FSD算法打通

一分钟速览新闻点 言用 ChatGPT 写《颁奖辞》孙其君研究员团队 Adv. Funct. Mater.&#xff1a;多功能离子凝胶纤维膜用于能量离电皮肤微软CEO反驳马斯克&#xff1a;我们没有控制OpenAI特斯拉人形机器人集体出街&#xff01;已与FSD算法打通微软CEO称小型公司仍可在人工智能领…

从供应链到价值链:人形机器人产业链深入研究

原创 | 文 BFT机器人 01 人形机器人产业进展&#xff1a;AI赋能&#xff0c;人形机器人迭代有望加速 目前人形机器人产业所处从“0”到“1”的萌芽期&#xff0c;从现在到未来的时间里&#xff0c;人形机器人以其仿人外形、身体构成及其智能大脑&#xff0c;能极大解放生产力、…

人形机器人火出圈!OpenAI领投挪威人形机器人公司“1X”

文&#xff5c;牛逼的AI 编&#xff5c;猫猫咪子 源&#xff5c;AI源起 目前已经实现了对接GPT4技术的机器人Ameca&#xff0c;它拥有逼真的外观和丰富的表情。 随着人形机器人技术的飞速发展&#xff0c;未来可能不再适用阿西莫夫所提出的“机器人三定律”&#xff0c;因为超级…

chatgpt赋能python:Python登录界面制作指南

Python登录界面制作指南 介绍 登录界面是许多应用程序的关键组成部分之一。Python作为一种优秀的编程语言&#xff0c;拥有着强大的界面开发框架&#xff0c;能够帮助开发人员更轻松地创作出完美的登录界面。 在本文中&#xff0c;我们将向您介绍使用Python如何制作一个简单…

The Journal of Neuroscience: 珠心算训练有助于提高儿童的视觉空间工作记忆

《本文同步发布于“脑之说”微信公众号&#xff0c;欢迎搜索关注~~》 珠心算是指个体在熟练进行珠算操作后&#xff0c;可摆脱实际算盘&#xff0c;借助大脑中虚拟算盘进行数字计算的方式&#xff08;图1&#xff09;。早期行为学研究表明&#xff0c;珠心算个体的数字计算能力…

php珠心算源码,深度解析珠心算的“开智”功能

编者按&#xff1a;本文来自李绵军校长在廊坊智慧特训营演讲。李绵军校长通过十几年来对珠心算的钻研练习&#xff0c;详细解读了珠心算的开智功能&#xff0c;以及“一门深入”的作用。 珠心算的开智价值是在哪里&#xff1f;大家都说开发智力&#xff0c;我在这讲开发智力不是…

php珠心算源码,NOIP201401珠心算测验

珠心算测验 问题描述】 珠心算是一种通过在脑中模拟算盘变化来完成快速运算的一种计算技术。珠心算训练&#xff0c;既能够开发智力&#xff0c;又能够为日常生活带来很多便利&#xff0c;因而在很多学校得到普及。 某学校的珠心算老师采用一种快速考察珠心算加法能力的测验方…

雨课堂提交作业步骤 10步帮你弄好

1 2 3 4 5 6 7 中间计数记错了… 8 9 10 弹出对话框&#xff0c;点击确认即可 提交成功的截图&#xff1a;

2022李宏毅作业hw4 - 挫败感十足的一次作业。

系列文章&#xff1a; 2022李宏毅作业hw1—新冠阳性人员数量预测。_亮子李的博客-CSDN博客_李宏毅hw1 hw-2 李宏毅2022年作业2 phoneme识别 单strong-hmm详细解释。_亮子李的博客-CSDN博客_李宏毅hw2 2021李宏毅作业hw3 --食物分类。对比出来的80准确率。_亮子李的博客-CSDN博客…

php老师的一个作业展示

1.在ScanCode.php中 在judgeTrayCodeEnableIntoWarehouse方法中: 2在CommitTrayCodes.php中 访问时&#xff0c;直接访问CommitTrayCodes.php&#xff0c;这个CommitTrayCodes.php是要建在controller下&#xff0c;建议导一下&#xff0c;老师的数据库&#xff0c;以防止命名…