【视频讲解】Python贝叶斯卷积神经网络分类胸部X光图像数据集实例

全文链接:https://tecdat.cn/?p=37604

分析师:Yuanchun Niu

在人工智能的诸多领域中,分类技术扮演着核心角色,其应用广泛而深远。无论是在金融风险评估、医疗诊断、安全监控还是日常的交互式服务中,有效的分类算法都是实现智能决策的关键点击文末“阅读原文”获取完整代码数据)。

相关视频

随着大数据时代的到来,分类算法面临着前所未有的挑战和机遇。一方面,海量的数据为算法提供了丰富的学习材料;另一方面,如何从这些数据中提取有价值的信息,构建准确、可靠的分类模型,成为了研究的热点。

本文旨在探讨分类技术在不同领域的应用,并深入分析其理论基础与实现方法。我们首先概述了分类问题的基本框架,包括常见的输入输出特性。随后,通过具体的应用实例的代码数据,展示了分类技术在手写字符识别数据等领域的实际应用。进一步地,本文详细讨论了分类方法的演进,从基于回归的简单分类到基于概率模型的复杂分类策略,再到现代的贝叶斯方法,揭示了分类技术的发展脉络。

特别地,本文重点研究了贝叶斯卷积神经网络(Bayesian CNN)在处理数据不确定性方面的优势。通过引入KL散度作为正则化项,贝叶斯CNN能够在模型训练过程中自然地考虑参数的不确定性,从而在面对数据的噪声和变化时,提供更加鲁棒的预测。本文通过在玩具数据集和真实世界的胸部X光图像数据集上的实验,验证了贝叶斯CNN的有效性,并探讨了其在实际应用中的潜力。

一、引言

在人工智能领域,分类是一项至关重要的任务,它在众多实际应用中发挥着关键作用。从金融领域的信用评分到医疗诊断,从手写字符识别到人脸识别,分类问题无处不在。本文将对不同领域的分类问题进行探讨,分析其输入输出特点,并深入研究分类的实现方法。

二、分类应用实例

  • 信用评分

  • 输入:收入、储蓄、职业、年龄、过往财务历史等信息。

  • 输出:接受或拒绝。

  • 医疗诊断

  • 输入:当前症状、年龄、性别、过往医疗历史等。

  • 输出:可能的疾病种类。

  • 手写字符识别

  • 输入:手写字符 “金”。

  • 输出:识别结果。

  • 人脸识别

  • 输入:面部图像。

  • 输出:对应的人物。

三、分类方法

  • 基于回归的分类

  • 以二分类为例,训练时将类别 1 表示为目标为 1,类别 2 表示为目标为 -1。测试时,接近 1 的归为类别 1,接近 -1 的归为类别 2。

  • 多分类问题

  • 以类别 1 目标为 1、类别 2 目标为 2、类别 3 目标为 3 等为例,说明多分类问题的复杂性。

  • 理想的分类替代方案

  • 函数(模型):若函数 g (x)>0,输出为类别 1;否则输出为类别 2。

  • 损失函数:L (f) 为训练数据中函数结果错误的次数。

  • 寻找最佳函数:例如感知机、支持向量机等。

四、从类别中获取概率

假设数据点是从高斯分布中采样得到,寻找背后的高斯分布以确定新数据点的概率。

五、最大似然估计

对于给定的 “水” 类型数据点 x1,x2,x3,...,x79,假设它们来自具有最大似然的高斯分布 (μ)。

  1. 高斯分布的概率密度函数用特定形式表示。

  2. 似然函数 L (μ,Σ) 为多个概率密度函数的乘积形式。

  3. 通过最大似然估计确定参数 μ=argmax (μ,Σ) L (μ,Σ),其中 μ* 有特定表达式。

六、分类应用

现在可以进行分类,例如对于 “水” 类型分类问题,有 f (μ1,Σ1)(x) 的表达式,其中 P (c1) 有特定值。类似地,对于另一类别有 f (μ2,Σ2)(x) 的表达式,其中 P (c2) 有特定值。如果 P (c1|x)>0.5,则 x 属于类别 1(水)。

贝叶斯卷积神经网络对数据的影响|附代码数据

在本研究中,我们探讨了KL权重在贝叶斯卷积神经网络(CNN)中对数据的影响。首先,我们使用标准化方法对数据进行预处理,以确保模型训练的有效性。

x = \text{Scaler}().\text{fit_transform}(x)

为了监控模型在每个训练周期后参数的不确定性,我们设计了一个回调函数PosteriorRecorder,用于记录后验标准差。

c02ed8f3b21549d49fb7f1aac16434ab.png

``````
class PosteriorRecorder(tf.keras.callbacks.Callback):def \_\_init\_\_(self, \*\*kwargs):super(PosteriorRecorder, self).\_\_init\_\_(\*\*kwargs)

随后,我们对不同的KL权重进行了模型训练,并对结果进行了记录和分析。

最后,我们绘制了不同KL权重下后验标准差的图表,以直观展示其对模型性能的影响。

scaler = Scaler()x = scaler.fit_transform(x)

94ff106ce3a5b394e6c9b305737ef703.png

87409555be21c1d800bcdb1703fa6fea.png


点击标题查阅往期内容

7e16ef3de8dfe6ebfa5ab6542bfe4a04.jpeg

R语言贝叶斯Metropolis-Hastings采样 MCMC算法理解和应用可视化案例

outside_default.png

左右滑动查看更多

outside_default.png

01

dfa2c0685157f4659a46d530aa19df3d.png

02

4c718a66525aa3aa480cba83cb471563.png

03

87687dc7fbecd10ae663582adb70be2d.png

04

7e52d942b053fc601a50decc6c3f5423.png

贝叶斯卷积神经网络在胸部X光图像数据集上的应用|附代码数据

在研究的第二部分,我们将贝叶斯CNN应用于真实数据集,以验证其在实际问题中的有效性。

``````
import warningswarnings.filterwarnings('ignore')import tensorflow as tf  # 2.8.0import tensorflow_probability as tfp  # 0.16

接着,我们加载并预处理了胸部X光图像数据集,为模型训练做好准备。

``````
data\_path = 'data/chest\_xray/'train\_ds = tf.keras.utils.image\_dataset\_from\_directory(data_path)

为了更好地理解数据集,我们探索了数据集中的图像和标签,并检查了类别分布。

76f3155954480cd778de3219f5dfff39.png

1cf8026ad71aacc7ae3d36a4de445bd0.png

我们定义了一个函数get_classes来统计数据集中各类别的数量,并通过可视化手段展示了类别分布。

def get\_classes(dataset: tf.data.Dataset) -> np.ndarray:counts = \[\]for image, label in dataset:counts.append(np.argmax(label, axis=-1))# 使用Seaborn库绘制类别分布图sns.countplot(class\_names\_test, ax=ax\[1\])ax\[1\].set\_title('Test set')fig.suptitle('Class distribution')

2ba365b88c364b3196cecf5ccaa02a9d.png

为了近似计算KL散度,我们定义了kl_approx函数,并将其应用于模型训练过程中。

``````
def kl\_approx(q, p, q\_tensor):return tf.reduce\_mean(q.log\_prob(q\_tensor) - p.log\_prob(q\_tensor))divergence\_fn = lambda q, p, q\_tensor: kl\_approx(q, p, q\_tensor) / (len(train\_classes))

我们封装了重参数化层的创建过程,以简化模型构建的复杂性。

``````
def get\_convolution\_reparameterization(filters, kernel\_size, activation, strides=1, padding='SAME', prior=prior, divergence\_fn=divergence\_fn, name=None) -> tfpl.Convolution2DReparameterization:"""返回一个Convolution2DReparameterization层。"""return tfpl.Convolution2DReparameterization(filters=filters,kernel\_size=kernel\_size,activation=activation,strides=strides,padding=padding,kernel\_posterior\_fn=tfpl.default\_mean\_field\_normal\_fn(is\_singular=False),kernel\_prior\_fn=prior,kernel\_divergence\_fn=divergence\_fn,bias\_posterior\_fn=tfpl.default\_mean\_field\_normal\_fn(is\_singular=False),bias\_prior\_fn=prior,bias\_divergence\_fn=divergence_fn,name=name)

通过构建残差块和特征提取器,我们构建了一个基于DenseNet121的贝叶斯ResNet模型,并对其进行了训练和评估。

``````
feature\_extractor = tf.keras.applications.DenseNet121(include\_top=False, input\_shape=(224, 224, 3), weights='imagenet')feature\_extractor.summary()# 构建贝叶斯ResNet模型# ...

在模型训练过程中,我们使用了自定义的损失函数和评估指标,并应用了早停和学习率衰减等策略来优化训练效果。

``````
model.compile(optimizer=tf.keras.optimizers.Adam(learning\_rate=0.001), loss=nll, metrics=\[tf.keras.metrics.CategoricalAccuracy()\])callbacks = \[tf.keras.callbacks.EarlyStopping(monitor='val\_categorical\_accuracy', patience=7, restore\_best\_weights=True, verbose=1),tf.keras.callbacks.ReduceLROnPlateau(monitor='val\_categorical\_accuracy', min\_lr=1e-9, factor=0.1, patience=3, verbose=1)\]model.fit(train\_ds, epochs=64, validation\_data=test_ds, callbacks=callbacks)

最后,我们对模型的预测结果进行了分析,以评估模型在真实数据上的性能。

def analyse\_model\_prediction(image, label=None, forward_passes=10):# ...# 分析模型预测

2340f1a9a783dcf476de08419d9ac355.png

5b590d66c6c6a945859324d802b5e628.png

通过上述研究,我们展示了贝叶斯CNN在处理数据和真实数据时的有效性和灵活性。我们的研究为未来在更复杂的数据集上应用贝叶斯深度学习模型提供了有价值的参考。

关于分析师

19699bd005ed62da9ba7552dc81e134f.png

在此对 Yuanchun Niu 对本文所作的贡献表示诚挚感谢,他完成了控制科学与工程专业的硕士研究生学位,专注深度学习、机器学习领域。擅长汇编语言、Python。

b3e166222615e7664dd2a45acf0d35f8.jpeg

本文中分析的数据、代码分享到会员群,扫描下面二维码即可加群! 

b352546f73a46ae4847c2a9a6e2d09be.png


资料获取

在公众号后台回复“领资料”,可免费获取数据分析、机器学习、深度学习等学习资料。

499be8fe1e4ca45b31812a517c9737e3.jpeg

点击文末“阅读原文”

获取全文完整代码数据资料。

本文选自《Python贝叶斯卷积神经网络分类胸部X光图像数据集实例》。

点击标题查阅往期内容

R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享

PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像

MATLAB随机森林优化贝叶斯预测分析汽车燃油经济性

R语言中贝叶斯网络(BN)、动态贝叶斯网络、线性模型分析错颌畸形数据

使用贝叶斯层次模型进行空间数据分析

MCMC的rstan贝叶斯回归模型和标准线性回归模型比较

python贝叶斯随机过程:马尔可夫链Markov-Chain,MC和Metropolis-Hastings,MH采样算法可视化

Python贝叶斯推断Metropolis-Hastings(M-H)MCMC采样算法的实现

matlab贝叶斯隐马尔可夫hmm模型实现

贝叶斯线性回归和多元线性回归构建工资预测模型

Metropolis Hastings采样和贝叶斯泊松回归Poisson模型

贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据

R语言RSTAN MCMC:NUTS采样算法用LASSO 构建贝叶斯线性回归模型分析职业声望数据

R语言STAN贝叶斯线性回归模型分析气候变化影响北半球海冰范围和可视化检查模型收敛性

PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像

贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据

R语言JAGS贝叶斯回归模型分析博士生延期毕业完成论文时间

R语言Metropolis Hastings采样和贝叶斯泊松回归Poisson模型

Python决策树、随机森林、朴素贝叶斯、KNN(K-最近邻居)分类分析银行拉新活动挖掘潜在贷款客户

R语言贝叶斯MCMC:用rstan建立线性回归模型分析汽车数据和可视化诊断

R语言贝叶斯MCMC:GLM逻辑回归、Rstan线性回归、Metropolis Hastings与Gibbs采样算法实例

R语言贝叶斯Poisson泊松-正态分布模型分析职业足球比赛进球数

随机森林优化贝叶斯预测分析汽车燃油经济性

R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

R语言用Rcpp加速Metropolis-Hastings抽样估计贝叶斯逻辑回归模型的参数

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归

Python贝叶斯回归分析住房负担能力数据集

R语言实现贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析

Python用PyMC3实现贝叶斯线性回归模型

R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型

R语言Gibbs抽样的贝叶斯简单线性回归仿真分析

R语言和STAN,JAGS:用RSTAN,RJAG建立贝叶斯多元线性回归预测选举数据

R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

R语言贝叶斯线性回归和多元线性回归构建工资预测模型

R语言贝叶斯推断与MCMC:实现Metropolis-Hastings 采样算法示例

R语言stan进行基于贝叶斯推断的回归模型

R语言中RStan贝叶斯层次模型分析示例

R语言使用Metropolis-Hastings采样算法自适应贝叶斯估计与可视化

R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型

WinBUGS对多元随机波动率模型:贝叶斯估计与模型比较

R语言实现MCMC中的Metropolis–Hastings算法与吉布斯采样

R语言贝叶斯推断与MCMC:实现Metropolis-Hastings 采样算法示例

R语言使用Metropolis-Hastings采样算法自适应贝叶斯估计与可视化

视频:R语言中的Stan概率编程MCMC采样的贝叶斯模型

R语言MCMC:Metropolis-Hastings采样用于回归的贝叶斯估计

60624e14cad98bc8b6023e4f4bcdeca0.jpeg

f56ab9bd7fe34f69cb5beb3aba3be8ca.png

7e7208c09a948ff2b38748830ed91bf5.png

79ea89cda64f9e760a3ecc4cce484e23.jpeg

e2b4399baa1e0b3b82e638c2f2215d4a.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/418383.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解锁Web3.0——Scaffold-eth打造以太坊DApp的终极指南

🚀本系列文章为个人学习笔记,目的是巩固知识并记录我的学习过程及理解。文笔和排版可能拙劣,望见谅。 目录 前言 一、快速部署 1、前期准备: 2、安装项目: ​ 二、配置部署运行环境 1、初始化本地链:…

VisualStudio环境搭建C++

Visual Studio环境搭建 说明 C程序编写中,经常需要链接头文件(.h/.hpp)和源文件(.c/.cpp)。这样的好处是:控制主文件的篇幅,让代码架构更加清晰。一般来说头文件里放的是类的申明,函数的申明,全局变量的定义等等。源…

【最新华为OD机试E卷-支持在线评测】机器人活动区域(100分)多语言题解-(Python/C/JavaScript/Java/Cpp)

🍭 大家好这里是春秋招笔试突围 ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-E/D卷的三语言AC题解 💻 ACM金牌🏅️团队| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢💗 🍿 最新华为OD机试D卷目录,全、新、准,题目覆盖率达 95% 以上,…

移动UI:分类列表页、筛选页的设计揭秘。

移动UI的列表页设计需要考虑用户体验和界面美观性,以下是一些建议的设计要点: 1. 列表项的展示: 列表页应该清晰地展示各个列表项,包括标题、副标题、缩略图等内容,以便用户快速浏览和识别。可以使用卡片式布局或者简…

UnLua环境搭建

一、环境搭建 1、下载UnLua工程:https://github.com/Tencent/UnLua 2、复制Plugins/UnLua目录下的插件到自己的项目中 3、重新生成自己的VS工程 4、打开VS工程的项目名.Build.cs文件,引用UnLua插件,重新编译工程 PublicDependencyModuleNames.AddRan…

金税四期工程运维:税务领域的信息化挑战与策略

在信息化浪潮的推动下,中国税务系统迎来了“金税四期”工程这一重大变革。作为税务信息化的新阶段,金税四期不仅标志着税务管理向更高效、更智能的方向迈进,同时也对运维工作提出了前所未有的挑战。本文将从金税四期的背景、运维需求分析、面…

Redis进阶(六):缓存

1.缓存 速度快的设备可以作为速度慢的设备的缓存 缓存能够有意义:二八定律,20%的数据可以应对80%的请求 通常使用redis作为数据库的缓存(mysql) 数据库是非常重要的组件,mysql速度比较慢 因为mysql等数据库&#x…

CSP-J基础之进制转换

文章目录 前言数制1. **二进制 (Binary)**2. **八进制 (Octal)**3. **十进制 (Decimal)**4. **十六进制 (Hexadecimal)** K进制转十进制例子 1:以二进制(K 2)为基数例子 2:以八进制(K 8)为基数例子 3&…

scRNA-data中的R值

愿武艺晴小朋友一定得每天都开心 当我们测序拿得到各个样本中基因的表达值&#xff0c;就可以用基因表达值来表征样本间的相关性 代码如下&#xff1a; #样本间相似性&#xff1a;R值 相关性 捕获到的基因在两个样本间表达趋势一致性 exp_RNA <- AverageExpression(fasti…

雷电9模拟器安装magisk和lsposed

模拟器环境配置 1、开启root 2、开启System.vmdk可写入 安装magisk 1、新建模拟器、开启root权限、并安装debug版magisk 下载地址去上面吾爱论坛作者文章下载吧&#xff01;支持他一下&#xff01; 2、打开magisk的app&#xff0c;点击安装 如果弹出获取权限&#xff0c;直接…

JUC面试知识点手册

第一章&#xff1a;Java并发简介 1.1 什么是并发编程 并发编程是指在同一时间段内执行多个任务的编程方式。在单核处理器上&#xff0c;并发通过时间分片来实现&#xff0c;即在同一时间只有一个任务在执行&#xff0c;其他任务被暂停等待。在多核处理器上&#xff0c;并发可…

vulhub GhostScript 沙箱绕过(CVE-2018-16509)

1.执行以下命令启动靶场环境并在浏览器访问 cd vulhub/ghostscript/CVE-2018-16509 #进入漏洞环境所在目录 docker-compose up -d #启动靶场 docker ps #查看容器信息 2.访问网页 3.下载包含payload的png文件 vulhub/ghostscript/CVE-2018-16509/poc.png at master vulh…

java宠物商城网站系统的设计与实现

springboot508基于Springboot宠物商城网站系统 题目&#xff1a;宠物商城网站系统的设计与实现 摘 要 如今社会上各行各业&#xff0c;都喜欢用自己行业的专属软件工作&#xff0c;互联网发展到这个时候&#xff0c;人们已经发现离不开了互联网。新技术的产生&#xff0c;往往…

Datawhale X 李宏毅苹果书 AI夏令营第五期 DL进阶方向 Task3笔记

Datawhale X 李宏毅苹果书 向李宏毅学深度学习&#xff08;进阶&#xff09; 是 Datawhale 2024 年 AI 夏令营第五期的学习活动&#xff08;“深度学习 进阶”方向&#xff09; 往期task1链接&#xff1a;深度学习进阶-Task1 往期task2链接&#xff1a;深度学习进阶-Task2 我做…

如何利用评论进行有效的 ASO

如何利用评论进行有效的ASO的问题的答案通常以“正面评论”一词开始。确实&#xff0c;这句话首先浮现在脑海中。但这个问题的答案包括负面评论、用户体验、提高知名度、评分、根据评论优化应用程序以及许多其他有趣的点。这里几乎没有无聊的统计数据&#xff0c;这些数字也不会…

c++ 原型模式

文章目录 什么是原型模式为什么要使用原型模式使用场景示例 什么是原型模式 用原型实例指定创建对象的种类&#xff0c;并通过拷贝这些原型创建新的对象&#xff0c;简单理解就是“克隆指定对象” 为什么要使用原型模式 原型模式&#xff08;Prototype Pattern&#xff09;是…

绝对定位导致内容自动换行问题解决

今天在做一个定位元素的时候遇到一个嵌套定位之后&#xff0c;使用绝对定位的元素的内容自动换行的问题&#xff0c;希望不换行只在一行显示。 可以通过添加 white-space: nowrap; 样式控制不换行 <div class"box"><div class"box1"><div …

【MySQL超详细安装步骤】Centos7安装MySQL8

文章目录 1.卸载2.修改yum源为阿里源2.1首先检查是否安装wget2.2 备份 yum 源文件2.3 下载阿里云yum源文件2.4 清理yum缓存 3.安装mysql源3.1 下载mysql源3.2 安装mysql源3.3 检查是否安装成功 4. 安装MySQL4.1 使用yum安装4.2 启动MySQL 5.配置防火墙5.1 开放3306端口 6.登录M…

2. GIS数据工程师岗位职责、技术要求和常见面试题

本系列文章目录&#xff1a; 1. GIS开发工程师岗位职责、技术要求和常见面试题 2. GIS数据工程师岗位职责、技术要求和常见面试题 3. GIS后端工程师岗位职责、技术要求和常见面试题 4. GIS前端工程师岗位职责、技术要求和常见面试题 5. GIS工程师岗位职责、技术要求和常见面试…

macos系统内置php文件列表 系统自带php卸载方法

在macos系统中, 自带已经安装了php, 根据不同的macos版本php的版本号可能不同, 我们可以通过 which php 命令来查看mac自带的默认php安装路径, 不过注意这个只是php的执行文件路径. 系统自带php文件列表 一下就是macos默认安装的php文件列表. macos 10.15内置PHP文件列表配置…