PP-PLL:基于概率传播的部分标签学习

以下是对论文《PP-PLL: Probability Propagation for Partial Label Learning》的总结,按照假设、创新点、技术路线、技术实现细节、具体的数学公式、实验结果分析和结论的结构进行。


假设

  • 流形假设:论文假设特征空间中的样本遵循流形结构,即相邻样本的标签分布相似。这一假设认为,样本在特征空间中的拓扑关系可以用来推断其标签分布。
  • 候选标签的互斥性:每个样本的真实标签隐藏在候选标签集中,且候选标签之间具有互斥性。论文假定真实标签不会被大量的假阳性标签完全淹没,从而可以通过适当的方法从候选标签中提取出来。

创新点

  • 双凸正则化框架:提出了一种双凸正则化函数,结合了输入特征到真实标签的线性映射和基于流形假设的标签传播。这种框架在优化过程中同时考虑了特征信息和样本间的拓扑关系。
  • 概率传播方法:通过交替优化实现概率传播,增强候选标签之间的互斥性,有效防止真实标签被大量假阳性候选标签淹没,提升标签消歧的准确性。
  • 拓扑结构作为附加信息:利用训练样本之间的拓扑关系(如k近邻构建的加权图)作为附加信息,加强标签互斥性,提高模型对部分标签数据的鲁棒性。

技术路线

论文的技术路线分为以下几个步骤:

  1. 构建加权图:使用k近邻(k-NN)方法构建有向加权图,捕捉训练样本之间的拓扑关系,为后续标签传播提供基础。
  2. 定义目标函数:设计一个双凸目标函数,包含三个部分:
    • 保真项:通过KL散度衡量标签分布与条件概率矩阵的接近程度。
    • 正则化项:采用Frobenius范数防止参数矩阵冗余。
    • 平滑项:基于流形假设,确保标签分布在拓扑结构上的平滑性。
  3. 交替优化:通过交替优化方法求解目标函数,分别更新标签分布矩阵 F \mathbf{F} F和参数矩阵 θ \mathbf{\theta} θ
  4. 预测阶段:对未见样本,计算其条件概率矩阵,并通过标签传播获得最终的标签分布,进而预测真实标签。

技术实现细节

  • 加权图构建:基于k-NN构建有向图,权重通过优化线性最小二乘问题计算,并对权重矩阵进行归一化处理,以避免概率发散。
  • 目标函数形式

J ( D , θ , F ) = L ( D , F , θ ) + λ Ω ( θ ) + μ Q ( F ) \mathcal{J}(\mathcal{D}, \mathbf{\theta}, \mathbf{F}) = \mathcal{L}(\mathcal{D}, \mathbf{F}, \mathbf{\theta}) + \lambda \Omega(\mathbf{\theta}) + \mu \mathcal{Q}(\mathbf{F}) J(D,θ,F)=L(D,F,θ)+λΩ(θ)+μQ(F)

其中:

  • L \mathcal{L} L:保真项,使用KL散度衡量标签分布与条件概率的差异。
  • Ω \Omega Ω:正则化项,采用Frobenius范数控制参数复杂度。
  • Q \mathcal{Q} Q:平滑项,确保标签分布在流形上的连续性。
  • 优化过程
    • 更新 F \mathbf{F} F:固定 θ \mathbf{\theta} θ,通过标签传播近似求解最优标签分布。
    • 更新 θ \mathbf{\theta} θ:固定 F \mathbf{F} F,使用L-BFGS优化算法更新参数矩阵。
  • 初始化:条件概率矩阵 C \mathbf{\mathcal{C}} C初始化为候选标签集内的均匀分布,即每个候选标签初始概率相等。

具体的数学公式

  • 条件概率定义

P ( y i = j ∣ x i , θ ) = { exp ⁡ ( θ j ⊤ x i ) ∑ j ′ ∈ S i exp ⁡ ( θ j ′ ⊤ x i ) if  j ∈ S i 0 otherwise P(y_i = j | \mathbf{x}_i, \mathbf{\theta}) = \begin{cases} \frac{\exp(\mathbf{\theta}_j^\top \mathbf{x}_i)}{\sum_{j' \in S_i} \exp(\mathbf{\theta}_{j'}^\top \mathbf{x}_i)} & \text{if } j \in S_i \\ 0 & \text{otherwise} \end{cases} P(yi=jxi,θ)= jSiexp(θjxi)exp(θjxi)0if jSiotherwise

表示样本 x i \mathbf{x}_i xi的标签 j j j的条件概率,仅在候选标签集 S i S_i Si内非零。

  • 保真项

L ( D , F , θ ) = ∑ i = 1 m ∑ j ∈ S i F i j log ⁡ F i j C i j \mathcal{L}(\mathcal{D}, \mathbf{F}, \mathbf{\theta}) = \sum_{i=1}^{m} \sum_{j \in S_i} \mathbf{F}_{i j} \log \frac{\mathbf{F}_{i j}}{\mathbf{\mathcal{C}}_{i j}} L(D,F,θ)=i=1mjSiFijlogCijFij

使用KL散度度量标签分布 F \mathbf{F} F与条件概率 C \mathbf{\mathcal{C}} C的差异。

  • 平滑项

Q ( F ) = 1 2 ∑ i , j = 1 n w i j ∥ F i D i i − F j D j j ∥ 2 2 \mathcal{Q}(\mathbf{F}) = \frac{1}{2} \sum_{i,j=1}^{n} w_{ij} \left\| \frac{\mathbf{F}_i}{\sqrt{D_{ii}}} - \frac{\mathbf{F}_j}{\sqrt{D_{jj}}} \right\|_2^2 Q(F)=21i,j=1nwij Dii FiDjj Fj 22

其中 w i j w_{ij} wij是加权图中的权重, D i i D_{ii} Dii是对角矩阵 D \mathbf{D} D的对角元素,确保相邻样本的标签分布相似。

  • 优化问题

min ⁡ θ , F ∑ i = 1 m ∑ j ∈ S i F i j log ⁡ F i j C i j + λ 2 ∥ θ ∥ F 2 + μ 2 ∑ i , j = 1 n w i j ∥ F i D i i − F j D j j ∥ 2 2 \min_{\mathbf{\theta}, \mathbf{F}} \sum_{i=1}^{m} \sum_{j \in S_i} \mathbf{F}_{i j} \log \frac{\mathbf{F}_{i j}}{\mathbf{\mathcal{C}}_{i j}} + \frac{\lambda}{2} \|\mathbf{\theta}\|_F^2 + \frac{\mu}{2} \sum_{i,j=1}^{n} w_{ij} \left\| \frac{\mathbf{F}_i}{\sqrt{D_{ii}}} - \frac{\mathbf{F}_j}{\sqrt{D_{jj}}} \right\|_2^2 θ,Fmini=1mjSiFijlogCijFij+2λθF2+2μi,j=1nwij Dii FiDjj Fj 22

约束条件: ∑ j = 1 q F i j = 1 , F i j ≥ 0 , ∀ i \sum_{j=1}^{q} \mathbf{F}_{i j} = 1, \mathbf{F}_{i j} \geq 0, \forall i j=1qFij=1,Fij0,i,目标是最小化总损失。


实验结果分析

  • 控制UCI数据集:在不同部分标签比例 p p p(0.1到0.7)和干扰标签集大小 r r r(1到3)下,PP-PLL在大多数情况下优于其他部分标签学习算法(如PL-KNN、PL-SVM等),显示出较强的分类性能。
  • 真实世界数据集:在Bird Song Classification、Automatic Face Naming(如Lost)、Facial Age Estimation(如FG-NET)和Objective Classification(如MSRCv2)等任务中,PP-PLL表现出色,仅在Yahoo! News数据集上略逊于GM-PLL、PL-SVM和PL-ECOC。
  • 参数敏感性分析:PP-PLL在不同参数配置( k k k μ \mu μ λ \lambda λ)下表现稳定,迭代次数达到20-40次时模型收敛,验证了算法的鲁棒性和收敛性。

结论

  • 优势:PP-PLL通过概率传播和流形假设,有效从部分标签数据中学习,增强了候选标签的互斥性,避免真实标签被假阳性标签淹没。
  • 性能:在控制UCI数据集和真实世界数据集上,PP-PLL的性能优于或与最先进的部分标签学习方法相当,展现了良好的泛化能力和预测精度。
  • 未来工作:论文建议探索更有效的加权图构建方法,尤其是在候选标签集较大时,提高模型对真实标签信息的利用效率。此外,可以结合候选标签集的概率分布进一步优化模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/39924.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器学习(八)

一,基于协同过滤的推广算法: 算法原理: 基于用户的协同过滤(计算用户相似度→找出相似用户→根据相似用户的喜好推荐物品) 基于物品的协同过滤(计算物品相似度→找出用户喜欢的物品→推荐相似物品) 构造矩阵进行分解(将用户-物品评分矩阵分解…

云原生算力引擎:分布式推理的流体动力学

引言:算力黑洞的引力扰动 OpenAI推理集群日处理4.5亿次请求,CUDA 12.3实现μs级张量切换。特斯拉Dojo超算芯片间延迟0.5ns,阿里巴巴PAI平台节省58%训练时长。HuggingFace模型库下载量突破3亿次,AWS Inferentia芯片能效比提升8倍。…

流量分析2

一,webshell流量 [GKCTF 2021]签到 先看协议分级,大部分是tcp,里面有http的基于的行文本数据占了很大的比重,看看里面有什么 过滤http的流量 点击一条流量,里面的内容进去后面有基于行的文本数据, 先解he…

解锁智能协作:蓝耘平台如何打破应用壁垒,实现无缝联动

在当今快速发展的数字化时代,企业面临着越来越复杂的应用架构与系统集成挑战。传统的孤立系统已无法满足现代企业对于高效协作与数据共享的需求,因此,如何实现不同应用系统间的无缝联动,成为了数字化转型的关键课题。蓝耘平台作为…

3月25号

添加图片的一些例子: // 创建一个二维数组,用来管理数据int[][] data new int[4][4]; // 记录空白方块的位置int x0;int y0; // 定义一个变量,记录当前展示图片的路径String path"E:\\java\\jigsawgame\\路飞\\路飞"; // 加载图片细节: // …

单片机和微控制器知识汇总——《器件手册--单片机、数字信号处理器和可编程逻辑器件》

目录 四、单片机和微控制器 4.1 单片机(MCU/MPU/SOC) 一、定义 二、主要特点 三、工作原理 四、主要类型 五、应用领域 六、选型与设计注意事项 七、发展趋势 4.2 数字信号处理器(DSP/DSC) ​编辑​编辑 一、定义 二、工作原理 三、结构特点 四、应用领域 五、选型与设计注…

迷宫问题——(java)(bfs)

2.走迷宫 - 蓝桥云课 bfs :我的理解就是按层数便利,便利完一层再遍历下一层 bfs:一般用来求解权相等的最短路径和最小操作数的问题 一般使用队列来实现 1.初始化队列 先将起始节点放入队列中 2.从队列中取出一个没有访问过的节点,将该节点的访问状态…

Axure大屏可视化模板:赋能多领域,开启数据展示新篇章

在当今这个数据爆炸的时代,数据已经成为各行各业的核心资产。然而,如何高效、直观地展示数据,并将其转化为有价值的决策依据,成为了许多企业和组织面临的共同挑战。Axure大屏可视化模板,作为一款强大的数据展示工具&am…

Linux--进程控制

ok&#xff0c;我们今天学习Linux中的进程控制&#xff08;进程创建、终止、等待、替换&#xff09; 进程创建 fork函数 在linux中fork函数是⾮常重要的函数&#xff0c;它从已存在进程中创建⼀个新进程。新进程为子进程&#xff0c;⽽原进程为父进程。 #include <unist…

【开源宝藏】用 JavaScript 手写一个丝滑的打字机动画效果

你当前项目实现了一个非常丝滑的 打字机文字效果动画&#xff0c;使用的是自定义的 typical.js 脚本。下面我将给出一份逐步拆解的中文教程&#xff0c;帮你或其他初学者快速上手并自定义这个打字效果。 ✨ 最终效果 打开页面后&#xff0c;中央会逐字显示&#xff1a; Hello…

UE4学习笔记 FPS游戏制作17 让机器人持枪 销毁机器人时也销毁机器人的枪 让机器人射击

添加武器插槽 打开机器人的Idle动画&#xff0c;方便查看武器位置 在动画面板里打开骨骼树&#xff0c;找到右手的武器节点&#xff0c;右键添加一个插槽&#xff0c;重命名为RightWeapon&#xff0c;右键插槽&#xff0c;添加一个预览资产&#xff0c;选择Rifle&#xff0c;根…

气象可视化卫星云图的方式:方法与架构详解

气象卫星云图是气象预报和气候研究的重要数据来源。通过可视化技术,我们可以将卫星云图数据转化为直观的图像或动画,帮助用户更好地理解气象变化。本文将详细介绍卫星云图可视化的方法、架构和代码实现。 一、卫星云图可视化方法 1. 数据获取与预处理 卫星云图数据通常来源…

26考研——树与二叉树_树、森林(5)

408答疑 文章目录 二、树、森林树的基本概念树的定义和特性树的定义树的特性 基本术语树的基本术语和概念祖先、子孙、双亲、孩子、兄弟和堂兄弟结点的层次、度、深度和高度树的度和高度分支结点和叶结点有序树和无序树路径和路径长度 森林的基本术语和概念森林的定义森林与树的…

为何服务器监听异常?

报错&#xff1a; 执行./RCF后出现监听异常--在切换网络后&#xff0c;由于前面没有退出./RCF执行状态&#xff1b;重新连接后&#xff0c;会出现服务器监听异常 原因如下&#xff1a; 由于刚开始登录内网&#xff0c;切换之后再重新登录内网&#xff0c;并且切换网络的过程中…

ROS2 架构梳理汇总整理

文章目录 前言正文机器人平台整体架构&#xff08;ROS2&#xff09;图一、个人理解整体架构 ROS2架构图一、个人理解ROS2整体架构图二、开发者整理ROS2整体架构图三、Intel整理ROS2整体架构图四、DDS具体架构说明 ROS2 Control架构图一、官方整整理ROS2 Control整体架构 总结 前…

定长内存池原理及实现

目录 一、池化技术 二、内存池 三、内存池主要解决的问题 四、定长内存池的实现 1.定长内存池的原理 2.框架 3.Delete实现 4.New实现 5.性能测试 五、源码 FixedMemoryPool.h test.cc 一、池化技术 所谓“池化技术”&#xff0c;就是程序先向系统申请过量的资源&…

广告推荐算法 - 学习笔记

文章目录 1、前言2、学习笔记2.1、什么是计算广告系统&#xff1f; 1、前言 本篇博客&#xff0c;是我用来记录学习广告推荐算法的一些笔记和总结。 参考内容&#xff1a; 1、王喆&#xff1a;"深度"学习计算广告 2、deepseek 2、学习笔记 2.1、什么是计算广告系统…

卷积神经网络的原理、实现及变体

卷积神经网络convolutional neural network&#xff0c;CNN 是为处理图像数据而生的网络&#xff0c;主要由卷积层&#xff08;填充和步幅&#xff09;、池化层&#xff08;汇聚层&#xff09;、全连接层组成。 卷积 虽然卷积层得名于卷积&#xff08;convolution&#xff09…

Excel第41套全国人口普查

2. 导入网页中的表格&#xff1a;数据-现有链接-考生文件夹&#xff1a;网页-找到表格-点击→变为√-导入删除外部链接关系&#xff1a;数据-点击链接-选中连接-删除-确定&#xff08;套用表格格式-也会是删除外部链接&#xff09;数值缩小10000倍&#xff08;除以10000即可&am…

深度学习篇---回归分类任务的损失函数

文章目录 前言一、分类任务常用损失函数1. 交叉熵损失&#xff08;Cross-Entropy Loss&#xff09;数学形式使用场景特点训练状态分析损失下降损失震荡训练损失低但是验证损失高 2. Hinge Loss&#xff08;合页损失&#xff09;数学形式适用场景特点训练状态分析损失趋近于0损失…